我是廣告 請繼續往下閱讀
他指出,這項研究應該是在實驗室環境下產生的,也就是說,在某條件下,固定讓機器長期學習某件事,「為什麼ChatGPT這麼強,就是因為他讀了很多人的資料」,代表AI在識別打字聲時,也需要擷取一定程度的樣本,進行學習與實驗,才有辦法大規模並正式的應用在實際場景上。
每個人的打字習慣與行為不同,快慢節奏與角度皆異,加上在實驗環境下所學習的結果,換到一個開放環境也不見得適用,可能會有相當程度的誤差還需再透過自然語言處理,將錯字進行聯想與校正,「AI做群體分析與學習是一項極為複雜的過程」,技術上並非想像中那樣單純。
不過,AI的技術發展至今,沒有人知道它未來還有什麼做不到的事。陳堅偉卻點出最為關鍵的問題。他說,ChatGPT需要從數十億的文字資料中學習,因此AI識別打字至少也要透過成千上萬,甚至上億人的實驗,才能取得一定的樣本數,「但有這麼多人願意錄音成為樣本之一嗎?」
AI發展以及大數據的應用下,人們愈來愈重視「隱私問題」,「科技在前進,對隱私重視的程度只會跟著往前,不會倒退走」,人們在現今時代下,對於「記錄行為」的排斥,恐是這項科技在數據搜集與資料學習上,最大的障礙。