編譯丨諾亞
出品 | 51CTO技術棧(微信號:blog51cto)
近日,人工智能界三位大佬聚首了!
一位是最近“跳槽”微軟的Inflection AI 聯合創始人 Mustafa Suleyman、一位是Cohere的聯合創始人兼首席執行官Aidan Gomez,還有一位是Meta的首席AI科學家Yann LeCun。
在探討人工智能領域最重大的突破時,三人在一系列與世界經濟論壇的訪談中分享了他們的洞察。他們一致認為,生成式AI和大型語言模型(LLM)所帶來的變革將是深刻的社會影響源,特別是在提高醫療保健行業的生產效率方面。
他們還提出了對未來的前瞻性預測,其中提到經典的圖靈測試可能需要適應性地修訂,以便更好地反映出當前AI技術不斷提升的能力水平。他們預計,在接下來的十年里,人工智能將會以前所未有的方式改變全球經濟結構和社會運作模式,帶來新一輪的重大創新與發展。
“這將成為我們一生中最具變革性的時刻,不僅體現在科技領域,更會深深觸及文化和政治層面?!?/p>
這是Mustafa Suleyman在世界經濟論壇“達沃斯之聲”播客節目中談到人工智能影響時所說的話。身處生成式人工智能和大模型開發與應用的前沿,Suleyman親身見證了這一技術的變革力量,并深入理解未來面臨的諸多挑戰。
這種觀點得到了另外兩位大咖的共鳴。他們三人同樣入選《時代》雜志評選的AI領域最具影響力百人榜單。
在編輯后的訪談中,這三位專家分享了他們敏銳意識到人工智能真正潛力的時刻,并就這一工具未來發展路線圖發表了自己的見解。
1.從虛構日本朋克樂隊到變革醫療保健行業
大多數人在初次接觸大型語言模型工具時——多數情況下是在2023年初首次使用ChatGPT時——他們的第一個實驗性提示往往是些無傷大雅的小玩笑。可能是一個請求創作一首幽默的童謠或是新穎雞尾酒配方的要求。
對于Aidan Gomez來說,這個初體驗并無二致。作為突破性論文《 Attention Is All You Need》的共同作者,Gomez在20歲時作為Google Brain的實習生參與撰寫了這篇論文,對AI產業產生了深遠影響,并間接助力了ChatGPT的誕生。
“我收到了來自我的合作者、也是transformer 論文的共同作者Lukasz Kaiser的一封郵件,郵件里說,‘你看這個。’”這段經歷標志著Gomez在探索新模型可能性的道路上邁出了第一步。
Kaiser 向 Gomez 展示了他是如何用標題“Transformer”引導該技術,然后它返回了一篇詳細記錄一支日本朋克搖滾樂隊歷史的創意小說?!澳且豢谭浅3F實,機器能如此流利地表達,以至于讓我誤以為自己正在閱讀一篇關于日本朋克搖滾樂隊的文章。這就是大型語言模型的頓悟時刻?!?/p>
展望未來,Gomez 最為期待的是生成式人工智能能在多個職業領域,尤其是醫療保健領域帶來的生產力大幅提升。
“據估計,醫生大約要花費其工作時間的40%來撰寫病歷記錄,如果我們能通過AI技術把這部分時間節省下來,讓他們能將更多的時間用于與患者交流,專注于改善患者治療效果,那么實際上相當于一夜之間讓醫生人數翻倍?!?/p>
根據德勤受MedTech Europe委托發布的一份報告,AI應用每年可以為歐洲醫療系統節省約18億小時的工作時間,這相當于額外增加了50萬個全職醫療專業人員的服務能力。
2.更新圖靈測試的需求
圖靈測試——由英國數學家和計算機科學家艾倫·圖靈在1950年提出的概念——可能需要重新審視。這是一個長期以來用來衡量機器是否具備與人類相當的智能行為的標準測試。然而,當Mustafa Suleyman真正意識到生成式AI的力量時,連這個測試本身需要修訂的想法也隨之產生。
他表示:“現代版的圖靈測試應該是評估一個AI能否像企業家那樣行動,如同一個微型項目管理者和新產品的發明者,能夠去推廣產品、組織生產、銷售,并最終實現盈利等系列過程?!?/p>
Suleyman相信,在接下來的十年內,生成式AI將在低成本、甚至可能是開源級別上完成這樣的任務,這一進步將會徹底改變經濟格局。
他解釋說:“這將成為我們一生中最具變革性的時刻,不僅是在技術層面,更是在文化與政治層面上的變革。我們將見證力量成本的急劇下降?!?/p>
3.AI需要與物理世界交互才能充分實現價值
Meta公司首席AI科學家及紐約大學教授Yann LeCun,這位因直言不諱地反對圍繞AI的過度炒作而聞名的專家解釋道:“我們大腦中的大部分知識實際上都來自于與物理世界的互動?!?/p>
LeCun認為,像文本、視頻、音樂和圖像創作這類生成式AI工具所產出的短期成果具有增強人類創造力和提高效率的能力。然而,要使AI完全發揮潛力,就必須使其能夠與物理世界進行互動。只有當AI能夠處理并理解物理環境中的復雜問題,并參與到實際操作之中,它才能真正意義上被全面實現。
然而,下一階段的發展將是讓AI不僅基于訓練當前大模型所使用的互聯網上10萬億個單詞進行學習,還要基于其與物理世界的互動進行教學。
“那是一個難以想象的巨大信息量,因為僅閱讀這些信息就需要你我大約15萬至20萬年的時間,所以它的規模之大令人難以估量?!彼f。
但他接著指出,到一個孩子四歲時,其視覺皮層接收到的信息量比我們目前最大的預訓練語言模型接觸到的文字信息多出約15倍。這意味著通過視覺方式,孩子在其成長過程中看到的信息遠超過網絡文本所能提供的信息總量。
LeCun表示,這種融入現實生活中的海量數據遠大于文本所能包含的,而且科學家和工程師至今尚未找到如何在機器中模擬這一過程的方法。
因此,盡管我們現在距離擁有真正智能系統的道路還很遙遠,但有理由期待在未來我們會擁有它們。屆時,人們會每天與這些智能系統進行互動,它們或許會被集成到智能眼鏡等設備中,而人們與數字世界的接口將會是一個AI系統。
參考鏈接:
https://www.weforum.org/agenda/2024/03/ai-pioneers-breakthroughs-whats-next