AI學術算命?Gemini 2.0預測谷歌AI大佬職業生涯,準到離譜!
如果讓人工智能來點評博士論文,還順手預測一下作者將來的職業發展。會是什么樣子?
最近,谷歌首席科學家、Gemini負責人Jeff Dean就玩了這么一出,他把自己的博士論文交給了最新的Gemini 2.0。
結果,這位AI「批評家」只花了26秒,就給出了一份相當深刻的剖析報告。
Jeff Dean用最新的Gemini 2.0 Flash Thinking Experimental 01-21分析了自己的博士論文《面向對象語言的完整程序優化》——一篇長達134,540個Token的大作。
他給Gemini的提示詞非常簡潔,就一句:「Please analyze this PhD thesis and give me a concise critique of things that could be improved」。(請分析這份博士論文,并就其可以改進之處給出一個簡明的評價)
結果,Gemini在短短26秒內「火力全開」,給出了論文不足和改進之處的精準點評。
緊接著,DeepMind高級研究科學家Yi Tay也跟風測試,將自己長達205K個Token的博士論文《用于自然語言理解的神經架構》丟給了Gemini。
得到的評價同樣「刀刀見血」,連論文作者本人都承認點評得確實到位。
兩位大佬的論文在Gemini眼里,都「問題」不少。
Jeff Dean的論文被指出「需要更多理論基礎」、「存在擴展性問題」以及「離線分析數據不穩定」,甚至連簡歷里一句「可樂癮還挺大的,是吧?」都被AI捕捉到,并調侃了一番。
而Yi Tay的論文則被吐槽「幾乎沒有理論貢獻」、「整體敘事結構松散」、「對模型效率的定義也不夠嚴謹」,以及「缺乏深入分析,就知道搞基準測試」。
這評價,比他的博士導師還要「毒舌」。
就連Yi Tay自己也承認,Gemini的評價「確實如此,比我的博士導師靠譜多了」。
更令人驚奇的是,Gemini不僅能點評論文,還能「預測」職業規劃。
基于Jeff Dean的論文,Gemini推斷他「最有可能且成功的路徑」是進入行業研究實驗室(例如,谷歌研究、微軟研究、IBM 研究),或者成為大型科技公司(例如,谷歌、Facebook、亞馬遜)的軟件工程領導/技術專家。
事實呢?
Jeff Dean的職業軌跡完美契合了Gemini的預測,他早期加入谷歌,并成為那里最有影響力的工程師之一,為MapReduce、BigTable和TensorFlow等基礎技術做出了貢獻。
無獨有偶,谷歌DeepMind研究副總裁及深度學習負責人、Gemini聯合負責人Oriol Vinyals也讓Gemini預測了他的職業發展,結果也相當準確。
那么問題來了,Gemini的精準預測究竟是巧合,還是AI的又一次進化?難道AI真的能成為學術界的「算命先生」,替學術界的年輕人指點迷津?
Gemini的深度解析能力與預判
Gemini的表現并不是簡單用關鍵詞匹配或模板套用就能解釋得通的。它的背后,是強大的深度解析能力和對自然語言的深入理解。
以其最新版本2.0 Flash為例,它建立在1.5 Flash的成功之上,是開發人員迄今為止最受歡迎的模型,以同樣快的響應時間的同時增強了性能。
值得注意的是,在關鍵的基準測試中,2.0 Flash甚至優于1.5 Pro,而速度卻是后者的兩倍。
2.0 Flash還具有新功能。除了支持圖像、視頻和音頻等多模態輸入外,2.0 Flash現在還支持多模態輸出,如原生生成的圖像與文本和可控文本到語音(TTS)多語言音頻混合。
它還可以本地調用工具,如谷歌搜索、代碼執行以及第三方用戶定義的函數。
Gemini的洞察力體現在哪里
在Jeff Dean的案例里,Gemini的表現讓人感覺它像個能洞悉一切的高手。
它先是非常犀利地指出論文里一些難以察覺的弱點,比如理論基礎不牢、擴展性有瓶頸、離線分析數據也不夠穩定。就連那些資歷深厚的研究者,有時都會忽略這些細節。
接著,Gemini還給了一個思路——可以考慮混合鏈接時間和全程序編譯的方式,這讓Jeff Dean后續的研究方向更清晰。
更有意思的是,Gemini能讀懂作者在簡歷里那些看似隨意的口吻,還忍不住調侃了幾句,這種精準捕捉語言細節的能力,展現出它對自然語言的深刻理解。
整體看下來,Gemini的這種「火眼金睛」確實讓人驚嘆。
Yi Tay:Gemini的評價非常準確
Yi Tay的論文里動手能力超強,各種實驗做得飛起,數據也是一大堆。但是有點光顧著展示酷炫的技巧,卻忘了講背后的原理。
這在深度學習剛興起那會兒,也算是正常,畢竟那時大家都忙著「搭房子」,還沒空好好研究「地基」。
再說說論文的排版。Yi Tay這篇論文,是把好幾篇小論文拼湊在一起的,就像是用不同的積木搭了個城堡,雖然看起來也挺像那么回事,但仔細一看,連接的地方還是有點生硬,不夠流暢。
Gemini一眼就看出了這個問題,真是「火眼金睛」。
最后,不得不提的是「基準測試」。
當時,大家都很熱衷于刷紀錄,就像游戲里沖排行榜一樣。研究者們喜歡在各種測試集上比拼分數,分數高誰就厲害,反而忽略了模型本身的內在邏輯和原理。
Gemini毫不客氣地吐槽了當時學術圈的這個怪現象!
AI預測:巧合還是趨勢
Jeff Dean和 Oriol Vinyals的現實職業軌跡都驗證了Gemini的預測,這無疑增強了其預測的可信度。
再結合Gemini對Yi Tay等其他研究者論文的準確評價,可以認為,Gemini的預測并非簡單的巧合,而是基于對學術研究和行業趨勢的深刻理解。
Gemini能精準捕捉研究者的學術風格和潛在缺陷,離不開對海量學術論文的訓練。
職業預測時,Gemini會從論文中挖掘作者的硬技能和軟技能,并結合學術界和工業界的熱門領域,比如高并發性能調優、大規模語言模型研發、跨模態深度學習等,評估作者與這些方向之間可能發生的化學反應。
它對各大科技巨頭的研究動向相當熟悉,哪些團隊在鉆研編譯器與程序優化,哪些團隊專注于大模型,一清二楚,所以能夠更準確地推測作者在哪個方向或崗位會大放異彩。
不過,AI的預測固然強大,卻并不意味著它無所不能。
個人的興趣、價值觀和人生目標,往往帶有高度的主觀性,AI很難全面掌握。
人生里還有各種機遇和挑戰,時不時冒出來的偶然事件,也超出AI的范圍。
Gemini是「馬后炮」嗎?
不過,很快就有網友質疑Gemini是否提前知道Jeff Dean的職業生涯,所以才給出如此準確的預測,認為這是一種「劇透」或「馬后炮」。
確實,作為AI大佬,Jeff Dean的信息在互聯網上遍地都是,Gemini從中獲得這些信息并不奇怪。
但就算如此,能把他的論文內容跟后來的職業道路對應起來,也說明它有一套「讀懂」和「聯想」的本事。
況且,Gemini對Oriol Vinyals和Yi Tay等人的分析同樣精準,也說明并不僅僅是「馬后炮」。
AI與學術的未來
Gemini的出現,為學術界帶來了無限的想象空間??梢灶A見,Gemini將成為科研人員的得力助手,極大地提高科研效率,輔助學術創新。
文獻綜述可以交給它,在海量論文里檢索、歸類并提供初步解讀,讓研究者更快獲取新鮮信息。實驗設計也能借它的力量,根據研究目標和已有文獻來制定更科學的實驗方案和評估指標。
論文的潤色與審校更是不在話下,從語法到邏輯結構,隨時提供修改建議,就像一個隨叫隨到的「科研小秘書」。
面對不斷升級的AI工具,我們應當思考:除了「點評論文」與「預測職業」,AI是否還能為學術研究帶來更深層次的革新?
有人把它當成萬能搜索引擎或寫作機器,「拿來主義」似乎一勞永逸。事實上,真正優秀的學術工作者應該在使用這些工具時保持清醒,批判性思維和獨立創新一直都是科研的靈魂。
離開了人類學者的洞察與創造,AI 再強也只能在已有知識的范疇里打轉。真正的前沿、那些從未踏足的「未知之地」,依舊需要人類去開拓。