12張圖看懂人工智能現狀
每年,斯坦福大學以人為中心的人工智能研究所(HAI) 都會發布其 AI 指數,這是一份試圖總結人工智能現狀的大量數據和圖表匯編。本周出爐的2022 AI 指數一如既往地令人印象深刻,共有 190 頁,涵蓋研發、技術績效、倫理、政策、教育和經濟。我閱讀了報告的每一頁,并挑選了 最具代表性的12 個圖表。
值得注意的是,我從去年的 2021 年指數中報告的許多趨勢仍然存在。例如,我們仍然生活在一個AI 的黃金時代,出版物不斷增加,AI 就業市場仍然是全球性的,企業對 AI 風險的認識與減輕上述風險的嘗試之間仍然存在令人不安的差距。我們不在這里重復這些要點。
下面,我們來開始今年的總結報道:
1. 投資脫鉤
涌入人工智能的資金數額依然令人難以置信。最值得注意的部份來自全球私人投資,這個數字從 2020 年的 460 億美元飆升至 2021 年的 935 億美元。增長來自于大型融資輪次的增加;2020 年有四輪融資超過 5 億美元,2021 年有 15 輪。報告還指出,所有這些資金都流向了更少的公司,因為自 2018 年以來新融資的初創公司數量一直在下降。這是一個偉大的時刻加入一家人工智能初創公司,但也許不是自己找到一家。
2. 美中關系復雜
這些天來,關于中美之間的人工智能競賽 的討論頗多。“當你看到所有關于地緣政治緊張局勢的新聞時,你會認為這兩個國家之間的合作數量會減少,”斯坦福大學 HAI 的政策研究員兼今年 AI Index 的主編Daniel Zhang說。相反,他告訴IEEE Spectrum,“過去 10 年,中美合作一直呈上升趨勢。” 在出版物的跨國合作方面,中國和美國的產出是中國和英國合作的兩倍多。
3. 申請專利和獲得專利是兩件不同的事情
中國專利申請量居世界第一;該報告指出,中國在 2021 年占全球專利申請量的 52%。但美國在授予的專利數量上占主導地位,占全球總數的 40%。張指出,授予專利“證明您的專利實際上是可信和有用的”,并表示這種情況有點類似于出版物和引用的情況。雖然中國在出版物數量、出版物引用和會議出版物方面領先,但美國在會議出版物的引用方面仍然領先,這表明美國研究人員的著名論文仍然具有巨大的影響力。
4. 計算機視覺的高原(Plateau)?
計算機視覺領域發展如此迅速,很難跟上最新的消息。AI 指數顯示,計算機視覺系統非常擅長涉及靜態圖像的任務,例如對象分類和面部識別,并且它們在視頻任務(例如活動分類)方面也越來越出色。
但是一個相對較新的基準顯示了計算機視覺系統可以做的事情的局限性:它們擅長識別事物,而不擅長推理它們所看到的。視覺常識推理挑戰賽于 2018年推出,要求 AI 系統回答有關圖像的問題并解釋其推理。例如,一張圖片顯示人們坐在餐桌旁,而服務員端著盤子走近;測試詢問為什么其中一個坐著的人指向桌子對面的人。該報告指出,近年來性能改進變得越來越微不足道,“這表明可能需要發明新技術來顯著提高性能。”
5.人工智能還沒有為法學院做好準備
自然語言處理 (NLP) 領域比計算機視覺晚了幾年才開始蓬勃發展,但它與計算機視覺的位置有點相似(圖 4)。文本摘要和基本閱讀理解等任務的基準顯示出令人印象深刻的結果,人工智能系統通常超過人類的表現。但是當 NLP 系統必須對他們所讀到的內容進行推理時,他們就會遇到麻煩。
此圖表顯示了由 LSAT 考試中用作法學院入學考試的邏輯推理問題組成的基準測試的表現。雖然 NLP 系統在該基準的一組較簡單的問題上表現良好,但在一組較難的問題上表現最佳的模型的準確率僅為 69%。研究人員從要求 NLP 系統從不完整信息中得出結論的基準測試中得到了類似的結果。推理仍然是人工智能的前沿。
6. 道德無處不在
報告中有一個好消息:從參加ACM 公平、問責和透明度會議(FAccT) 等會議以及NeurIPS的道德相關研討會來判斷,現在人們對 AI 道德有極大的興趣。對于那些還沒有聽說過 FAccT 的人,報告指出,它是最早關注算法社會技術分析的主要會議之一。這張圖表顯示了 FAccT 的行業參與度不斷提高,張認為這是進一步的好消息。“這個領域一直由學術研究人員主導,”他說,“但現在我們看到更多的私營部門參與其中。” 張說,很難猜測這種參與對行業內如何設計和部署人工智能系統意味著什么,但這是一個積極的信號。
7.Detox:如果你不這樣做該死,如果你這樣做該死
AI 的一大倫理問題涉及大型語言模型,例如 OpenAI 的GPT-3,它有一個非常糟糕的習慣,即生成文本,其中充滿了從其訓練數據(互聯網)中學到的每一種偏見和偏見。多個研究小組(包括 OpenAI 本身) 正在研究這個toxic-language 問題,用新的基準來衡量偏見和detoxification計劃。但上圖顯示了通過三種不同的detox方法運行語言模型 GPT-2 的結果。所有這三種方法都損害了模型在一個稱為 perplexity 的指標上的性能(分數越低越好),對涉及非裔美國人對齊的英語和提及少數群體的文本的性能影響最差。正如專家所說,需要更多的研究。
8. 大學正在與 CS 學生一起爬行
人工智能管道從未如此充實。計算研究協會的年度調查收集了來自北美 200 多所大學的數據,其最新數據顯示,2020 年有超過 31,000 名本科生完成了計算機科學學位。這比 2019 年的數字增加了 11.6%。
9. 人工智能需要女性
同一項調查著眼于人工智能領域的新博士,結果令人沮喪。在過去十年中,女性新的 AI 和 CS 博士的百分比僅增加了幾個百分點,至少在北美是這樣。這一點實際上是去年對 2021 年報告的報道的重復,但每個人都應該繼續談論它,直到事情發生變化。
10. 人工智能需要所有種族背景的人
同上這一點。AI Index 在不同的圖表上顯示 AI 和 CS 博士的數據,但它們講述的是同一個故事。早在人們獲得博士學位之前,人工智能領域就需要在多樣性方面做得更好。
11. 立法者正在關注
2021 年,與人工智能相關的法案比以往任何時候都多。在 AI Index 一直關注的 25 個國家中,西班牙、英國和美國處于領先地位,去年分別通過了三項法案。報告還指出,在美國,通過的這三項法案是提出的高達 130 項法案之一。從報告中不清楚這些法案中的大多數是通過公共資金促進人工智能還是制定法規來管理人工智能可能帶來的風險。張說這是一個混合體,并表示 HAI 將在來年發布對全球立法的更詳細分析。
12. 氣候變化
人工智能指數跟蹤美國 55 個公共政策團體發表與人工智能相關的論文,這張圖表顯示了這些團體去年關注的主題。我用這張圖表作為借口來提出人工智能越來越大的能源足跡(訓練大型模型需要大量計算)以及它對氣候變化的潛在影響的話題。政策小組似乎并不認為這些是 2021 年的重要話題。我還問張,AI Index 是否會在明年的報告中討論這些問題,他說他的團隊正在與各個組織討論如何衡量和收集有關計算效率和氣候影響的數據。所以請繼續關注。
https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf