10億參數的AI模型SEER「一視同仁」:服務富人,也服務全世界
使用經過挑選和標記的數據集對人工智能系統進行訓練,產生了專門的人工智能模型,擅長對象識別等任務。
但是僅僅依靠這種方法也有實際的局限性,其中一個我們認為特別重要: 這樣的系統可能難以識別那些日常生活中很常見,但是在訓練人工智能系統的數據中「沒有被充分代表」的對象。
尤其是,關于訓練哪些圖片以及如何給它們貼標簽的選擇,這可能在不經意間引入「偏見」。
例如,一個主要以「美國和歐洲」家庭圖片為訓練內容的物體識別系統在被要求識別「尼泊爾」一個家中的物體時,可能難以取得同樣好的效果。
這是我們對SEER感到興奮的原因之一,SEER是我們開發的一種新的高性能計算機視覺系統。
通過利用自監督學習,SEER可以從任何數字圖片集中學習,而不需要研究人員來挑選和標記每個對象。
初步評估表明,SEER在識別物體方面比傳統的計算機視覺系統表現更好,這些物體雖然來自數十億人的生活,但在用于訓練人工智能系統的傳統圖片數據集中「體現較少」。
我們希望利用SEER使人工智能更好地為每個人服務,而不僅僅是那些一直以來受益最多的群體。
從全球各地采集圖片「考一考」人工智能
我們在2019年的計算機視覺系統偏差研究中使用了「Dollar Street數據集」,對SEER進行測試。SEER給出的結果令人興奮,自監督學習讓人工智能更好地為世界各地的人服務。
Dollar Street數據集——世界不同國家和地區不同收入的家庭
例如下面這張來自尼泊爾一個家庭的圖,SEER的識別結果是:調料、藥、碗、水果、社交飲酒
監督學習模型的識別結果是:清洗設備、廚房洗滌盆、展示物品、碗、水果、炊具、鍋
所以,SEER正確地識別了圖片中的物體,而傳統的系統則沒有。

圖源:Facebook AI Blog
下面這張圖來自一個中國家庭,SEER的識別結果是:炊具、爐子、鍋、工具
監督學習模型的識別結果是:前門上的鎖、電源開關、炊具、掛鐘、爐灶
所以,SEER 正確地識別出了一個爐子,而傳統的訓練系統卻沒有。
圖源:Facebook AI Blog
下面這張照片顯示了印度的一條小街道。SEER的識別結果是:自行車、街景、垃圾、菜地
監督學習模型的識別結果是:水果樹、家、自行車、寵物、房頂
圖源:Facebook AI Blog
AI為人人
自監督學習在提高語言和方言的性能方面已經顯示出巨大的前景,因為這些語言和方言沒有大量的數字化文本作為標記的訓練數據來使用。
SEER能夠在上述例子中更好地進行物體識別,這是另一個令人興奮的結果,因為該模型是在沒有任何數據整理的情況下在隨機的互聯網圖像上訓練的。
這表明,用于訓練SEER的自監督方法可能會對建立人工智能系統的努力產生巨大影響,這種系統不僅能有效地服務富人,而且能有效地服務整個世界。這些努力只是開始,但很明顯,我們正在一條非常令人興奮的進步之路上。