成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Facebook新AI模型SEER實現自監督學習,LeCun大贊最有前途

人工智能
剛剛,Facebook宣布了一個在10億張圖片上訓練的AI模型——SEER,是自監督(Self-supervised)的縮寫。

 [[385451]]

本文轉載自微信公眾號「新智元」,作者新智元。轉載本文請聯系新智元公眾號。

無需標簽,自我分析數據!

Facebook的新AI模型在革計算機視覺的命?

剛剛,Facebook宣布了一個在10億張圖片上訓練的AI模型——SEER,是自監督(Self-supervised)的縮寫。

該模型包含10億個參數,可以在幾乎沒有標簽幫助的情況下識別圖像中的物體,并在一系列計算機視覺基準上取得了先進的結果。

要知道,大多數計算機視覺模型都是從標記的數據集中學習。

而Facebook的最新模型則是通過暴露數據各部分之間的關系從數據中來生成標簽。

這一步被認為對有朝一日實現人類終極智能至關重要。

新AI模型SEER在革計算機視覺的命?

參數一直是機器學習系統的基本組成部分,是從歷史訓練數據中得到的模型的一部分。

人工智能的未來在于是否能夠不依賴于帶注釋的數據集,從給定的任何信息中進行推理。

只要提供文本、圖像或其他類型的數據,AI就能夠完美地識別照片中的物體、解釋文本,或者執行任何要求它執行的其他任務。

Facebook首席科學家Yann LeCun表示,這是構建具有背景知識或「常識」的機器以解決遠遠超出當今AI任務的最有前途的方法之一。

我們已經看到了自然語言處理(NLP)的重大進步。其中,在大量文本上對超大型模型進行自我監督的預訓練在自然語言處理方面取得重大突破。

[[385453]]

現在,Facebook聲稱自家的SEER計算機視覺模型向這個目標邁進了一步。

它可以從互聯網上的任何一組隨機圖像中學習,而不需要進行注釋。

對視覺的自我監督是一項具有挑戰性的任務。

對于文本,語義概念可以被分解成離散的單詞,但是對于圖像,模型必須自己推斷哪個像素屬于哪個概念。

同樣的概念在不同的圖像之間往往會發生變化,這使得問題變得更具挑戰性。因此,要想掌握單個概念的變化,就需要查看大量不同的圖像。

研究人員通過instagram的公開的10億張圖片進行模型訓練

他們發現,讓人工智能系統處理復雜的圖像數據至少需要兩個核心算法:

一是可以從大量隨機圖像中學習,無需任何元數據或注釋的算法;二是卷積神經網絡(ConvNet)足夠大,可以從這些數據中捕捉和學習所有視覺概念。

卷積神經網絡在20世紀80年代首次提出,受到生物學過程的啟發,因為模型中各組成部分之間的連接模式類似于視覺皮層。

SEER:10億張圖,無需標記,自主訓練數據集

SEER模型結合了最近的架構家族「RegNet」和在線自我監督訓練「SwAV」來規模訓練數具有10億參數的數十億張隨機圖像。

科研團隊改編利用了一種新算法,稱為SwAV。它起源于FAIR的研究,后被應用于自我監督學習。

SwAV 使用在線聚類方法來快速分組具有相似視覺概念的圖像,并且能利用圖像的相似性改進自我監督學習的先進水平,而且訓練時間減少了6倍。

這種規模的訓練模型還需要一個在運行時間和內存方面都效率很高的,又不會損失精確性的模型架構。

幸運的是,FAIR 最近在架構設計領域的一項創新催生了一個稱為 RegNets 的新模型家族,它完全符合這些需求。

RegNet 模型能夠擴展到數十億甚至數萬億個參數,可以優化這些參數以適應不同的運行時間和內存限制。

科研團隊對比了SEER在隨機IG圖像上的預訓練和在ImageNET上的預訓練,結果表明非監督特性比監督特性平均提高了2%。

為SEER技術添上最后一塊磚的是VISSL自我監督學習通用庫。

服務于SEER的VISSL是開源的,這個通用圖書館能讓更廣泛的群體可以從圖像中進行自我監督學習實驗。

VISSL是一個基于PyTorch的庫,她允許使用各種現代方法在小規模和大規模上進行自我監督訓練。

VISSL還包含了一個一個廣泛的基準套件和一個包括了60多個預先訓練模型的模型動物園(model zoo),使研究人員可以比較幾個現代自我監督方法。

VISSL通過整合現有的幾種算法,減少了對每個GPU的內存需要,提高了任意一個給定模型的訓練速度,從而實現了大規模的自我監督學習。

SEER的自我監督模型建立在與VISSL相同的核心工具之上,并結合了PyTorch的自定義數據加載器,該加載器的數據吞吐量高于默認值。

自監督學習的未來

Facebook 表示,SEER在預先訓練了10億張公開的instagram圖片后,性能優于最先進的自監督模型。

SEER在目標檢測分析、分割和圖像分類等任務上也取得了最佳結果。

用受歡迎的ImageNet10%的數據集中進行訓練時,SEER仍然達到了77.9%的準確率。

當只有1%的數據集訓練時,SEER的準確率是60.5% 。

接下來,Facebook將發布SEER背后的一些技術,但不會發布算法本身,因為它使用了instagram用戶的數據進行訓練。

麻省理工學院計算知覺和認知實驗室的負責人Aude Oliva表示,這種方法將使我們能夠實踐更多雄心勃勃的視覺識別任務,但是像SEER這樣的尖端人工智能算法的龐大規模和復雜性也帶來了問題。

SEER可能有數十億或數萬億個神經連接或參數,這樣的算法需要大量的計算能力,使可用的芯片供應變得更加緊張。

Facebook的團隊使用了具有32GB RAM的 V100 Nvidia GPU,并且隨著模型尺寸的增加,必須將模型放入可用的RAM中。

[[385456]]

長期以來,自我監督學習一直是 Facebook 人工智能的一個重點,因為它使機器能夠直接從世界上大量可用的信息中學習,而不僅僅是從專門為人工智能研究創建的訓練數據中學習。

自我監督學習對計算機視覺的未來有著難以置信的影響,就像它在其他研究領域所做的那樣。

消除對人工注釋和元數據的需求,使計算機視覺社區能夠處理更大、更多樣化的數據集。

Facebook的研究人員表示,「這一突破可以實現計算機視覺的自監督學習革命。」

參考資料:

https://ai.facebook.com/blog/seer-the-start-of-a-more-powerful-flexible-and-accessible-era-for-computer-vision/

https://venturebeat.com/2021/03/04/facebooks-new-computer-vision-model-achieves-state-of-the-art-performance-by-learning-from-random-images/

 

責任編輯:武曉燕 來源: 新智元
相關推薦

2022-08-17 15:41:08

AI機器學習

2023-06-13 18:45:00

研究監督

2022-07-06 13:06:29

Meta神經網絡架構自監督學習

2022-01-21 15:33:56

架構模型AI

2021-11-08 22:42:51

機器學習監督學習數據

2023-04-26 13:51:57

監督學習論文

2024-10-16 16:00:00

訓練AI

2023-11-23 15:54:01

人工智能監督學習無監督學習

2020-01-20 14:25:19

數據平臺架構

2023-12-20 13:34:56

2022-09-29 23:50:47

人工智能神經網絡平面設計

2022-05-17 16:38:40

數據訓練

2021-05-11 14:26:30

神經網絡數據圖形

2020-04-28 17:26:04

監督學習無監督學習機器學習

2023-12-01 16:27:05

機器學習無監督學習

2017-06-12 14:04:45

深度學習人工智能

2023-04-18 17:23:00

Meta開源

2021-05-06 09:17:05

AI 數據人工智能

2020-04-07 20:12:36

深度學習AI人工智能

2023-11-28 12:12:46

機器學習算法
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产日韩精品视频 | 欧美国产视频 | 欧美二区乱c黑人 | 亚洲一区二区国产 | 精品一区二区三区在线观看国产 | 国产午夜精品一区二区三区嫩草 | 国产又色又爽又黄又免费 | 精品久 | 亚洲精品亚洲人成人网 | 亚洲一区久久 | av资源网站 | 国产 91 视频| 久草视频在线看 | 91毛片在线观看 | 久久人人爽人人爽人人片av免费 | 91久久国产综合久久 | 欧美日韩久久 | 中文字幕在线一区 | 国产黄色大片 | 国产激情视频 | 91精品国产综合久久久动漫日韩 | 一区二区免费在线观看 | 91美女在线| 亚洲欧洲精品成人久久奇米网 | 亚洲网站在线观看 | 国产精品精品久久久 | 青青久久久 | 天天色影视综合 | 四虎影视免费观看 | 亚洲精品久久嫩草网站秘色 | 国产精品美女久久久久aⅴ国产馆 | 亚洲天堂精品久久 | 午夜一区二区三区在线观看 | 综合久久国产 | 日韩av成人在线观看 | 亚洲欧美一区二区三区在线 | 日韩电影中文字幕 | 四色永久| 久久精品国产一区二区电影 | 国产电影一区 | 亚洲高清在线观看 |