成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

自監督學習簡介以及在三大領域中現狀

人工智能 機器學習
機器學習大致分為監督、無監督、半監督和強化學習問題。機器學習通過解決監督學習問題獲得了大部分成功。監督學習通過學習任務中被標記的數據,為最先進的模型提供了更多的性能提升機會。

近幾年,通過監督學習進行的深度學習也取得了巨大的成功。從圖像分類到語言翻譯,它們的性能一直在提高。然而在一些領域(例如罕見疾病的醫療數據集)中,收集大型標記數據集是昂貴且不可能的。這些類型的數據集為自監督算法提供了充足的機會,以進一步提高預測模型的性能。

[[433960]]

自監督學習旨在從未標記的數據中學習信息表示。在這種情況下,標記數據集比未標記數據集相對小。自監督學習使用這些未標記的數據并執行前置任務(pretext tasks )和對比學習。

Jeremey Howard 在一篇關于自監督學習的優秀文章中將監督學習定義為兩個階段:“我們用于預訓練的任務被稱為前置任務。我們隨后用于微調的任務稱為下游任務”。自監督學習的例子包括未來詞預測、掩碼詞預測修復、著色和超分辨率。

 

自監督學習簡介以及在三大領域中現狀

 

計算機視覺的自監督學習

自監督學習方法依賴于數據的空間和語義結構。 對于圖像,空間結構學習是極其重要的。 包括旋轉、拼接和著色在內的不同技術被用作從圖像中學習表征的前置任務。 對于著色,將灰度照片作為輸入并生成照片的彩色版本。 zhang等人的論文[1] 解釋了產生生動逼真的著色的著色過程。

 

自監督學習簡介以及在三大領域中現狀

 

另一種廣泛用于計算機視覺自監督學習的方法是放置圖像塊。 一個例子包括 Doersch 等人的論文 [2]。 在這項工作中,提供了一個大型未標記的圖像數據集,并從中提取了隨機的圖像塊對。 在初始步驟之后,卷積神經網絡預測第二個圖像塊相對于第一個圖像塊的位置。 圖 2 說明了該過程。

 

自監督學習簡介以及在三大領域中現狀

 

還有其他不同的方法用于自監督學習,包括修復和判斷分類錯誤的圖像。 如果對此主題感興趣,請查看參考文獻 [3]。 它提供了有關上述主題的文獻綜述。

自然語言處理的自監督學習

在自然語言處理任務中,自監督學習方法是最常見的。Word2Vec論文中的“連續詞袋”方法是自監督學習最著名的例子。

類似地,還有其他不同的用于自監督學習的方法,包括相鄰詞預測、相鄰句子預測、自回歸語言建模和掩碼語言建模。 掩碼語言建模公式已在 BERT、RoBERTa 和 ALBERT 論文中使用。

文本自監督學習的最新例子包括 Zhang 等人的論文 [4]。 作者提出了一種間隔句生成機制。 該機制用于總結摘要的下游任務。

 

自監督學習簡介以及在三大領域中現狀

 

表格數據的自監督學習

對圖像和文本的自監督學習一直在進步。但現有的自監督方法對表格數據無效。表格數據沒有空間關系或語義結構,因此現有的依賴空間和語義結構的技術是沒有用的。

大多數表格數據都涉及分類特征,而這些特征不具有有意義的凸組合。即使對于連續變量,也不能保證數據流形是凸的。但是這一挑戰為研究人員提供了一個新的研究方向。我將簡要說明在這方面所做的一些工作。

Vincent 等人所做的工作 [5] 提出了一種去噪自動編碼器的機制。前置任務是從損壞的樣本中恢復原始樣本。在另一篇論文中,Pathak 等人 [6] 提出了一種上下文編碼器,從損壞的樣本和掩碼向量中重建原始樣本。

Tabnet [7] 和 TaBERT [8] 的研究也是朝著自監督學習的漸進式工作。在這兩項研究中,前置任務是恢復損壞的表格數據。 TabNet 專注于注意力機制,并在每一步選擇特征進行推理,TABERT 則是學習自然語言句子和半結構化表格的表示。

 

自監督學習簡介以及在三大領域中現狀

 

最近的一項工作 (VIME) [9] 提出了一種新的前置任務,可以使用一種新的損壞樣本生成技術來恢復掩碼向量和原始樣本。 作者還提出了一種新的表格數據增強機制,可以結合對比學習來擴展表格數據的監督學習。 這里的輸入樣本是從未標記的數據集生成的”。

 

自監督學習簡介以及在三大領域中現狀

 

總結

自監督學習是深度學習的新常態。 圖像和文本數據的自監督學習技術令人驚嘆,因為它們分別依賴于空間和順序相關性。 但是,表格數據中沒有通用的相關結構。 這使得表格數據的自監督學習更具挑戰性。

責任編輯:華軒 來源: 今日頭條
相關推薦

2015-01-19 13:23:07

IaaSPaaSSaaS

2023-11-23 15:54:01

人工智能監督學習無監督學習

2022-05-17 16:38:40

數據訓練

2021-03-18 09:28:20

人工智能機器學習技術

2020-04-28 17:26:04

監督學習無監督學習機器學習

2021-09-01 16:05:19

數據挖掘模型人工智能

2022-08-17 15:41:08

AI機器學習

2021-03-05 12:58:31

AISEER模型

2023-12-01 16:27:05

機器學習無監督學習

2017-06-12 14:04:45

深度學習人工智能

2016-11-08 18:00:44

機器學習

2023-11-28 12:12:46

機器學習算法

2022-11-23 13:36:38

模型研究

2010-08-12 22:27:24

IT網絡

2020-08-16 11:34:43

人工智能機器學習技術

2020-08-14 11:00:44

機器學習人工智能機器人

2015-10-12 10:37:42

學習算法檢測

2019-10-14 10:40:03

機器學習人工智能非監督學習

2022-11-29 15:38:01

學習框架編碼器數據

2020-01-20 14:25:19

數據平臺架構
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品一区二区三区久久久 | 国产精品成人一区二区三区 | 国产午夜视频 | 国产视频一二三区 | 久久免费高清视频 | 日韩精品一区二区三区 | 国产精品亚洲一区二区三区在线 | 欧美激情久久久 | 草久网| 在线日韩av电影 | 中文字幕高清视频 | 国产精品视频播放 | 精品中文字幕在线观看 | 亚洲成人综合在线 | 午夜精品久久久久久久久久久久久 | 日韩一二三区 | 91精品国产91久久综合桃花 | 亚洲日本国产 | 午夜影院在线观看版 | 欧美不卡一区二区 | 黄色一级免费 | 伊人一区 | 国产精品99久久久久久动医院 | a级在线免费视频 | 亚洲欧洲精品在线 | 懂色一区二区三区免费观看 | 欧美成人一区二区 | 成人精品 | 亚洲日本一区二区 | 欧美一区二区三区视频 | 91久久精品日日躁夜夜躁国产 | 超碰在线人人 | 婷婷精品 | 免费看黄色小视频 | 黄色一级免费 | 亚洲精品一区在线观看 | 成人精品一区二区三区四区 | wwww.8888久久爱站网 | 久久久久久久一级 | 日韩h| 古装人性做爰av网站 |