成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

淺析半監(jiān)督學(xué)習(xí)及其應(yīng)用場(chǎng)景

人工智能
如何有效利用當(dāng)前有標(biāo)記樣本的數(shù)據(jù)成為關(guān)鍵,而半監(jiān)督學(xué)習(xí)則是應(yīng)對(duì)有標(biāo)簽的樣本數(shù)量遠(yuǎn)小于無(wú)標(biāo)簽樣本的情況。

Labs 導(dǎo)讀

隨著互聯(lián)網(wǎng)的發(fā)展,企業(yè)可以獲得越來(lái)越多的數(shù)據(jù),這些數(shù)據(jù)可以用于幫助企業(yè)更好的了解用戶,即客戶畫(huà)像,也可以用來(lái)改善用戶的體驗(yàn)。但這些數(shù)據(jù)中可能存在大量沒(méi)有標(biāo)記的數(shù)據(jù)。如果所有數(shù)據(jù)均采用人工標(biāo)記的方式則存在兩方面的缺點(diǎn),一是花費(fèi)的時(shí)間成本較高,人工標(biāo)記效率低,數(shù)據(jù)量越大需要雇傭的人越多,時(shí)間也會(huì)越長(zhǎng),成本越高,二是隨著用戶規(guī)模的增大,人工標(biāo)記的速度很難趕上數(shù)據(jù)的增長(zhǎng)。

Part 01、  什么是半監(jiān)督學(xué)習(xí)  

半監(jiān)督學(xué)習(xí)是指使用既有有標(biāo)簽的數(shù)據(jù)又有無(wú)標(biāo)簽的數(shù)據(jù)訓(xùn)練模型。半監(jiān)督學(xué)習(xí)通常會(huì)基于有標(biāo)簽的數(shù)據(jù)構(gòu)建屬性空間,再?gòu)臒o(wú)標(biāo)簽的數(shù)據(jù)中提取有效信息填充(或重構(gòu))屬性空間。因此,通常半監(jiān)督學(xué)習(xí)的初始訓(xùn)練集會(huì)劃分為有標(biāo)簽的數(shù)據(jù)集D1和無(wú)標(biāo)簽數(shù)據(jù)集D2,然后通過(guò)預(yù)處理、特征提取等基本步驟后訓(xùn)練半監(jiān)督學(xué)習(xí)模型,然后將訓(xùn)練好的模型用于生產(chǎn)環(huán)境,為用戶提供服務(wù)。

圖1 半監(jiān)督學(xué)習(xí)訓(xùn)練過(guò)程

Part 02、半監(jiān)督學(xué)習(xí)的假設(shè) 

為了實(shí)現(xiàn)標(biāo)簽數(shù)據(jù)有效補(bǔ)充有標(biāo)簽數(shù)據(jù)中的“有用”信息,對(duì)數(shù)據(jù)分部等方面做出一些假設(shè)。半監(jiān)督學(xué)習(xí)的基礎(chǔ)假設(shè)是p(x)中包含p(y|x)的信息,即無(wú)標(biāo)簽的數(shù)據(jù)應(yīng)該包含對(duì)于標(biāo)簽預(yù)測(cè)有用的且與有標(biāo)簽的數(shù)據(jù)不相同的或者很難從有標(biāo)簽的數(shù)據(jù)中提取出來(lái)的信息。此外,還存在一些服務(wù)于算法的假設(shè)。例如,相似性假設(shè)(平滑假設(shè))是指在數(shù)據(jù)樣本構(gòu)建的屬性空間中,相近或相似的樣本具有相同的標(biāo)簽;低密度分離假設(shè)是指在數(shù)據(jù)樣本少的地方存在一個(gè)決策邊界能區(qū)分不同標(biāo)簽的數(shù)據(jù)。

以上假設(shè)主要目的是為了表明有標(biāo)簽的數(shù)據(jù)與無(wú)標(biāo)簽的數(shù)據(jù)來(lái)源于相同的數(shù)據(jù)分布。

Part 03、  半監(jiān)督學(xué)習(xí)算法分類(lèi) 

半監(jiān)督學(xué)習(xí)算法眾多,可大致分為直推式學(xué)習(xí)(transductive learning) 歸納式學(xué)習(xí)(Inductive model),二者區(qū)別在于用于模型評(píng)估的測(cè)試數(shù)據(jù)集的選擇。直推式的半監(jiān)督學(xué)習(xí)是指需要預(yù)測(cè)標(biāo)簽的數(shù)據(jù)集就是用于訓(xùn)練的無(wú)標(biāo)簽數(shù)據(jù)集,學(xué)習(xí)的目的是為了進(jìn)一步提高預(yù)測(cè)結(jié)果的準(zhǔn)確性。歸納式學(xué)習(xí)則是為完全未知的數(shù)據(jù)集預(yù)測(cè)標(biāo)簽。

圖2 半監(jiān)督學(xué)習(xí)算法分類(lèi)

此外,常見(jiàn)的半監(jiān)督學(xué)習(xí)算法的步驟為:第一步會(huì)在有標(biāo)簽的數(shù)據(jù)上訓(xùn)練模型,然后用這個(gè)模型給無(wú)標(biāo)簽的數(shù)據(jù)打上偽標(biāo)簽,然后將偽標(biāo)簽和有標(biāo)簽的數(shù)據(jù)組合成新的訓(xùn)練集,在這個(gè)訓(xùn)練集上訓(xùn)練一個(gè)新的模型,最后用這個(gè)模型給預(yù)測(cè)數(shù)據(jù)集打上標(biāo)簽。

Part 04、  總結(jié) 

半監(jiān)督學(xué)習(xí)的最大的問(wèn)題是在很多情況下,模型的性能依賴于有標(biāo)簽的數(shù)據(jù)集,并且對(duì)于有標(biāo)簽數(shù)據(jù)集的質(zhì)量要求較高,甚至半監(jiān)督學(xué)習(xí)模型預(yù)測(cè)準(zhǔn)確度與基于有標(biāo)簽數(shù)據(jù)集的有監(jiān)督模型的結(jié)果相差不大,反而半監(jiān)督模型為了有效提取無(wú)標(biāo)簽數(shù)據(jù)中的有效信息,會(huì)消耗更多的資源。因此,半監(jiān)督學(xué)習(xí)的發(fā)展方向是提高算法的魯棒性以及數(shù)據(jù)提取的有效性。

目前半監(jiān)督學(xué)習(xí)領(lǐng)域中比較熱門(mén)的是PU-Learning(positive-unlabeled learning),這類(lèi)算法的主要應(yīng)用場(chǎng)景是只有正和無(wú)標(biāo)簽數(shù)據(jù)的數(shù)據(jù)集。其優(yōu)點(diǎn)是在一些場(chǎng)景下,我們?nèi)菀撰@得比較可靠的正標(biāo)簽數(shù)據(jù)集,并且數(shù)據(jù)量相對(duì)較大。例如,垃圾郵件檢測(cè)中很容易獲得正常郵件。

責(zé)任編輯:龐桂玉 來(lái)源: 移動(dòng)Labs
相關(guān)推薦

2022-05-17 16:38:40

數(shù)據(jù)訓(xùn)練

2017-06-12 14:04:45

深度學(xué)習(xí)人工智能

2024-08-16 08:15:02

2023-11-23 15:54:01

人工智能監(jiān)督學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)

2021-06-04 15:45:43

XR虛擬現(xiàn)實(shí)虛擬經(jīng)濟(jì)

2020-04-28 17:26:04

監(jiān)督學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)

2023-02-01 13:29:46

機(jī)器學(xué)習(xí)

2020-08-14 11:00:44

機(jī)器學(xué)習(xí)人工智能機(jī)器人

2020-08-16 11:34:43

人工智能機(jī)器學(xué)習(xí)技術(shù)

2015-10-12 10:37:42

學(xué)習(xí)算法檢測(cè)

2019-10-14 10:40:03

機(jī)器學(xué)習(xí)人工智能非監(jiān)督學(xué)習(xí)

2022-06-27 14:53:18

監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)人工智能

2022-05-13 16:33:42

元宇宙應(yīng)用場(chǎng)景技術(shù)

2011-05-17 15:24:18

Shibboleth認(rèn)證

2011-05-19 10:53:17

SQL Azure

2017-11-24 10:43:43

Madlib機(jī)器學(xué)習(xí)

2022-07-17 15:46:24

機(jī)器學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)算法

2022-02-15 09:04:44

機(jī)器學(xué)習(xí)人工智能監(jiān)督學(xué)習(xí)

2022-06-14 07:07:57

網(wǎng)絡(luò)威脅無(wú)監(jiān)督數(shù)據(jù)泄露

2023-12-01 16:27:05

機(jī)器學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 在线看av的网址 | 亚洲一区二区 | 国产精品中文字幕一区二区三区 | 久久久久久久久久久久久九 | 久久国产激情视频 | 国产精品久久久久久 | 久久久久久av | 麻豆毛片 | 天天激情综合 | 中文字幕在线不卡 | 超碰97人人人人人蜜桃 | 在线看国产 | av色站| 操操日| 国产精品毛片无码 | 日韩成人国产 | 最新国产在线 | 国产精品乱码一区二区三区 | 免费在线观看成年人视频 | 精品毛片视频 | 国产免国产免费 | 国产在线中文字幕 | 91精品国产91久久久久久最新 | 涩色视频在线观看 | 亚洲精品视频久久 | a在线免费观看 | 国产成人在线免费 | 成人精品一区二区三区中文字幕 | 日韩激情在线 | 国产一伦一伦一伦 | 毛片在线免费 | 日韩中文字幕第一页 | 亚洲一区二区电影网 | 欧美精品一区二区三区在线播放 | 久久在线 | 国产精品一区二区三区四区 | 国产精品18久久久久久久 | 久久久久国产一级毛片 | 午夜久久久| 一区二区视频在线 | 精品一区二区三区中文字幕 |