成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

超好用的自信學(xué)習(xí):1行代碼查找標(biāo)簽錯(cuò)誤,3行代碼學(xué)習(xí)噪聲標(biāo)簽

新聞 人工智能
最近,MIT和谷歌的研究人員便提出了一種廣義的自信學(xué)習(xí)(Confident Learning,CL)方法,可以直接估計(jì)給定標(biāo)簽和未知標(biāo)簽之間的聯(lián)合分布。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

你知道嗎?就連ImageNet中也可能至少存在10萬個(gè)標(biāo)簽問題。

在大量的數(shù)據(jù)集中去描述或查找標(biāo)簽錯(cuò)誤本身就是挑戰(zhàn)性超高的任務(wù),多少英雄豪杰為之頭痛不已。

最近,MIT和谷歌的研究人員便提出了一種廣義的自信學(xué)習(xí)(Confident Learning,CL)方法,可以直接估計(jì)給定標(biāo)簽和未知標(biāo)簽之間的聯(lián)合分布。

這種廣義的CL,也是一個(gè)開源的Clean Lab Python包,在ImageNet和CIFAR上的性能比其他前沿技術(shù)高出30%。

這種方法有多厲害?舉個(gè)栗子。

超好用的自信學(xué)習(xí):1行代碼查找標(biāo)簽錯(cuò)誤,3行代碼學(xué)習(xí)噪聲標(biāo)簽

上圖是2012年ILSVRC ImageNet訓(xùn)練集中使用自信學(xué)習(xí)發(fā)現(xiàn)的標(biāo)簽錯(cuò)誤示例。研究人員將CL發(fā)現(xiàn)的問題分為三類:

1、藍(lán)色:圖像中有多個(gè)標(biāo)簽;
2、綠色:數(shù)據(jù)集中應(yīng)該包含一個(gè)類;
3、紅色:標(biāo)簽錯(cuò)誤。

通過自信學(xué)習(xí),就可以在任何數(shù)據(jù)集中使用合適的模型來發(fā)現(xiàn)標(biāo)簽錯(cuò)誤。下圖是其他三個(gè)常見數(shù)據(jù)集中的例子。

超好用的自信學(xué)習(xí):1行代碼查找標(biāo)簽錯(cuò)誤,3行代碼學(xué)習(xí)噪聲標(biāo)簽

目前存在于Amazon Reviews、MNIST和Quickdraw數(shù)據(jù)集中的標(biāo)簽錯(cuò)誤的例子,這些數(shù)據(jù)集使用自信學(xué)習(xí)來識別不同的數(shù)據(jù)模式和模型。

這么好的方法,還不速來嘗鮮?

什么是自信學(xué)習(xí)?

自信學(xué)習(xí)已然成為監(jiān)督學(xué)習(xí)的一個(gè)子領(lǐng)域。

超好用的自信學(xué)習(xí):1行代碼查找標(biāo)簽錯(cuò)誤,3行代碼學(xué)習(xí)噪聲標(biāo)簽

從上圖不難看出,CL需要2個(gè)輸入:

1、樣本外預(yù)測概率;
2、噪聲標(biāo)簽;

對于弱監(jiān)督而言,CL包括三個(gè)步驟:

1、估計(jì)給定的、有噪聲的標(biāo)簽和潛在的(未知的)未損壞標(biāo)簽的聯(lián)合分布,這樣就可以充分描述類條件標(biāo)簽噪聲;
2、查找并刪除帶有標(biāo)簽問題的噪聲(noisy)示例;
3、進(jìn)行消除錯(cuò)誤的訓(xùn)練,然后根據(jù)估計(jì)的潛在先驗(yàn)重新加權(quán)示例。

那么CL的工作原理又是什么呢?

我們假設(shè)有一個(gè)數(shù)據(jù)集包含狗、狐貍和奶牛的圖像。CL的工作原理就是估計(jì)噪聲標(biāo)簽和真實(shí)標(biāo)簽的聯(lián)合分布(下圖中右側(cè)的Q矩陣)。

超好用的自信學(xué)習(xí):1行代碼查找標(biāo)簽錯(cuò)誤,3行代碼學(xué)習(xí)噪聲標(biāo)簽

左:自信計(jì)數(shù)的示例;右:三類數(shù)據(jù)集的噪聲標(biāo)簽和真實(shí)標(biāo)簽的聯(lián)合分布示例。

接下來,CL計(jì)數(shù)了100張被標(biāo)記為“狗”的圖像,這些圖像就很可能是“狗”類(class dog),如上圖左側(cè)的C矩陣所示。

CL還計(jì)數(shù)了56張標(biāo)記為狗,但高概率屬于狐貍的圖像,以及32張標(biāo)記為狗,但高概率屬于奶牛的圖像。

而后的中心思想就是,當(dāng)一個(gè)樣本的預(yù)測概率大于每個(gè)類的閾值時(shí),我們就可以自信地認(rèn)為這個(gè)樣本是屬于這個(gè)閾值的類。

此外,每個(gè)類的閾值是該類中樣本的平均預(yù)測概率。

輕松上手Clean Lab

剛才也提到,本文所說的廣義CL,其實(shí)是一個(gè)Clean Lab Python包。而它之所以叫Clean Lab,是因?yàn)樗?ldquo;clean”標(biāo)簽。

Clean Lab具有以下優(yōu)勢:

速度快:單次、非迭代、并行算法(例如,不到1秒的時(shí)間就可以查找ImageNet中的標(biāo)簽錯(cuò)誤);
魯棒性:風(fēng)險(xiǎn)最小化保證,包括不完全概率估計(jì);
通用性:適用于任何概率分類器,包括 PyTorch、Tensorflow、MxNet、Caffe2、scikit-learn等;
獨(dú)特性:唯一用于帶有噪聲標(biāo)簽或查找任何數(shù)據(jù)集/分類器標(biāo)簽錯(cuò)誤的多類學(xué)習(xí)的軟件包。

1行代碼就查找標(biāo)簽錯(cuò)誤!

3行代碼學(xué)習(xí)噪聲標(biāo)簽!

接下來,是Clean Lab在MNIST上表現(xiàn)??梢栽谶@個(gè)數(shù)據(jù)集上自動(dòng)識別50個(gè)標(biāo)簽錯(cuò)誤。

超好用的自信學(xué)習(xí):1行代碼查找標(biāo)簽錯(cuò)誤,3行代碼學(xué)習(xí)噪聲標(biāo)簽

原始MNIST訓(xùn)練數(shù)據(jù)集的標(biāo)簽錯(cuò)誤使用rankpruning算法進(jìn)行識別。描述24個(gè)最不自信的標(biāo)簽,從左到右依次排列,自頂向下增加自信(屬于給定標(biāo)簽的概率),在teal中表示為conf。預(yù)測概率最大的標(biāo)簽是綠色的。明顯的錯(cuò)誤用紅色表示。

傳送門

項(xiàng)目地址:
https://github.com/cgnorthcutt/cleanlab/

自信學(xué)習(xí)博客:
https://l7.curtisnorthcutt.com/confident-learning

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-11-10 08:37:05

Python線性回歸機(jī)器學(xué)習(xí)

2021-12-29 06:54:24

Debug Print工具

2020-12-17 08:06:33

CSS 日歷界面

2017-10-17 13:30:32

Python人臉識別

2015-08-17 10:42:13

2019-11-26 10:50:47

代碼編程語言重構(gòu)

2014-12-01 11:15:40

2020-06-18 15:53:06

Python代碼摳圖

2021-06-21 09:37:05

代碼開源可視化

2020-02-11 10:30:32

代碼開發(fā)AI

2020-08-03 09:05:48

代碼程序員案例

2016-12-02 08:53:18

Python一行代碼

2017-03-06 15:01:38

Python代碼詞云

2017-04-05 11:10:23

Javascript代碼前端

2017-04-10 09:59:08

python代碼愛心線

2020-11-26 15:48:37

代碼開發(fā)GitHub

2022-09-25 23:10:53

Python數(shù)據(jù)集機(jī)器學(xué)習(xí)

2022-10-28 10:18:53

代碼績效Java

2024-08-19 08:48:49

代碼渲染組件

2019-11-18 10:22:01

深度學(xué)習(xí)編程人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 一级片av | zzzwww在线看片免费 | 欧美视频偷拍 | 国产黄色网 | 欧美在线色视频 | 国产欧美日韩精品一区二区三区 | 国产精品美女视频 | 国产一级一级毛片 | 中文字幕 在线观看 | 日韩精品不卡 | 免费在线日韩 | 青青青伊人 | 欧美亚洲高清 | 午夜网| 国产精品久久久久久久午夜片 | av在线视 | 在线不卡 | 蜜桃av鲁一鲁一鲁一鲁 | 高清一区二区三区 | 欧美在线综合 | 欧美精品综合 | 久久国产欧美日韩精品 | 国产激情自拍视频 | 久久国产精品一区二区 | 免费一区二区 | 免费一级片 | 国产成人精品免费 | 免费污视频| 99久久国产综合精品麻豆 | 欧美日日| 一区在线播放 | 精品中文字幕一区 | 精品久久久av | 久久夜视频 | 亚洲欧美精品在线观看 | 亚洲精品久久久一区二区三区 | av大片在线观看 | 色婷婷激情综合 | 伊人色综合久久久天天蜜桃 | 一区二区三区四区国产 | 国产成人精品一区二区三 |