成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

移除ImageNet標(biāo)簽錯誤,模型排名發(fā)生大變化

人工智能 新聞
數(shù)據(jù)集的質(zhì)量,真的很重要。

此前,ImageNet 因為存在標(biāo)簽錯誤的問題而成為熱門話題,這個數(shù)字說出來你可能會大吃一驚,至少有十萬個標(biāo)簽是存在問題的。那些基于錯誤標(biāo)簽做的研究,很可能要推翻重來一遍。

由此看來管理數(shù)據(jù)集質(zhì)量還是很重要的。

很多人會使用 ImageNet 數(shù)據(jù)集作為 benchmark,不過基于 ImageNet 預(yù)訓(xùn)練的模型,最終結(jié)果可能會因為數(shù)據(jù)質(zhì)量而變化。

本文中,來自 Adansons 公司的工程師 Kenichi Higuchi 對《 Are we done with ImageNet? 》一文中的 ImageNet 數(shù)據(jù)集進行重新研究,在去除錯誤標(biāo)簽數(shù)據(jù)后,重新評估 torchvision 上發(fā)布的模型。

從 ImageNet 中刪除錯誤數(shù)據(jù)并重新評估模型

本文將 ImageNet 中的標(biāo)簽錯誤分為三類,如下所示。

(1) 標(biāo)注錯誤的數(shù)據(jù)  

(2) 對應(yīng)多個標(biāo)簽的數(shù)據(jù)  

(3) 不屬于任何標(biāo)簽的數(shù)據(jù)

圖片

總結(jié)來看,錯誤數(shù)據(jù)大約有 14000 多個,考慮評估數(shù)據(jù)的數(shù)量為 50000,可以看出錯誤數(shù)據(jù)占比極高。下圖是一些有代表性的錯誤數(shù)據(jù)。

圖片

方法

在不重新訓(xùn)練模型的情況下,該研究通過只排除標(biāo)注錯誤的數(shù)據(jù),也就是上述(1)類錯誤數(shù)據(jù),以及從評估數(shù)據(jù)中排除所有錯誤數(shù)據(jù),也就是 (1)-(3) 錯誤數(shù)據(jù),來重新檢查模型的準(zhǔn)確率。

為了刪除錯誤數(shù)據(jù),需要使用一個描述標(biāo)簽錯誤信息的元數(shù)據(jù)文件。在這個元數(shù)據(jù)文件中,如果包含 (1)-(3) 類錯誤,信息將在「correction」屬性中描述。

圖片

該研究使用一款名為 Adansons Base 的工具,Adansons Base 通過將數(shù)據(jù)集鏈接到元數(shù)據(jù)來過濾數(shù)據(jù)。這里測試了 10 個模型,如下所示。

圖片

10 個用于測試的圖像分類模型

結(jié)果

結(jié)果如下表所示(數(shù)值是以 % 為單位的精度,括號中的數(shù)字是排名)

圖片

10 個分類模型的結(jié)果

以 All Eval 數(shù)據(jù)為基線,排除錯誤數(shù)據(jù)類型(1),準(zhǔn)確率平均提高 3.122 分;排除所有錯誤數(shù)據(jù) (1)~(3) ,準(zhǔn)確率平均提高 11.743 分。

和預(yù)想的一樣,排除錯誤數(shù)據(jù),準(zhǔn)確率全面提高,這一點毫無疑問,因為與干凈數(shù)據(jù)相比,存在錯誤數(shù)據(jù)很容易出錯。

當(dāng)在不排除錯誤數(shù)據(jù)的情況下進行評估,以及錯誤數(shù)據(jù)(1)~(3) 都被排除時,模型的準(zhǔn)確率排名發(fā)生了變化。

本文中,錯誤數(shù)據(jù) (1) 有 3670 個,占全部 50000 條數(shù)據(jù)的 7.34%,移除后準(zhǔn)確率平均提高了 3.22 點左右。當(dāng)移除錯誤數(shù)據(jù)后,數(shù)據(jù)規(guī)模發(fā)生了變化,單純的比較準(zhǔn)確率可能存在偏差。

結(jié)論

盡管并未特別強調(diào),但是在做評估訓(xùn)練時,使用準(zhǔn)確標(biāo)記的數(shù)據(jù)很重要。

在比較模型之間的準(zhǔn)確率時,以前的研究可能得出錯誤的結(jié)論。所以應(yīng)該先對數(shù)據(jù)進行評估,但這真的可以用來評估模型的性能嗎?

許多使用深度學(xué)習(xí)的模型往往不屑于對數(shù)據(jù)進行反思,而是渴望通過模型的表現(xiàn)性能來提高準(zhǔn)確性和其他評估指標(biāo),即使是評價數(shù)據(jù)中包含錯誤數(shù)據(jù),也沒進行準(zhǔn)確的處理。

當(dāng)創(chuàng)建自有的數(shù)據(jù)集時,比如在業(yè)務(wù)中應(yīng)用 AI 時,創(chuàng)建高質(zhì)量的數(shù)據(jù)集直接關(guān)系到提高 AI 的準(zhǔn)確率和可靠性。本文的實驗結(jié)果表明,僅僅提高數(shù)據(jù)質(zhì)量就可以將準(zhǔn)確率提高約 10 個百分點,這表明在開發(fā) AI 系統(tǒng)時不僅要改進模型,還要改善數(shù)據(jù)集。

然而,保證數(shù)據(jù)集的質(zhì)量并不容易。雖然增加元數(shù)據(jù)的數(shù)量以正確評估 AI 模型和數(shù)據(jù)的質(zhì)量很重要,但管理起來可能很麻煩,尤其是對于非結(jié)構(gòu)化數(shù)據(jù)。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2022-08-17 09:08:44

Deno前端

2013-07-11 14:13:02

PaaS微軟AWS

2022-01-19 14:18:40

靈活工作工作場所IT團隊

2010-11-24 09:47:27

jQuery UIAccordion

2019-02-12 17:07:58

2021-02-24 10:47:06

存儲數(shù)據(jù)存儲云遷移

2024-02-16 20:28:40

2010-10-08 10:41:50

HTML 5W3C

2019-11-04 05:38:45

網(wǎng)絡(luò)安全信息安全網(wǎng)絡(luò)攻擊

2025-01-24 00:44:15

2012-12-11 16:59:27

云計算云服務(wù)公共云

2016-01-05 11:56:34

2020-04-01 16:37:27

Windows 10Windows微軟

2018-01-02 09:16:27

2011-08-03 11:03:55

IT安全

2011-08-22 17:24:24

Ubuntu11.04

2016-12-06 19:42:39

2018-02-25 17:00:04

區(qū)塊鏈比特幣

2025-05-23 04:00:00

IT主管AI人工智能

2017-04-26 13:10:50

CNNImageNet深度學(xué)習(xí)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 九九天堂网 | 欧美一区二区三区大片 | 亚洲高清在线视频 | av网站在线播放 | 中文字幕 国产 | 精品一二区 | 高清av电影 | 一区二区在线免费观看 | 一区二区三区视频在线观看 | 亚洲欧洲中文 | 黄色成人av | 伊人久久麻豆 | 欧美日韩国产中文 | 精品二区视频 | 欧美黑人体内she精在线观看 | 麻豆精品国产免费 | 日韩有码一区二区三区 | 97色在线观看免费视频 | 国产精品2 | 久久国产精品久久久久久久久久 | 国产专区在线 | 欧洲视频一区二区 | 91原创视频| 国产高清免费在线 | 久久国内 | 国外成人在线视频 | 欧洲精品视频一区 | 日韩av在线一区 | 成人不卡 | 久草a√ | 精品一区二区在线视频 | 亚洲精品欧美精品 | 日韩在线91 | 性生生活大片免费看视频 | 北条麻妃国产九九九精品小说 | 国产999精品久久久久久 | 人人看人人草 | 欧美综合一区二区 | 精品国产乱码久久久久久闺蜜 | 久久婷婷av | 一区二区三区欧美在线观看 |