成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

斑馬識別成狗,AI犯錯的原因被斯坦福找到了

人工智能 新聞
論文提出一種方法——反事實的概念性解釋,通過這種方法,我們就能重新定義模型的分類標準。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

明明是只斑馬,AI為什么說它是一條狗?

分類模型在歸類圖像時有時會錯誤地判斷類別。

經過學習的AI,還會搞砸一些預測,肯定是在其中的某個環節出現了紕漏。

斯坦福大學的兩位博士生和教授James Zou在一篇論文中,帶我們探究了分類模型犯錯的原因。

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

隨后,論文提出一種方法——反事實的概念性解釋(Conceptual Counterfactual Explanations),并評估了它的效果。

通過這種方法,我們就能重新定義模型的分類標準,從而解釋AI犯錯的原因。

一起來看看吧。

AI為什么會犯錯?

想要提高分類模型后續預測的準確性,就先得整明白這個模型在哪里出了岔子。

一般來說,AI搞砸預測是以下原因造成的:

首先是在模型實際預測的過程中,分類標準可能會與預訓練時有些偏差,使得訓練模型在實際預測的過程中效果不佳,進而降低預測結果的準確性。

比如說,病理學家使用預先訓練好的模型來分類組織病理學圖像,但效果在他的圖像上卻不是很好。

這就可能是在他的圖像中,色調與原始訓練數據中不同導致的。

其次,在模型學習的過程中,可能會學習到一種叫做“偽相關性”的東西,即將一些看似無關的要素與被識別的圖像關聯起來。

可以看這個例子:

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

在這個模型訓練過程中,樣本里所有狗的照片里都有雪,這導致該模型將雪與狗聯系在一起,并錯誤地預測:沒有雪的狗不是狗。

這可能是用的數據集,都是在同一場景下收集的,會阻礙模型的泛化。

除此之外,也可能是在訓練模型時,人為制造的一些偏差。

例如,某一皮膚科專家利用訓練好的AI來分類圖像中的皮膚病,但其他同事使用的效果卻不盡如人意。

這可能是因為在訓練的樣本中,皮膚的膚色單一、且年齡段分布窄。

了解了AI“犯錯”的原因后,我們要怎樣才能準確地判斷模型哪里出現了錯誤呢?

AI犯錯,它來解釋

James Zou在論文中提出了一種叫反事實的概念性解釋(CCE)的方法。

具體來說,就是通過這種方法,來探究輸入數據與預測結果之間的聯系,最終找到模型的錯誤之處。

那CCE是怎么來解釋的呢?

定義概念庫

首先要做的,就是設置并細化一個概念庫C,即制作一個分類標準。

具體來說,概念庫C中的各個概念可以用來分類圖像,如裝置c1(街道、雪等)、圖片質量c2(清晰、模糊等)······

這樣,就能獲得一組可解釋的概念庫C={c1,c2,…}。

然后,需要給其中的每個概念找對應訓練數據。

具體的,就是收集與其相符(Pci)和不符(Nci)的例子,一般來說數量上要一樣(Pci=Nci=100)。

對于每個概念,CCE都要學習它們的分類方法和“思維方式”。

分別通過兩種方法:

一個是通過學習支持向量機(SVM),來尋找可以區分兩種事物最優方式的算法(線性分類器)

另一個是學習相應的概念激活向量(CAV),它可以用來解釋圖像被錯誤分類的具體原因。

就像下圖,都是斑馬的圖像,歸類錯誤的原因卻不一樣。

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

這一步只需要對每個想要評估的模型做一次,之后CAV便可以用來解釋任意數量的錯誤分類。

給定錯誤分類標準

我們可以通過改變不同概念在模型中的比重,對其分類標準進行相應的調整,這些調整要滿足以下原則:

1、正確性:如果一個分類標準達到了預期的結果,那么它就被認為是正確的。

2、有效性:分類標準不能違反人類的基本認知。

3、稀疏性:最終目標是向用戶傳達模型的錯誤之處,太多的變量不利于有效傳達信息。

我們的目的是盡可能地使預測結果貼近訓練結果,即最小化交叉熵損失。

因此就要不斷優化模型預測的標準,通過調整待修改的標準,對其進行加權,最終達到糾正錯誤分類的效果。

了解之后,我們通過一個實際例子來看看,怎么用CCE“探測”分類模型出錯的地方。

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

在這里,分類模型錯誤地將斑馬圖像識別為非洲獵犬。

于是,我們首先生成這個模型將斑馬識別成狗的一系列標準。

然后,對這些標準進行評分,如果評分為正,則代表在圖像中增加這個概念,將會提高正確分類的概率,反之亦然。

在這個例子中,如果增加stripes(條紋)這個概念,識別出它為斑馬的概率就會大一些。

在c)圖中,通過CCE分析也可以直觀地看到,“Polka Dots”(斑點)和“Dog”(狗)是導致模型預測錯誤的原因。

CCE效果怎么樣?

看到這里,想必大家對CCE的原理都有了初步的認識。

那它判斷得到底準不準確,效果究竟如何呢?

CCE的目的,主要是揭示模型在訓練過程中學習到的“偽相關性”,用它就可以捕獲圖像中出現的其他“無關要素”和圖像的偽相關性。

測試發現,在大多數情況下,該模型在超過90%的錯誤分類的測試樣本中識別出偽相關。

看看這個表格,相較于其他方法,使用CCE,識別出樣本中偽相關的概率最高。

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

CCE能夠精準地識別出樣本中的偽相關,可以看這個例子:

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

改變蘋果圖片的顏色使圖片變灰),分類模型識別錯誤的概率增大時(黑線),CCE辨別出“綠色”為偽相關的分數也就越高(綠線)

除此之外,CCE也有用在醫學領域的潛力。

像Abubakar Abid等人就使用CCE,在皮膚病學(皮膚狀況分類)、胸片圖像中的心臟病學(氣胸分類)中都做了相關測試。

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

CCE使用學習到的偏差和圖像質量條件來解釋模型犯錯,也已被專業的皮膚科醫生證實——這些因素,確實很大程度上是導致皮膚圖像難以分類的原因。

此外,CCE的速度也很快。

概念庫只需要使用簡單的支持向量機學習一次,每個測試示例在單個CPU上花費的時間小于0.3s。

重要的是,它可以很簡單地應用到任何深度網絡,在不需要訓練數據的情況下檢測到模型犯錯的原因。

如果你對這種方法感興趣,想親自試試的話,可以戳下文鏈接查看。

作者介紹

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

James Zou ,論文通訊作者,是斯坦福大學生物醫學數據科學系的助理教授,計算機科學與電氣工程系的助理教授。

于 2014 年獲得哈佛大學博士學位,曾是微軟研究院成員、劍橋大學蓋茨學者和加州大學伯克利分校西蒙斯研究員。

他的研究得到了 Sloan Fellowship、NSF CAREER Award 以及 Google、Amazon 和騰訊 AI 獎項的支持。

斑馬識別成狗,AI犯錯的原因被斯坦福找到了丨開源

Abubakar Abid (前)、 Mert Yuksekgonul(后) 論文第一作者,均為斯坦福大學博士生。

責任編輯:張燕妮 來源: Pine
相關推薦

2019-12-16 14:33:01

AI人工智能斯坦福

2025-03-06 09:22:00

模型強化學習訓練

2017-11-28 14:18:29

2025-04-09 11:25:36

2021-03-05 10:57:33

AI 數據人工智能

2021-03-10 14:48:27

人工智能

2025-06-04 08:00:00

2018-01-23 16:48:47

AI

2019-03-24 12:11:47

AI 數據人工智能

2012-03-21 21:38:27

蘋果

2013-01-31 09:45:14

斯坦福超級電腦百萬內核

2022-02-14 19:20:53

AI算法模型

2025-04-09 04:22:00

2019-03-27 10:47:05

人工智能法律AI

2024-09-26 10:23:46

2009-05-19 09:06:41

Apple斯坦福iPhone

2023-08-10 14:01:08

開源虛擬

2025-06-03 17:40:30

AIDeepSeekOpenAI

2025-01-17 10:26:19

模型開發ChatGPT

2025-04-08 13:16:34

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩精品一区二区三区在线观看 | 久久国产精品一区二区 | av在线一区二区三区 | 亚洲欧美日韩在线 | 在线国产一区 | 欧美极品一区二区 | 欧美视频日韩 | 久久久久久免费精品一区二区三区 | 黑人一级片视频 | 日韩欧美专区 | 91 在线 | 中文字幕亚洲一区二区va在线 | 国产高清在线精品一区二区三区 | 亚洲激情综合网 | 久久久久1 | 久久久夜色精品亚洲 | 中文字幕欧美一区 | 嫩草影院黄 | 亚洲精品无| 久久99久久 | av福利网站 | 日本久久久一区二区三区 | 99热欧美 | 五月综合久久 | 久久精品无码一区二区三区 | 久久国内 | 亚洲精品视频观看 | 国产毛片久久久久久久久春天 | 欧美日韩视频网站 | 日韩欧美综合在线视频 | 国产高清在线精品 | 91精品国产麻豆 | 国产精品视频久久久久 | 久久精品国产免费 | 亚洲国产精品人人爽夜夜爽 | 亚洲狠狠丁香婷婷综合久久久 | 午夜久久av | 国产精品18hdxxxⅹ在线 | 亚洲精彩视频在线观看 | 91亚洲国产精品 | 天天搞天天操 |