成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

新聞 人工智能
這就是最近Reddit上熱議的一個話題,是一位網友在使用再平常不過的Pytorch+Numpy組合時發現。

 [[393110]]

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

到底是怎樣的一個bug,能讓95%的Pytorch庫中招,就連特斯拉AI總監深受困擾?

還別說,這個bug雖小,但有夠“狡猾”的。

這就是最近Reddit上熱議的一個話題,是一位網友在使用再平常不過的Pytorch+Numpy組合時發現。

最主要的是,在代碼能夠跑通的情況下,它甚至還會影響模型的準確率!

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

除此之外,網友熱議的另外一個點,竟然是:

而是它到底算不算一個bug

[[393111]]

這究竟是怎么一回事?

事情的起因是一位網友發現,在PyTorch中用NumPy來生成隨機數時,受到數據預處理的限制,會多進程并行加載數據,但最后每個進程返回的隨機數卻是相同的。

他還舉出例子證實了自己的說法。

如下是一個示例數據集,它會返回三個元素的隨機向量。這里采用的批量大小分別為2,工作進程為4個。

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

然后神奇的事情發生了:每個進程返回的隨機數都是一樣的。

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

這個結果會著實讓人有點一頭霧水,就好像數學應用題求小明走一段路程需要花費多少時間,而你卻算出來了負數。

發現了問題后,這位網友還在GitHub上下載了超過10萬個PyTorch庫,用同樣的方法產生隨機數。

結果更加令人震驚:居然有超過95%的庫都受到這個問題的困擾!

這其中不乏PyTorch的官方教程和OpenAI的代碼,連特斯拉AI總監Karpathy也承認自己“被坑過”!

但有一說一,這個bug想要解決也不難:只需要在每個epoch都重新設置seed,或者用python內置的隨機數生成器就可以避免這個問題。

到底是不是bug?

如果這個問題已經可以解決,為什么還會引起如此大的討論呢?

因為網友們的重點已經上升到了“哲學”層面:

這到底是不是一個bug?

在Reddit上有人認為:這不是一個bug。

雖然這個問題非常常見,但它并不算是一個bug,而是一個在調試時不可以忽略的點。

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

就是這個觀點,激起了千層浪花,許多人都認為他忽略了問題的關鍵所在。

這不是產生偽隨機數的問題,也不是numpy的問題,問題的核心是在于PyTorch中的DataLoader的實現

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

對于包含隨機轉換的數據加載pipeline,這意味著每個worker都將選擇“相同”的轉換。

而現在NN中的許多數據加載pipeline,都使用某種類型的隨機轉換來進行數據增強,所以不重新初始化可能是一個預設。

另一位網友也表示這個bug其實是在預設程序下運行才出現的,應該向更多用戶指出來。

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

并且95%以上的Pytorch庫受此困擾,也絕不是危言聳聽。

有人就分享出了自己此前的慘痛經歷:

我認識到這一點是之前跑了許多進程來創建數據集時,然而發現其中一半的數據是重復的,之后花了很長的時間才發現哪里出了問題。

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

也有用戶補充說,如果 95% 以上的用戶使用時出現錯誤,那么代碼就是錯的。

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

順便一提,這提供了Karpathy定律的另一個例子:即使你搞砸了一些非常基本代碼,“neural nets want to work”。

你有踩過PyTorch的坑嗎?

如上的bug并不是偶然,隨著用PyTorch的人越來越多,被發現的bug也就越來越多,某乎上還有PyTorch的坑之總結,被瀏覽量高達49w。

95%PyTorch庫都會中招的bug!特斯拉AI總監都沒能幸免

其中從向量、函數到model.train(),無論是真bug還是自己出了bug,大家的血淚史還真的是各有千秋。

所以,關于PyTorch你可以分享的經驗血淚史嗎?

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2020-08-18 14:48:00

AI 數據人工智能

2022-10-10 10:09:39

加密欺詐DeFi

2022-02-23 18:36:11

釣魚郵件數據泄露網絡攻擊

2019-03-01 08:20:26

2022-11-01 13:42:54

雷達智能

2023-01-16 14:33:31

GitHubAI

2018-10-09 10:15:32

2021-12-09 10:26:35

AI 數據人工智能

2021-02-26 14:33:04

Javascript數據類型前端

2021-03-01 11:53:13

Javascript數據類型前端

2015-07-28 15:08:15

2022-08-21 21:15:28

模型AI

2017-05-26 16:01:38

2020-05-28 11:25:55

AI 數據人工智能

2023-04-10 15:37:18

AI代碼

2022-04-24 10:51:57

Python漏洞

2014-02-18 13:45:39

bug程序員

2018-07-23 09:37:08

2022-03-16 18:38:06

AI特斯拉神經網絡

2022-07-14 14:54:00

特斯拉AI自動駕駛
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲国产乱码 | 国产99久久精品 | 日韩1区 | 日韩欧美专区 | 国产高清精品一区二区三区 | 久久免费观看一级毛片 | 日韩理论电影在线观看 | 五月激情综合 | 男女午夜激情视频 | 波多野吉衣在线播放 | 欧美日韩精品一区 | 欧美多人在线 | 久久久www| 国产又爽又黄的视频 | 日韩av电影在线观看 | 国产区一区二区三区 | 91精品中文字幕一区二区三区 | 亚洲视频中文字幕 | 久久久久久久久久久久一区二区 | 欧美影院 | 亚洲国产高清在线观看 | 美女久久视频 | 欧美亚洲在线 | 精产国产伦理一二三区 | 国产精品福利在线观看 | 日屁网站| 久久久久亚洲av毛片大全 | 91精品国产91久久久久久吃药 | 北条麻妃99精品青青久久主播 | 亚洲电影一区二区三区 | 亚洲精品第一 | 亚洲网站在线播放 | 6080亚洲精品一区二区 | 国产精品色 | 免费人成在线观看网站 | 99pao成人国产永久免费视频 | 日韩一级 | 亚洲精品国产a久久久久久 午夜影院网站 | 亚洲久久一区 | 国产精品成人一区二区三区夜夜夜 | 天天久久 |