成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

來自頂尖AI研究員的忠告:聽說你也在做AI,這里的四個坑千萬別踩!

人工智能
人工智能越來越熱,想要在人工智能領域創業的人也隨之涌入,但在人工智能領域創業,有很多需要注意的地方。近日,曾經和George Hotz一起在comma.ai研發無人駕駛汽車的Eder Santana專門撰文,給想要深耕人工智能的創業者提出了四條寶貴建議。

人工智能越來越熱,想要在人工智能領域創業的人也隨之涌入,但在人工智能領域創業,有很多需要注意的地方。近日,曾經和George Hotz一起在comma.ai研發無人駕駛汽車的Eder Santana專門撰文,給想要深耕人工智能的創業者提出了四條寶貴建議,一起來看。

[[189091]]

機器學習實在太受歡迎,以至于它都被當做了AI本身,熱度更高的深度學習更是如此。令人高興的是,你的創業團隊已經獲得了資金,或者你的團隊預算剛剛獲得了通過,現在你即將開始進入深度學習領域。

之前,你已經從Keras, Imagenet等人工智能技術中感受到了快樂,這很令人興奮!可是,當你真的要在商業上開始實踐人工智能的時候,那么有幾件事是你必須要考慮的。

接下來,我會結合幾個例子來闡述我的建議,這些例子都是我去年早些時候和George Hotz一起在comma.ai研究自動駕駛時發生的。

 

來自***AI研究員的忠告:聽說你也在做AI,這里的四個坑千萬別踩!

救命,AI!我該往哪走?

1、別讓數據和工程師脫節

深度學習是一項數據先行的科學。你的團隊或者創業存在的全部意義就是為了讓這些數據變得有意義。想想看,你只有將文字變得有意義,你才能研發你的人工智能比特幣聊天機器人!你只有理解圖像、視頻等內容,你才能打造下一個Snapchat Stories式的自動化多媒體拼貼。

你應該把數據處理當做你工作的一個核心。一定要在這方面做好它。例如,如果你覺得“只需要15分鐘”來準備和加載數據集,那么每次當你發現了更好的模型架構或者在你的Tensorflow代碼中發現了漏洞的時候,都必須要白白等待這15分鐘的時間。

規則很簡單。版本化你的數據集,并且預處理一次,之后反復使用。一些類似Celery、Luigi這樣的工具會是你的好幫手。

如果你是在一個大型的團隊工作,團隊中的所有任務都需要提交到一個集群,這時應該考慮一個數據解決方案,向模型訓練的員工批量提供數據。千萬千萬不要讓團隊中的成員在已經知道模型有漏洞的情況下,還必須等到整個數據集都加載完畢才能修改。

小故事:comma.ai可能擁有世界上第二或第三大的駕駛數據集。在comma.ai 的早期歲月,為了訓練駕駛模型,需要加載時長數小時的視頻到擁有700多Gb內存的大型機器上。每當George需要更多數據來訓練的時候,他都會立刻增加100gb的內存。我加入的主要工作就是要為這個模型開發一個更好的版本,不過我并不想等15分鐘來加載數據。相反,我從一個簡單的ZMQ服務開源項目中獲得了一些內容。從此,再也沒有任何數據讓我們干著急了,我們可以擴展我們的訓練規模,并且使用更便宜的機器。現在對模型訓練的限制,只剩下GPU和它的研發者了。

2、從你能可視化的東西開始

對深度學習而言,我們很幸運有Tensorboard、最近推出的Visdom、以及其他的一些工具來幫我們可視化結果。我相信數據科學一般來說是最適合可視化驅動開發的,因為可視化讓你在研發的每一步都能正確處理你所遇到的問題。你沒有必要非得學習d3.js來獲得有用的可視化,除非你是JavaScript的狂熱愛好者。

小故事:在我的離職談話中,我咨詢George的意見,希望獲得一些提升工程師效率的建議(相信我,他是我見過的人當中最有效率的,我會抓住每一個機會向他學習)。他的建議是先構建一些東西出來,讓這些東西能夠可視化我在做的事情。George本人曾經就是這么做的。此外,George 所有的IPython筆記本都有一個滑動小部件,可以在原型設計中迅速顯示參數如何影響結果。

3、盡早明確你的驗證/疑難案例數據集

我把充滿樂趣的可視化內容放在第二位,是為了讓你被“準備數據”嚇到之后,能稍作休息。可是,如果你想避免成為一只打字機上的猴子,只會隨機往神經網絡上添加更多的層,你必須要學會如何衡量進度。

問問自己哪些指標與優秀的可交付成果的相關性更好,以及你應該跟蹤哪些數據。

這或許超過了簡單的“隨機驗證10%的剩余數據”。驗證的數據庫***與產品擁有相同的統計屬性。同樣的產品也能被用于追蹤疑難、邊緣甚至失敗的案例,以制作未來的驗證集。因此,你的驗證集或許會不斷發展,而且應該像訓練集一樣進行版本化。

小故事:我了解到,對于自動駕駛而言,那些在駕駛過程中你必須對車輛進行人為控制的時刻,就是疑難案例和驗證集。但是,***的驗證測試是讓一名經驗豐富的控制工程師上路,以精確地判斷自動駕駛系統的質量。如果你在這個行業之中,***去特斯拉挖工程師過來(開個玩笑)。

4、過早的擴張是早期創業公司倒閉的主要原因

聽到這個建議,你也許會說“別試著教我這些,我聽過的創業故事肯定比你多!”誠然,但這里要告訴你的新事物是:你應該把GPU和硬件訓練當成和員工同樣的因素來考慮。一旦你雇傭/購買了超過你所需要的,你將花費很多的精力來安排多出來的資源。管理集群會很困難,而且深度學習的大規模HPC本身就是一個研究課題。

我在這里的建議是:在你想買一個新的GPU之前,你應該保證你所有的GPU都被充分利用。你當然可以像Google一樣大手大腳,前提是你的生產力和盈利能力能像Google一樣。

如果你的團隊和公司已經足夠大,要嚴肅認真地招聘那些在基礎設施上工作的員工。如果你雇傭了10倍于硬件員工人數的研究人員,卻讓他們被迫等待,那么***的情況是他們自己建立適合自己的基礎設施,最壞的情況則是他們干脆直接退出。這肯定不是你想見到的狀況。

小故事:當我有一次離開辦公室卻沒有讓我所有的GPU運轉的時候,Niel(comma的手機APP副總裁)給了我一個非常失望的神情,這甚至都讓我有了“空閑GPU恐懼癥”。在今天,這已經成為了一個非常普遍的問題。

沒錯!在人工智能領域工作既富挑戰性,又充滿了樂趣。確保你對如何處理資源和可視化有一定的思考,那么你會沒事的。

責任編輯:未麗燕 來源: 雷鋒網
相關推薦

2020-11-06 07:51:28

AI

2024-06-20 18:15:55

2023-08-03 07:13:59

2012-02-21 09:22:45

2022-06-15 18:57:43

人工智能

2025-06-03 06:30:05

2024-11-07 10:04:48

2021-09-24 13:45:00

CTO說直播

2025-05-15 09:31:15

2014-09-10 10:14:14

2021-03-17 10:25:45

數字化轉型首席信息官IT文化變革

2009-07-03 16:21:58

IT系統數據中心運維管理

2025-03-28 08:40:00

C#異步編程

2023-05-24 06:56:18

實用AI工具

2021-05-10 09:05:39

AI 數據人工智能

2021-08-06 09:20:41

IT管理IT領導者CIO

2023-10-20 09:54:00

人工智能AI

2019-05-20 07:52:43

人工智能AI機器學習

2019-06-26 08:30:32

計算機互聯網iOS

2015-03-23 12:20:59

Mac版ChromeChrome崩潰
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线观看视频一区 | 欧美亚洲激情 | 91精品国产色综合久久 | 久久人人网| av网站在线免费观看 | 亚洲精品久久久久久国产精华液 | 国产精品夜间视频香蕉 | 本道综合精品 | 在线观看一区 | 蜜臀久久99精品久久久久野外 | 国产精品视频一区二区三区四区国 | 国产亚洲一区二区精品 | 欧产日产国产精品视频 | 亚洲啪啪一区 | 精产国产伦理一二三区 | 日韩视频在线观看 | 久久亚洲一区 | 亚洲国产精品一区二区三区 | 黄色免费网 | 日本字幕在线观看 | 亚洲欧美高清 | 亚洲免费在线播放 | 黄色大片在线播放 | 国产精品国产a级 | 97人人干| 97精品国产97久久久久久免费 | 一本一道久久a久久精品综合蜜臀 | 男女视频免费 | 亚洲高清成人 | 亚洲高清免费视频 | 色偷偷人人澡人人爽人人模 | 国产精品视频网 | 国产一级一级毛片 | 男女又爽又黄视频 | 亚洲成人午夜在线 | 一级视频在线免费观看 | 999久久精品| 理论片免费在线观看 | 日本手机在线 | 在线观看av中文字幕 | 国产黄色大片 |