吳恩達新動作:建立新ML資源站,「以數據為中心的AI」大本營
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
很高興給大家介紹我們建立的一個新資源站Data-centric AI,這里有許多專家的文章和NeurIPS DCAI研討會的交流談話,來看看吧~
這個DCAI是什么來頭?
它代表了最近AI從“以模型為中心”到“以數據為中心”的轉變。
在過去幾十年間,大多數的AI研究都集中在“code”上面,也就是提升模型或者算法。
不過目前在很多應用上,“code”已經基本上能夠解決問題了,花時間改善一下數據往往會更有用。
然而現在構建、使用數據集這部分工作通常還是人工來做,費時費力,成本高昂,缺少高效的數據工具。
DCAI的出現就是為了解決這個問題。
這個新的資源站匯總了在數據這塊最新的進展和最好的實踐,目前共包含兩大塊內容:交流話題和NeurIPS研討會資源。
其中交流話題現在共有3個:Labeling and Crowdsourcing(眾包數據標注)、Data Augmentation(數據增強)、Data in Deployment(數據部署)。
分別由斯坦福計算機科學副教授Michael Bernstein、加州理工教授Anima Anandkumar和Google Brain研究負責人D. Sculley主導討論。
在每個話題下面都會有教授進行介紹、舉例、提出解決方法。
例如在數據增強這個話題下,Anima教授就從數據增強要解決的問題開始,給出解決方法,并介紹最新的研究成果:
在訓練數據中僅使用邊框標簽來訓練模型進行實例分割:
并在最后給出相關的資源以供參考。
DCAI包含的第二部分內容就是NeurIPS研討會資源。
這里有各路大神在去年NeurIPS研討會上的發言和談話。
每個視頻還都配有同步的PPT:
除了這兩部分資源之外,你還可以成為DCAI社區的貢獻者,在這里分享DCAI的研究項目、工具或者提議等內容:
自吳教授推文發布后,很快就收到了網友的熱情回應。大伙紛紛希望加入社區,還有人表示會很快分享自己的成果:
如果有同學對“以數據為中心”的AI內容感興趣,就趕快用起來吧~
DCAI地址:
https://datacentricai.org/