AI公開課 | 我猜你對數據標注還不了解吧?
毋庸置疑的是,人工智能領域每天都在上演著日新月異的發展和進步。
當我們打開手機,啟用美顏APP里各種各樣的AI濾鏡時,我們看到的是搞笑的頭像和可愛的表情,而APP“看到”的是我們臉上數百個點。
我們早已對各類的AI濾鏡習以為常,但卻甚少思考這些APP究竟是怎樣識別出哪里是眼睛,哪里是鼻子。
其實這一切都歸功于AI時代最可愛卻最容易被忽視的一群人,他們就是被稱為人工智能“老師”的數據標注員。
人工智能背后的人工
早上8點30分,小新打開了名為“數據標注分配任務群”的QQ群,開始了一上午的工作。
群主早已將今天需要標注的視頻和圖片發到群里,小新被分配到的是一段長達3個小時的視頻錄像。
這是一段某口腔醫學院老師講課時錄制的視頻,視頻的內容主要是針對口腔齲齒的介紹分類,小新的主要任務就是在視頻中找到黑色的齲齒,然后用鼠標將齲齒周圍畫一個數字“邊界線”,從而將它標注出來。
同樣的動作小新一上午要重復幾百次,直到視頻播放結束,最后小新會將標注好的新視頻重新反饋到群里,結束一上午的工作。
小新并不是醫學專業出身,他也不太清楚這些被標注的齲齒部分到底有何作用。但在無形之中小新卻成了人工智能醫療系統的“老師”,通過大量的數據迭代讓AI可以準確識別出哪些是齲齒,齲齒腐爛的程度等。
小新或許從沒聽說過“數據標注”這個職業,但他卻用實際行動日復一日履行著一個數據標注員的責任,讓機器通過大量的資料學習,直到它們順利“畢業”。
大浪潮之下的普通人
近2年數據標注公司開始在國內大規模興起,這與中國人工智能發展初期所需要的大量的數據密不可分。
由于科技公司所需要的數據量巨大,數據標注公司會把很大一部分標注工作分包出去,數據浪潮讓AI更智能的同時也帶來了大量的就業機會。
在距離貴陽市中心50公里的百鳥河數字小鎮,就有一個規模500人的“數據工場”,500名標注員中,近一半是附近一家扶貧高職的學生。
據了解,他們一個月能掙到1500元,經濟上足以自立,還能補貼家用,相比餐廳辛苦端盤子或者送外賣這類兼職工作,數據標注相對輕松且體面。
扶貧高職學生進行數據標注工作
數據浪潮的滾滾洪流席卷著資金和技術,裹挾著無數夢想與野心向前奔騰,在資本和野心之下無數普通人雖然暫時不理解這些變化,但卻能從變化中獲得便捷和利益。
關于我們不知道的故事
對于絕大部分同學來說“數據標注”是一個陌生又專業的名詞,班主任也是第一次和大家提起這方面的知識。其實圍繞數據標注還有很多有意思的話題,比如數據標注的分類,數據標注產業的發展和影響,數據標注到底是不是完全依賴人類…..
為了讓大家更深入更全面的了解數據標注,AI大學第26期科技晚自習特意邀請到了科大訊飛AI資源部語音數據主管劉丹,在12月12日晚19點來到AI大學直播間和同學們一起聊聊關于數據標注背后的故事。
【課程主題】
一個未被講出的故事——數據標注
【課程講師】
科大訊飛AI資源部語音數據主管 劉丹
【課程時間】
2019年12月12日19點(本周四)
【課程鏈接】
點擊鏈接:http://www.aidaxue.com/live?id=29&ch=cto,進入課程直播間