從數據標注師看AI技術深度應用
原創【51CTO.com原創稿件】近期,AI領域的黑科技不斷刷新人們對人工智能的認知,從張學友演唱會上人臉識別逃犯,到菜鳥在杭州試點的智能柜刷臉取件服務,再到西溪濕地景區刷臉入園,阿里人臉識別已應用在阿里平臺的電商、通信、寄遞、旅行、直播等60多個業務場景,人工智能技術開始全面賦能各產業。
優酷AI技術成為各領域深度賦能的技術標桿
今年6月世界杯直播期間,優酷向全世界展示了其在AI及云視頻領域的雄厚實力,作為歷史上首家拿下世界杯直播權的主流視頻平臺,優酷世界杯直播成功首秀的背后,由優酷自研的“智能媒體大腦”、阿里云密集的CDN節點和巨量帶寬儲備支撐,實質上是一場圍繞內容產業的技術升級浪潮。
這波浪潮剛剛平息不久,優酷的一則招聘啟示又登上熱搜。“娛樂數據標注師”,俗稱“吻戲鑒定師”,其崗位描述如下:一是對視頻數據進行標注及歸納整理,二是負責數據質量校驗,三是協助人臉識別模型的訓練,對娛樂領域的算法進行優化。乍一看,AI相關職業,工作年限要求不高,無臉盲,認識大量明星,追過大量綜藝、網劇和電影,了解機器學習,簡直高大上啊!
可以說,優酷招聘“娛樂數據標注師”,是優酷機器學習技術又一深度賦能產業的標桿案例。
“吻戲鑒定師”的叫法絕非浪得虛名,其主要職責是滿足視頻的智能編輯需求,將視頻分割成圖像對其進行打標簽,如教計算機識別接吻場景,需要將圖片打上“接吻”和“非接吻”的標簽。據悉,目前優酷標簽庫的標簽大致可分為三級,標簽種類已達上萬個,其中常用標簽一千余個,機器能夠理解的標簽已達百余個。
給接吻鏡頭打標
優酷高級算法工程師吉恒杉表示,為視頻打標簽的訴求很早就有,以前都是以人工的方式針對頭部劇打標簽,且顆粒度不會那么細。有了AI,通過智能的方式部分取代了人工打標簽,一是提高了打標效率,二是處理的顆粒度更細。優酷算法專家郭亮提到,“AI智能化主要是對視頻的內容做理解,有各種各樣的維度,通過收集用戶的喜好,例如喜歡的明星,喜歡的視頻類別和場景,來推薦更符合用戶喜好的視頻。”
“通過機器去理解視頻中的接吻、擁抱等片段,核心是要了解視頻中的情緒,將比較沖突的看點標記出來,推薦上榜,機器打標能夠極大提高推薦的準確率。如果人工去標記整部劇,很難全部標記出來,機器識別的好處在于能夠形成規模化效應,標簽越精細,效益也就越高。”優酷資深技術專家解縉介紹,“優酷視頻上的劇集預告和回放片段都可以通過視覺理解技術自動生產,目前人工生產和機器生產的比例是7:3,二者相輔相成,熱點非常強的視頻會采用人工推薦,但不會全部由機器替代。”
當然,人臉識別模型需要不斷訓練來提高準確率,機器要學習大量的內容場景,數據標注師相當于機器識別的老師,幫助機器理解哪些圖像是“吻戲”、“打戲”、“進球”等,理解視頻中包含哪些明星,識別明星臉、網紅臉,經過在不同場景、不同角度的反復學習,準確率才能達到可用水平。
實際上,接吻場景又分正面、側面和后面等多類鏡頭,99%以上的接吻是一整段視頻,它是一個連續的場景,可以以鏡頭為單位,當人物和臉融合在一起時,業務準確度可以達到非常高的水平。通過對視頻的拆分,可以對明星進行識別,統計某一明星在單集中出現的時間段,可以將該明星出現的鏡頭拆分出來推薦給喜愛這一明星的用戶觀看,“只看他/她”這一功能在技術上已經能夠實現了,只是尚未對廣大用戶開放。
各種角度的網紅臉 傻傻分不清
說到這里,小編有個疑問,明星臉尤其是網紅臉是怎么鑒別的呢,娛樂圈眾多明星撞臉,常常傻傻分不清楚,機器又該怎么識別呢?吉恒杉透露,該圖像分類識別模型基于當前主流的TensorFlow以及阿里內部的框架開發,為了保證機器識別的準確率,技術人員會統一調一個閾值,如果明星比較多,會對明星做微調。保證識別準確率一方面在于數據,另一方面在于分類模型,當圖片數據量達到一萬張時,準確率達到80%左右就可以交給編輯進行評估或是生產了,目前的圖片數據量已達幾萬張,準確率越來越高。
據悉,目前優酷主要招聘娛樂數據標注師和體育數據標注師兩大類,對這兩方面感興趣且對機器學習有一定了解的程序員不妨一試。
技術團隊底蘊深厚,優酷AI技術實力處在行業前列
在被問及優酷機器識別模型的訓練時長時,吉恒杉表示該模型到目前為止僅訓練2個多月的時間,如此短的訓練時長即可交付應用,相信很多人對背后這支技術團隊涌發強烈的好奇。
據目前了解,阿里對AI技術的研究已有數年,早在2015年10月,阿里安全部已開始用人工智能識別網絡上包括色情、暴力在內的違規信息,被稱為“阿里AI鑒黃師”,到目前為止,在智能鑒黃模型上跑的正常圖片與色情圖片數量已達千萬張。阿里AI鑒黃師不僅能鑒別黃片黃圖,連帶有情色信息的語音內容都能識別。當然,AI鑒黃并不能完全取代人工鑒黃,最佳的審核方式是智能為主,人工為輔。人工鑒黃師群體被AI鑒黃師取代,轉而去做打標和審查可疑圖片的工作,與優酷所招聘的數據標注師的職能類似。
今年世界杯期間,從拿到世界杯直播授權,到世界杯開賽,只有短短2個星期的時間,支撐優酷直播的這支團隊囊括了產品技術團隊、阿里云的團隊還有阿里做天貓雙十一的技術保障團隊。在多個團隊的合力支持下,6月14日,世界杯揭幕戰拉動優酷移動端新用戶增長日環比近160%,整體日活用戶環比增長20%左右,世界杯直播觀看人數超過1200萬,創造優酷平臺直播歷史新高。
阿里巴巴副總裁、阿里大文娛優酷CTO莊卓然表示:“世界杯直播是阿里將機器智能大規模應用于文娛產業各領域的一個縮影。從高質量多媒體內容的智能生產、大規模網絡資源的智能調度、到實時流媒體的智能編碼與動態渲染,背后都有機器智能的參與。”
AI技術全面服務于內容生產各環節
此前,莊卓然曾公開表示,“文娛行業正處在發生巨變的前夜,而技術的發展正是推動這次變革的推手,尤其是在中國。世界杯只是一個縮影,技術對內容產業的影響是多元的,隨著機器智能、大數據、云計算的發展成熟,我們深刻的意識到,內容產業的每一個環節都將迎來新的一輪升級。”
據莊卓然介紹,高頻運動畫面的清晰度和流暢度一直是互聯網體育賽事直播最大的挑戰,而在本次世界杯直播中,優酷技術團隊利用在流媒體處理和網絡分發領域的深度積累,結合近年來在機器智能技術的沉淀和突破,創新性地將廣電專業鏈路同互聯網流媒體智能基礎設施結合,形成AI時代的“智能媒體大腦”,包括:智能編解碼、智能調度、智能交互、智能處理、智能生產五大引擎,全面覆蓋實時流媒體內容的生產、分發、消費與交互場景,保證了隨時隨地觀看高清、流暢直播的一體化體驗首次在互聯網端實現。
其中優酷世界杯直播受到一致好評的高清晰度背后就是智能編解碼引擎的作用,該技術還有一個名字“窄帶高清2.0”,已在優酷平臺廣泛應用,本次優酷技術團隊又針對賽事直播景基于機器學習優化了特有的編碼策略,比如足球、草地、球員分別采用特別編碼策略進行優化,大幅提升了比賽畫面的層次感和通透性。
隨著機器智能、大數據、云計算的發展成熟,內容產業的每一個環節都將引來新的一輪升級。莊卓然表示,“在AI驅動下,優酷的整個內容采買、策劃、運營、甚至廣告營銷體系都完成了重塑”。
“內容產業會進入到一個更加智能的時代,一個更加個性化多元化的時代,一個更加極致體驗的時代。” 莊卓然表示,正式進入阿里經濟體兩年后,經過技術基礎設施、人才團隊和商業生態的進一步融合,優酷正在努力抓住這一機遇,加速落地好萊塢+硅谷模式,積極推動中國式創新,迎接中國文娛行業走向世界巔峰的新機遇。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】