?嘉賓丨李本陽
撰稿丨千山
有人認為,在大數據時代每天都有海量信息產生,迅速捕獲感興趣的內容越來越難,因此智能推薦是必不可少的工具。也有人不以為然,認為這種基于用戶畫像分析的推薦形式會加速信息繭房的形成,隱形攫取了個人對于信息的主動選擇權。
如何看待智能推薦這些年的發展?知識圖譜的構建如何為個性化推薦帶來更多可能?目前有關算法規制的討論會給未來帶來哪些影響?圍繞這些議題,《技術人訪談錄》特邀汽車之家智能推薦內容理解團隊負責人李本陽,聊一聊這些年他在這一領域的成長、觀察和反思。
1、抉擇:做最壞的打算,然后靜待收獲
你將面臨的最大陷阱是誤認為那些幫助你達到這個新職位的成功經驗仍然有效。
——邁克爾?沃特金斯《最初的90天》
畢業于哈爾濱工業大學的李本陽在求學期間就擇定了自然語言處理(NLP)作為專業方向,此后的職場生涯也專注AI方向,不斷在自然語言處理、知識圖譜、大數據計算、個性化推薦等方向積累實踐經驗。
談到選擇NLP的原因,李本陽首先提到了少年時的興趣。“我一直很喜歡對底層邏輯的探究,比如高中時候喜歡物理,喜歡研究我們所在世界的運行機理;上大學的時候,常常類比機器和人的差異,更想探究智能的機理。”
另外,良師的引導也影響至深。“(當時)受哈工大關毅老師影響,常說NLP有我們一生都研究不完的課題,所以就選擇了這條路。后來(工作了)也一直沿著這個方向在走。”
正式工作以后,李本陽進入百度,從工程師做起,逐漸成長為百度新聞產品技術負責人,后又出走大廠,先后進入大數據創業公司、醫療科技公司擔任技術高管,直到如今在汽車之家帶領智能推薦內容理解團隊。
回顧一路履跡,李本陽顯得淡然和審慎。他認為,作為一個技術人,期間經歷的諸多轉折“相信很多人也經歷過,或者未來也會有相近的軌跡”。通常來說,工作初期會更注重學習和職業化,成長后會開始權衡技術與管理的平衡。
至于選擇大廠還是創業公司,李本陽談到:“對我來說,大廠資源多,規范性更好,相應的目標拆解也更細致,也有更多團隊成果的積累,但是通常來說,每個人離公司整體的大目標更遠一些,所處的階段也更加穩定。而身處創業公司,很多工作都是從0開始,由于團隊規模比較小,大部分事情都要從基礎開始做,相應的變化也會更快。”
當年李本陽之所以從大廠出來,選擇了一家創業公司,主要原因是“想經歷一下公司發展的不同階段,同時也想在這個過程中拓展自己的視野”。這并非一時興起或熱血上頭,對于風險,他也進行了謹慎的預判。“我也評估過如果加入創業公司,公司沒有成功的話,代價是否是我和我的家庭能承受的,這一點非常重要。做最壞的打算,剩下就是收獲了。”
不過對于多數剛入職場的新人來說,李本陽認為“最好還是先去大公司歷練一下”,以便養成更好的職業習慣,觀察大廠的運作機制,這對未來成長會有更多幫助,后續再做其他選擇也會更加得心應手。
面對環境的變化,固有的經驗可能并不適用,如何讓自己的職業技能與不同行業快速融合,李本陽也給出了個人的一些建議。
- 保持學習心態,尤其是跨領域,能夠快速學習掌握行業知識,以及技術結合點。
- 盡量避免頻繁地跨行業,最好能讓自己之前積累的技術和經驗在新領域依然有所發揮,這樣也能減少對自身的消耗。當然所有經歷都是寶貴的財富,關鍵要在得失之間做好取舍。
- 技術本身是具有通用性的,保持技術競爭力。
- 充分了解行業現狀和背景知識,跟業內深耕多年的人多加交流,避免信息的不對稱導致的失敗。
彩蛋Q&A
技術人訪談錄:最近有沒有推薦的書單?
李本陽:在基礎技術方面,我推薦邱錫鵬教授的《神經網絡與深度學習》。對于職業遷移變化比較大的人,可能會思考如何快速融入職場角色,如何在變遷中快速落地,我推薦邁克爾?沃特金斯的《最初的90天》,這本書應該會對你有所幫助。目前我正在看的一本書是金惟純的《人生只有一件事》。
2、反思:以汽車為中心構建知識圖譜的實踐
人工智能是我們人類正在從事的最為深刻的研究方向之一,甚至要比火與電還更加深刻。
——桑德爾·皮猜
技術的變化日新月異,智能推薦領域也不例外。在李本陽看來,近幾年智能推薦要解決的問題總體來說變化不大,常見的諸如冷啟動、推薦準確、多樣性等等,但在方法上變化卻很快,比如多目標優化/多任務學習、多模態融合推薦、基于用戶行為序列的學習方法、結合圖譜知識圖譜特征學習等。
而在推薦系統中,“內容理解”是不可或缺的部分。在門戶網站時代,門戶通過 "內容類型" 對內容進行整理,然后以頻道頁形式滿足用戶需求;在搜索/社交時代,搜索除了需要分類信息以外,還需要精確知道文本內容是 "關于什么的",關鍵詞技術很好地解決了這個需求,谷歌在2012年提出的知識圖譜概念又為解決實體歧義問題找到了可行路徑。那么在智能時代,在內容理解方面又有哪些新的解決方案呢?
李本陽簡要介紹了他目前帶領的內容理解團隊主攻的三大方向:
- 內容刻畫:包括對內容標簽體系,分類、概念標簽、興趣詞標簽,質量:先驗、后驗質量;低質識別等,相似計算內容相似,圖片相似,情感分析。
- 內容生態:通過前面的多維度標簽和質量刻畫,分析內容生產和用戶消費的關系,促進生產更多用戶喜歡的內容,促進內容生態的不斷提升。
- 知識圖譜建立:圍繞以車中心的語義圖譜,支持更多應用場景。
對于知識圖譜的建立這一點,李本陽作了進一步補充。他提到,相比傳統的推薦方式,算法推薦其實更為多元化,而且算法推薦除了要推得準確,還要進行多層面探索,增加多樣性,從而給用戶驚喜,破除信息繭房。“這里的探索也不應該是無目的的隨機探索。知識圖譜的多個實體關系,能更好地挖掘用戶可能偏好的內容,為進一步探索帶來更多可能。”
李本陽解釋:“除了用戶看到的物料內容本身,知識圖譜能夠帶來額外的知識。比如看到奧迪某款車,通過知識圖譜可以向上探索其是否喜歡德系車,是否喜歡同價位的車,是否喜歡同品牌的車等等。而且也可以使用圖的embedding,豐富item/user的表示等,從而能給出更好的結果。”
汽車之家作為由導購、資訊、評測、口碑等多個板塊組成的汽車服務類平臺,在看、選、買、用等維度積累了大量的汽車數據。在此基礎上,其技術團隊構建了以汽車為核心的知識圖譜,為更多應用場景提供支撐。
知識圖譜是真實世界的語義表示,圖譜構建過程中通常會面臨較大的挑戰。而且面向推薦的汽車知識圖譜構建有其特殊性,對此,李本陽梳理了團隊在實踐過程中遇到的難點和特點。
- 汽車領域擁有專業參數劃分和多領域技術,所以如何讓大眾了解,而非專業了解,需要更多用戶維度的圖譜標簽構建,比如空間大、豪華、舒適、奶爸適用等等。
- 汽車是比較昂貴的商品, 用戶購買必然不同于電商,需要更長周期的比較和分析。在看、選、買、用過程中需要針對不同的場景構建。
- 除了買車,很多人對汽車本身也有濃厚的興趣,同時話題可能延伸到社會、科技、娛樂等多個方面,這就涉及到對于以車為載體的閱讀內容的興趣刻畫,比如對新能源技術感興趣、對換電、事故有關注等等。
實踐結果表明,通過構建知識圖譜,把以汽車為核心的內容進行組織和挖掘,提供豐富的知識信息,結構化精準刻畫興趣,支持推薦用戶冷啟、召回、排序、展示等多個維度,為業務提升帶來了積極效果。
彩蛋Q&A
技術人訪談錄:《互聯網信息服務算法推薦管理規定》于今年3月1日起實施,很多應用已陸續上線個性化推薦關閉鍵。在數據合規時代,算法推薦模式有沒有可能走向終結?
李本陽:我不認為算法推薦模式會走向終結,相反,《互聯網信息服務算法推薦管理規定》的出臺可以讓算法推薦模式更加穩健。一方面,它規范了推薦算法的應用,避免了大數據殺熟、誘導沉迷等亂象,設置了邊界,避免算法被濫用,另一方面,算法仍然有很大的發揮空間,可以在合理合規范圍內大展拳腳。
3、管理:溝通要站在對方的角度來闡述
把“對”讓給別人,把空間還給別人,不僅對別人有幫助,更有益于彼此的關系,何樂而不為?千萬別再說“早就跟你說過了”,尤其是對孩子和員工。?
——金惟純《人生只有一件事》
從工程師到技術高管,李本陽經歷了從單純的技術人員到技術管理者的轉變。在他看來,這兩者有鮮明的角色差異。
“技術人員更多關注的是技術方向,是項目解決方案,是自己的產出。而管理者更聚焦的是整體目標和團隊產出,以及梯隊建設、向上匯報、團隊配合等若干事宜。兩者在思維和行為上的差異,都是由此產生的。所以技術偏縱深,而管理更多呈T字形,既要有自己擅長的技術點,又要兼顧協作等多方面的事情。”
在團隊協作中,溝通的藝術至關重要。李本陽分享了其在多年管理實踐中的心得:
- 團隊協作的基礎是有共同的目標,獲得共同的收益。如果不滿足需要更高層面的目標協同。
- 如果目標是一致的,在合作之初就要建立合作的分工和配合機制。這樣減少了過程中更多的問題,所謂“丑話說在前面”。
- 溝通要站在對方的角度上來闡述,說明給對方帶來的價值。這會讓對方更容易接受。
在團隊搭建上,李本陽也有一套自己選人用人的準則和評判標準。
“選人方面,我首先比較看重的是性格。我欣賞踏實的性格,這種踏實更多表現為靠譜,我能夠放心地把具體的事交給他。其次是專業能力,最后是未來的成長潛力。對于不同階段的人,看重的點也不同,比如剛畢業的同學,除了靠譜,更多還是看基本功和潛力。”
“用人方面,我是希望在完成團隊目標的基礎上,個人也能取得個人的成長。這應該是一個共贏的過程,所以我會規劃每個人的方向,希望他們專注于某個方向,在各自的方向深耕,同時要打造良好學習的氛圍,努力為團隊創造提升自己的空間。”
4、未來:推薦會更加多元、規范
在智能推薦領域,李本陽從一名新兵成長為老將,摸爬滾打多年,對于這一方向的未來,他也有自己的判斷。
其一,未來智能推薦會涉及到人的方方面面,除了以推薦信息流、商品的個性化,更多的將結合場景進行推薦,比如時間地點,使用應用相結合。
其二,推薦形式將更加多元化,包括內容多元,以及交互方式多元,通過交互增加顯示的興趣反饋等。
其三,推薦系統將更加規范化,避免濫用,同時在可解釋性方面也會做得更加深入,讓用戶更多地理解推薦的原因,人機結合也將更加密切。
此外,面對近年來關注度漸高的“算法黑箱”問題,李本陽認為關于“算法透明化”的呼聲有其正向意義。
“算法的透明,一方面是算法可解釋,另一方面把相關算法公開化,首先有助于人們加強相互理解,而不是猜測。同時,透明的算法也可以讓更多人依據算法提高效率,也有助于找到算法優化點迭代算法,從而提高參與各方的滿意度。”
李本陽汽車之家智能推薦內容理解團隊負責人
- 哈工大計算機本碩,自然語言處理方向
- 6年百度工作經驗,6年AI與行業結合創業經驗
- 歷任百度新聞產品技術負責人,大數據公司、醫療科技公司技術技術高管,現任汽車之家智能推薦內容理解團隊負責人
- 專注AI方向,在自然語言處理、知識圖譜、大數據計算、個性化推薦等方向有豐富積累