小度機器人成新晉最強大腦 計算能力超越AlphaGo
誰是世界上最強的大腦?在最新一期的《最強大腦4》中,百度研發的“小度機器人”成為公認“腦王”,不僅在人臉識別賽題中,僅根據童年照片比對就發現了蜜蜂少女隊中隱藏的同卵雙胞胎隊員,依靠萬分之一的區別概率選出了正確答案,令觀眾和網友嘆服。
在“小度”參與“人機大戰”前,機器與人類的PK多在下棋、答題等領域,從1997年IBM深藍戰勝卡斯帕羅夫起,似乎就意味著人類智力在棋類游戲中不敵人工智能。隨著人工智能的不斷進化,機器還會從程序運算走向抽象思維認知全新階段,在更多的領域超越人類。“小度”此次戰勝人類對手正是機器探索抽象思維認知的階段性成果。
代表棋類人工智能最高水平的AlphaGo緣何能輕松戰勝人類。曾有人道破天機:“AlphaGo一天對弈的棋局,比人類專業棋手一輩子下過的都要多得多!”從計算原理上來看,AlphaGo棋力精進主要依靠機器學習的一個分支——深度學習技術,能基于當前局勢,預測對手下一步落子,并計算棋局的不同走向。更重要的是,AlphaGo在挑戰李世石之前,已經在與人類棋手的對弈中學習了近萬盤棋局,而與自己“左右互搏”的棋局更是超過3000萬盤!如此龐大的對弈盤數,使得AlphaGo在對戰中妙手頻出讓對方陷入被動。
人臉識別與下棋大有不同。簡單說,人臉識別包含兩種技術:一種是1:1 的人臉比對,比如像銀行的應用場景,通過比對希望知道這張人臉是不是身份證上面的那個人;還有一種更通用的 1:N 人臉識別,N 可以是幾千、幾萬或者幾十萬進行比對,這叫 1:N 的比對或者是 1:N 的人臉識別。“小度”在《最強大腦4》中與名人堂輪值主席王峰PK時展現出的人工智能技術,則屬于第二種,而且是其中最復雜的跨年齡識別。
眾所周知,人類童年時的照片與成年后的臉部相比有明顯區別。雖然人腦傳承了祖先上百萬年積累的臉部識別天賦,但跨年齡識別仍是很難完成的挑戰。百度深度學習實驗室(IDL)科學家們選擇了用度量學習的方法破解這一難題,即通過學習非線性投影函數將圖像空間投影到特征空間中,在大量樣本中,縮小同一個人跨年齡的兩張人臉的距離。考慮到跨年齡人臉的稀缺性,IDL還采用了一個用大規模人臉數據訓練好的模型底座,并用跨年齡數據對其進行更新,從而大幅提升跨年齡識別的識別率。通俗一點說,“小度”采用的技術手段是在臉部骨骼上取盡可能多的采樣點,把其與需要篩選的大量人臉逐個比較。當然,雙胞胎由于骨骼相似差別細微,所以識別的難度也要比普通人更大。
技術原理看似輕描淡寫,實際情況是,盡管百度大腦經過了兩億多習題的人臉識別訓練,在該領域的能力目前世界領先,但跨年齡識別等技術對計算能力要求極高,“為了這次比賽,我們也收集了一些跨年齡的數據,根據跨年齡這個場景再進一步優化模型,跨年齡數據大概在幾千張這個級別,并不算特別的多。” 百度深度學習實驗室(IDL)主任林元慶表示“小度”獲勝并非易事,而且在現場識別人臉時,光照、人臉姿態、遮擋程度等因素會對人臉檢測帶來干擾,光照、表情、遮擋、年齡、模糊也會影響到人臉識別的精度,特別是面對年齡跨度較大的情況,由于缺乏兩個年齡中間的足夠數據,所以“小度”更難學習和掌握人臉的變化。
《最強大腦》科學顧問團首席顧問、北京師范大學心理學院院長劉嘉教授在觀看結果后,不無感慨:“我們《最強大腦》的選手真正是在和世界上最頂級的、甚至在某些程度上超過AlphaGo的人工智能進行對決。”
從AlphaGo到“小度”,人工智能正在從程序化運算走向抽象思維的認知的全新階段。“我們參與這次活動很重要的一個目的是希望能讓大眾能深切感覺到人工智能能做什么。” 林元慶表示,機器在一些能力上超過人是很正常的,但人工智想要整體全面地超越人類還有非常長的路要走,“小度”和百度人工智能的工作就是幫助人類完成更多創造性思維的任務。