上帝視角解讀最強AI人工智能手機iPhone X
舉世矚目的 iPhone X 終于來了,拋開僅僅是為了湊版本號而命名的 iPhone 8,十周年特別版簡直吊足了大家的胃口。就在今天凌晨,神秘的面紗終于揭曉。首先通過一個 40 秒小視頻回顧蘋果 iPhone X 發布會!
iPhone X 的那些黑科技
01.iPhone X 備受關注的臉部識別
隨著人工智能技術的突破和發展,面部識別應該屬于普及最快的領域之一,在中國,我們已經可以在火車站、銀行、考勤機、手機 APP 等很多地方體驗到這項技術。
這次蘋果公司新發布的 iPhone X 取消了指紋識別和 Home 按鍵,手機解鎖全部交由臉部識別來完成。
我們可以看著手機,它會自動識別你的臉并自動解鎖,蘋果公司營銷高級副總裁菲爾·席勒(Phil Schiller)說:Face ID 是解鎖手機和保護用戶信息的未來。
根據蘋果在發布會現場的介紹,蘋果的人臉識別解鎖 Face ID 包含了 9 大特點:
- 人臉驗證 (Face authentication)
- TrueDepth 攝像頭
- 驗證簡便
- 專門的神經網絡
- 自然和安全
- 用戶隱私
- 注意力察覺
- 自適應性
- Apple Pay和其他應用的綁定
蘋果集成了 8 個傳感器,通過紅外鏡頭、泛光感應元件行業點陣投影器來實現 Face ID 的面部識別。
蘋果對外表示 Touch ID 被隨機破解的概率是五萬分之一,Face ID 是一百萬分之一,為的就是強調 FaceID 的安全性。另外,數據的處理都是在設備上進行的,解鎖會通過識別用戶的注意力來進行判斷。
不過,人臉識別的共性問題還是需要大家多注意,比如你有一個雙胞胎姐妹或者你打算整容,這還是會難倒 Face ID,蘋果建議使用密碼解鎖。
說了這么多,流暢和易用的人臉識別解鎖是怎么做到的呢?該技術采用了 TrueDepth 相機技術及其配置的相應子系統,其中包括紅外傳感器,照明器,點陣投影儀,距離傳感器和環境光線傳感器等各種傳感器設備。
當用戶看著手機時,它會向面部投射 30000 個不可見的 IR 點,相機會捕捉并拍攝圖像,然后將其與存儲的面部圖像進行對比,這一切都是實時發生的。
這個功能整合了神經網絡技術以及其他傳感器技術,能夠有效區分不同面部,并且辨別手機前的人像是否只是一張照片(拿照片騙機器的問題曾引來央視 315 的質疑),它也可以檢測到用戶是否戴著口罩。
所以,無論你是睡眼朦朧還是帶了首飾和帽子,都不會影響 iPhone X 的響應,不得不說,易用性和速度如果得到解決,手機解鎖又將進步到一個全新的階段。

通過深度攝像頭系統,iPhone X 還有一個有趣的應用——Animoji 動畫式表情,讓 3D 的表情包和你的面部同步,追蹤面部肌肉的變化,以后微信斗圖有新玩法了!
劃重點了啊,大家注意了!最值得吐槽的來了:Face ID
沒想到,一演示立馬失敗,隔著屏幕都替他尷尬。(其實是首次開機要輸密碼鵝以)不過,更讓人黑人問號臉的馬上又來了:
大家都說,看來蘋果打算徹底放棄韓國市場,不然遇到這種撞臉的情況,你告訴我怎么解決……
進入下一個功能,雙擊電源鍵喚醒 Apple Pay 也能通過 Face ID 支付。
為了防止盜刷,蘋果與好萊塢模型團隊進行了人臉模型對比驗證,以保證 Face ID 所識別的人臉不能被任何仿制品所替代,包括栩栩如生的蠟像。
02.新 iPhone 超時髦的 AR 功能
此前,有評論認為,AR 有望成為智能手機的下一個殺手級功能,在未來 3 年可能將創造4040億美元的市場機會。
這次,蘋果全球營銷高級副總裁 Phil Schiller 在發布會上說,A11 仿生芯片是目前最強大的智能手機芯片。
基于此,iPhone X應該是第一款真正為 AR 打造的智能手機,手機的攝像頭專門為增強現實功能而校準,全新陀螺儀和加速計,刷新率達到 60 fps,并且有準確的動作追蹤。
Snapchat 上演示基于這種深度攝像頭系統的 AR 濾鏡,追蹤質量很好
目前,AR 功能以及游戲將逐步在蘋果應用商店上線,《Skyguid》可以讓你把手機對準天空出現星座信息;《At Bat》可以看到棒球比賽現場的疊加 AR 信息;《Warhammer 40k:Free Blade》的AR版可以讓玩家通過手機與虛擬人物對戰。
蘋果第一篇公開的人工智能論文
關于人臉識別,CVPR 2017 最佳論文
蘋果在 7 月 20 日推出名為 Apple Machine Learning Journal 的新研究博客,對蘋果來說,做一個專門介紹他們的人工智能研究論文的博客還是挺新鮮的,因為蘋果通常不會公開談論他們的研究項目。
該博客發表的第一篇文章是關于如何將合成的圖像變得更逼真,以用于訓練神經網絡。
這也是蘋果于去年年底在 arXiv 發布的第一篇 AI 論文“Learning from Simulated and Unsupervised Images through Adversarial Training”的介紹,這篇論文在 CVPR 2017 獲得 best paper。
根據這篇文章,蘋果要訓練神經網絡來檢測照片上的人臉和其他物體。但蘋果的方法不是制造擁有數百萬計圖像樣本的巨大的數據集來訓練神經網絡,而是創建由計算機生成的人物的合成圖像,并應用一個過濾器使這些合成圖像更逼真。
這比一般的方法訓練神經網絡的成本更低,而且速度更快。
在機器學習研究中,使用計算機生成的圖像(例如電子游戲中的)訓練神經網絡比使用現實世界的圖像更高效。
因為生成的圖像數據都是有標簽和注釋的,而真實圖片的數據需要耗費人力標注計算機所看的東西,告訴它這是一棵樹,一只狗,一輛自行車等等。
但是生成圖片的方法也有問題,因為這讓算法所學到的東西并不總是能無縫轉移到真實場景。生成圖片的數據“常常不那么真實,導致神經網絡只學習生成圖片的細節,卻無法在真實圖片上很好地遷移。”蘋果的論文如是說。
論文中用于舉例的“未標注的真實圖像”、“合成的圖像”、“精細化的圖像”等都是人的眼睛圖片,或許,iPhone X 的 Face ID 新功能正是有利用這一方法,以及更多蘋果沒有公開的研究成果?
圖:模型使用未標注的真實數據,利用模擬器改善合成圖像的真實性,同時保留注釋信息
更聰明的Siri
蘋果機器學習博客接著在 8 月連著發表 3 篇來自 Siri 團隊的技術文章,分別是:
- 通過跨帶寬和跨語言初始化改進神經網絡聲學模型(Improving Neural Network Acoustic Models by Cross-bandwidth and Cross-lingual Initialization)
- 反文本歸一化作為標簽問題(Inverse Text Normalization as a Labeling Problem)
- Siri聲音的深度學習:為混合單元選擇合成的設備上深度混合密度模型(Deep Learning for Siri’s Voice: On-device Deep Mixture Density Networks for Hybrid Unit Selection Synthesis)
三篇文章題目看起來都非常高深,介紹了 Siri 背后的技術進步。其中第一篇文章討論利用聲學模型數據的遷移學習技術,以顯著提升新的語言版本 Siri 的精確度,讓 Siri 支持更多語言。
第二篇介紹 Siri 如何利用機器學習格式化地顯示日期、時間、地點等。第三篇則更綜合地介紹 Siri 聲音的進化,探討如何利用深度學習讓 Siri 更會說話。
具體來說,Siri 在 2014 年中推出一個新的語音識別引擎,使用深度神經網絡(DNN)。先是用于美國英語,到 2015 年中擴展到 13 種語言。
為了順利擴展到其他語言,蘋果研究人員需要使用有限的轉錄數據(transcribed data)來解決構建高質量的聲學模型的問題。
他們提出使用帶限(band-limit)相對更多、更易于收集的寬帶音頻來解決較少量的窄帶藍牙音頻問題。他們在遷移學習框架之上使用了神經網絡初始化。
圖:在窄帶藍牙測試上的詞錯率
圖:跨語言初始化
另一值得一提的是 Siri 的文本轉語音(TTS)系統:
從 iOS 9 到 iOS 11,Siri 的聲音對比
iPhone X 背后,人工智能風口已經引爆
iPhone X (iPhone 10)這款用人臉識別進行解鎖的新 iPhone 可能是蘋果 AI 屬性最強的一個產品了。在發布會現場,蘋果介紹了“A11 生物神經網絡引擎”這一 AI 芯片。近期,以智能手機為主的終端設備定制芯片已經形成一種新的趨勢。
前不久,華為自家全新一代手機 Soc 處理器——麒麟(Kirin)970 芯片在德國正式發布,它同時還是第一款帶有 AI 的手機芯片,而搭載麒麟 970 的全新旗艦手機 Mate10 系列,將在今年 10 月16 號在德國慕尼黑正式發布。
華為,也是首個發布 AI 芯片并真正將 AI 技術引入移動終端的廠商……這一舉動很可能使 AI 真正進入普及階段,并打開手機新世界的大門。
隨著華為、小米等國產手機品牌的崛起,蘋果在中國市場的份額正不斷下滑,如此看來,買不買 iPhone,還真不是它貴不貴的問題了!
十年過去了,果粉對 iPhone 的狂熱已不復當年,iPhone 想要再造神話,也正面臨前所未有的挑戰。
但很明顯,如何利用人工智能釋放出更多功能、更多能力,已經成為手機發展的下一個戰場。
在當前手機同質化的困境中,AI 技術被看成行業可能的突破點。作為未來科技最重要的領域之一,人工智能風口有望被蘋果引爆。
今年以來,蘋果加強了在人工智能領域的研發。蘋果的競爭對手 Alphabet、微軟以及 Facebook 也一直在招募人工智能方面的人才,華為在 AI 方面也不甘落后,其麒麟 970 手機芯片將與蘋果的“Apple Neural Engine”的 AI 專用芯片正面交鋒。
隨著人工智能時代的來臨,各家科技巨頭都開始了第一輪的布局,科技巨頭在行業趨勢判斷上的一致性,或預示著 AI 元年已經到來。