小娜走了,微軟小冰又來了,語音助手到底有沒有用
繼 Win10 2004 版將 Cortana 和系統搜索功能剝離,作為可卸載的獨立應用程序之后,微軟又正式宣布終止對第三方 Cortana 的技術支持。iOS 和 Android 版本的 APP 將會在應用商店下架;哈曼卡頓 Invoke 音箱和第一代 Surface 耳機中集成的 Cortana 也計劃在明年年初結束支持,受影響的用戶將得到 25-50 美元的微軟禮品卡作為補償。
根據計劃,Cortana 將繼續集成在 Microsoft 365 應用中 " 轉向具有變革性 AI 驅動的助手體驗 ",微軟的 Cortana 語音助手從去年開始的戰略性收縮到現在終于塵埃落定,煩人的的小娜再也 " 吶 " 不動了。
01 注定悲劇的小娜終于走了
和現在 Win10 上人人喊打,爭相在網上搜索卸載方法的小娜不同,6 年前發布的 Cortana(中文名:微軟小娜)是全球第一款智能語音助手。Cortana 不僅能幫用戶完成打開第三方應用、查找文件、收發郵件等日常應用,還可以唱唱歌,念念古詩,這樣 " 智能 " 的語音助手在當時無疑是黑科技級別的產品,比兩年后問世時還答非所問的 Siri 聰明太多。
Cortana 的名字源于微軟旗下《光環》系列游戲("Halo")的女主角,在游戲中,Cortana 就是一位陪伴主角的人工智能。這個在讓人們快速了解 Cortana 功能的同時,對《光環》粉絲和游戲宅也有巨大的吸引力。在技術上小娜被設計為云端驅動,智能運算都依托于云服務器完成,終端只做輕量級的整合,這也是現在主流語音助手實現的原理,這樣的設計十分適合打造成跨平臺的服務。
而當時微軟 Cortana 的主要的應用對象就是手機,2013 年微軟才收購了諾基亞的手機業務,準備在 Window Phone 手機上一展宏圖。最初的 Cortana 就能通過語音命令實現撥打電話、發送短信、做筆記、音樂識別和簡單的對話,并和自家 PC 系統組成生態,成為革新 Windows 未來操作系統之計劃的關鍵組成部分。
可是現在大部分使用智能手機的人,都沒來得及和小娜在手機端產生一句對話。Cortana 發布的當年,WP 手機就遭遇了市場份額的下滑,截止 2016 年 WP 手機的市場份額僅占 0.5%。到了現在,除了堅持情懷的極客和收藏家,大街上恐怕再也找不出一部 Lumia 手機。《光環》里 Cortana 為了拯救士官長最終選擇犧牲自己,而現實中需要 Cortana 保護的 WP 手機已經徹底消逝了,Cortana 事實上也跟著 WP 手機在四年前一起被 " 殺 " 掉了。

02 困于終端,把希望寄托于對手平臺
失去 Windows Phone 系統的 Cortana 不得不在其他平臺上尋找存在感。2015 年 5 月 26 日,微軟決定把小娜推廣到 Android 和 iOS 系統,的的確確實現了 " 全球首款跨平臺智能個人助理 " 的定位。微軟希望借著這兩家系統平臺龐大的用戶數量來繼續推進 Cortana 的普及,從后面的表現來看,微軟的理想顯然是豐滿的。
語音助手在技術上除了要實現高精度的語音識別之外,還要根據識別出的命令完成特定功能來滿足使用者的需求。這就要求語音助手要獲得足夠的系統控制權限,在 Windows 系統內 Cortana 當然擁有足夠多的權限,讀取信息,發送郵件,調用底層硬件等等這些都是可以完成的。而作為應用程序移植到 Android 或者 iOS 上之后,不僅會遇到權限問題,就連以低耗電量保持后臺語音喚醒都沒辦法保證,總不可能讓每個下載 Cortana 的用戶都 Root、越獄吧。
其次 Android 和 iOS 系統上都預裝了語音助手,廠商也不可能放著自家產品不管而去推廣競爭對手微軟的語音助手。而且此時的谷歌語音助手 Google Assistant 的技術已經要領先于 Cortana 了,這對用戶而言就更沒有去下載 Cortana 的理由和動力了。除了有想體驗一把 Cortana 手機端的小伙伴曾經在商店里扒一扒,大多數人可能直到微軟宣布從應用市場下架,都不知道 App Store 里還藏了個 Cortana。

03 后知后覺,推出智能音箱 Invoke
在微軟把 Cortana 推廣到其他平臺的時候,后發的谷歌語音助手 Google Assistant 的技術卻超過 Cortana 不是因為谷歌技術更強大,而是因為谷歌更早重視起了硬件生態。在微軟發布 Cortana 僅 7 個月之后,沒有手機平臺作為支撐的亞馬遜,發布 Echo 系列智能音箱。發售當年,Echo 的出貨量就達到了 250 萬臺,2016 年銷量更是翻倍,達到 520 萬臺。
時間回到 2014 年,微軟被問道是否會登陸其他平臺時,Cortana 發明人之一的馬庫斯 · 艾什(Marcus Ash)表示:" 只會在 Windows Phone 版 Cortana 徹底成熟之后才可能考慮其它平臺,也不會考慮為 iOS 和 Android 的深度整合而開發底層訪問功能 "。
語音助手的進化是靠海量的數據堆出來的,而微軟很長一段時間里寄托的 WP 手機,在頂峰時的市場占有率也不過只有區區 3%。到最后跨平臺碰壁,醒悟過來的微軟終于發布了和曼哈卡頓聯合推出的智能音箱 Invoke。這時候時間都已經來到了 2017 年,國外亞馬遜和谷歌的智能音箱已經占了占據了市場份額的半壁江山;國內天貓精靈、小米 AI 和百度等智能音箱也開始井噴式發展。微軟僅僅想靠一款 199 美元高價格的智能音箱來挽回之前 Cortana 一系列的失誤,Cortana 從最開始到最后都是走在被微軟 " 殺死 " 的路上。

04 你有經常使用語音助手嗎?
小娜雖然從移動端和 PC 端上離開了,但不代表微軟就徹底放棄了語音交互這個未來入口,從微軟公布的消息也可以看到 Cortana 還會集成在 Microsoft 365 應用中作為語音助理工具,在 Xbox 平臺也會保留 Cortana 作為社交輔助,為再起做準備。這種助理向的語音助手在未來商業辦公的確能起到提升生產力的作用,搜索功能就是此前 PC 端用戶使用 Cortana 最常用的場景。
像我們平時直接在 Win10 菜單里面進行搜索其實也可以通過 Cortana 搜索框提取存儲在 Outlook 電郵、通訊錄、日歷應用、網絡中的數據。這種輸入文本的方式本來只是 Cortana 在不方便使用者說話或者識別率不高時的備用方案,不過卻成了 Cortana 在 PC 端的主要使用方式,這一方面也體現了語音助手識別率和效率的問題。
而在手機端上就算是識別率更高的 Siri 和 Google Assistant 也不見得有更高的使用率,據 SUMO Heavy 2019 年發布的一份調查報告顯示,智能手機上語音助手使用率低于之前的預期。有近一半的用戶從沒使用過智能手機上的語音助手,日常使用活躍用戶僅為 16%。這還是語音助手已經出現 5 年,并在市場中大力普及語音助手之后的調查結果,可想而知當年微軟想通過 WP 手機來推廣 Cortana 的想法有多天真。

05 不那么 " 智障 " 的小冰妹妹來了
和亞馬遜的 Alex 建議主人自殺一樣,現在的智能語音助手多多少少都有點人工智障的樣子。不少廠家也把這個傻萌的特性當作自家語音助手的風格,包括像 Siri、小愛同學、小度等在語言調教上都各有各的特點。如果不執著于提升生產力這一點上,一個有趣、能逗主人開心的語音助手可能會更受用戶歡迎,可行性也更高。
微軟小娜的妹妹小冰就是個例子。微軟小冰是由微軟 2014 年 5 月正式推出的融合了自然語言處理、計算機語音和計算機視覺等技術的完備的人工智能底層框架。從描述上來看和 Cortana 這種語音助手沒有什么區別,不過小冰最開始的就是設計為即時聊天而生的。
和當時偏重 IQ 的語音助手不同,小冰劍走偏鋒的選擇了 EQ 路線。與還在和用戶進行著親戚般交流、尬聊的其他語音助手相比,小冰彷佛一出生就有談笑風生的能力。無論拋出什么問題和梗小冰都能穩穩接住,在微信公測時小冰可以作為群成員加入聊天,還可以根據對話完成微信群的操作指令。
重要的是,通過和用戶交流學習,會形成一個個獨一無二的小冰。不過正是因為小冰的學習能力太強,一些微信群里的小冰變成了愛罵人的祖安少女等等,微軟不得不降低小冰的能力,最后關閉了微信公眾號和公測。盡管如此,小冰還是大受歡迎,除了和其他語音助手進行合作之外,還參與文學創作,出版了歷史上第一部由人工智能創作的詩集《陽光失了玻璃窗》。積極推進包括主持人、金融摘要撰寫人、歌手、畫家等社會化角色的建立,現在在微博上粉絲達到了 510 萬人。


06 你期待的語音助手長什么樣?
之所以要強調聰明的小冰,是因為小編認為,未來的 Cortana 應該是小娜和小冰的結合和體。而在這之前,包括 Cortana 在內的語音助手都要先走攢 EQ 的路線。最開始就說了,語音助手的進化是靠海量的數據堆出來的,而這就決定了傳統語音助手講究任務性的交互,在用戶數據量上實際是不夠的。這就導致了在語音識別率和理解能力上進步緩慢,像用戶和 Cortana 這種通過 " 手勢 " 交流的方式,就讓 Cortana 的識別率不增反降。
只有當語音助手風趣化、個性化之后才能更大化的調動用戶和語音助手之間互動的積極性,而且互動方式也不需要局限于語音,輔以文字對話的方式可以消解不少和機器對話的尷尬感。看似沒有意義的講笑話和侃大山所收集的信息的廣度和深度不是簡單的功能性對話可以相比的,小愛同學聯合小冰就是朝著這個方向在發展。通過海量數據來促進語音助手的進化也許是未來 Ai 交互革命的一個突破口。
通過和用戶頻繁發生對話所產生的數據一方面能反哺提高語音指令識別的準確性,另一方面在培養用戶習慣上也有巨大的優勢。但理想是美好的,現實中光要做到語音助手 " 有趣 " 背后不知道要花多大的力氣。除了巨量的交互數據之外還要有一個足夠強大底層框架來實現反饋分析和改進,畢竟不是每個公司都能開發出一個小冰。未來的 Cortana 也不是簡單的設置行程,發發郵件就能重新崛起的,是要再撿起小冰還是另辟蹊徑,我們拭目以待吧。