谷歌開測語音支付,張嘴付錢真能現實嗎
隨著技術的進步,如今移動支付的手段也早已呈現出日新月異的景象,從早前輸入繁瑣的密碼,現在已經有了更加方便安全的指紋與人臉識別。不過現在在智能手機上已經很常見的聲紋識別,卻很少被應用到支付領域。而在近日有消息顯示,谷歌方面已經開始著手在旗下產品中,落地這項“張嘴就能付錢”的語音支付功能。
據相關媒體的報道顯示,目前谷歌已經正在測試一項新功能,將允許消費者使用語音匹配(Voice Match)進行授權確認支付。而谷歌方面也證實,并不是所有的購買都會提供語音識別,現階段這項功能僅適用于APP內購與餐廳訂單,并不適用于谷歌購物(Google Shopping)。
按照該報道中的說法,這一語音支付功能原本計劃在今年I/O開發者大會上發布,但由于疫情的原因只能跳過發布直接開始測試。目前在位于Google Assistant (谷歌語音助手)的支付界面中,就能看到“Confirm with Voice Match”的選擇。
事實上,語音支付這項技術其實并不新潮,甚至于比語音助手所依賴的自然語言處理(NLP)更加古老。沒錯,語音支付與自然語言處理盡管說都與語音相關,但二者卻有著天壤之別,語音支付的本質是進行聲紋識別,但聲紋識別顯然并不等于語音識別。
而聲波傳輸是利用聲音作為傳輸方式的一種數據通信模式,比如我們說話的過程,就可以理解為把信號編碼成聲音的過程。而聆聽的過程,則是把音頻信號解碼成語言文字的過程,所使用的漢字與拼音之間的對應關系,其實就相當于是音頻協議。
但聲紋識別則是個性識別,需要通過提取語音中的聲紋特性,判斷說話的人是誰,也就是解決“誰在說話”的問題。而語音識別是共性識別,判斷的是說話的內容,解決“說了什么”的問題。顯而易見,在語音支付中最重要的,是判斷說出支付命令的人是誰。
由于每個人的發聲器官在尺寸與形態方面大概率不會完全一致,因此這些差異也導致了發聲氣流的改變,進而產生了聲紋的差異。所以我們才能“未見其人,先聞其聲”,通過音色、音調和說話習慣,可以判斷聲音主人的身份,因此同理也能用算法提取語音信息中明顯的、抽象高維的聲紋特征,并用深度學習來訓練模型,進而利用具備獨特性的生物特征,來證明“我是我自己”這樣的命題。
事實上,使用聲紋識別來完成語音支付的過程很簡單。就是用戶發出帶有確定命令的聲波,終端設備獲取這一聲波并轉化為會話(Session),并將具體的商品信息以及交易號發送到谷歌后臺,其在服務器端匹配了聲紋信息后就能開始進行交易操作,最后再將完成交易的信息,推送到谷歌語音助手中。
而在谷歌此次確認測試語音支付之前,亞馬遜方面在去年秋天就已經開始允許用戶使用語音命令在自家的Alexa上支付賬單,一旦用戶使用類似“ Alexa,支付我的移動賬單”來批準交易,Alexa將使用Amazon Pay支付賬單金額,并通過用戶注冊的手機號碼發送確認。此外,國內市場的天貓精靈也早已可以使用語音支付,根據阿里方面公布的數據顯示,僅在去年雙十一期間,天貓精靈上就共有105萬筆訂單是通過說話的方式支付成功。
不過谷歌想要實現的,顯然并不僅僅是在自家Google Home智能音箱上使用語音支付,而是瞄準了適配場景更為廣闊的智能語音助手。不過谷歌能想到的,亞馬遜與阿里難道想不到嗎?在智能語音助手上全面接入語音支付,毫無疑問會大幅度提升用戶的使用體驗,畢竟相比于人臉與指紋識別,聲紋識別的便捷性要高得多。
但亞馬遜與阿里選擇將這一功能局限到智能音箱這種通常放在家中的設備上,其實極有可能是有一番深意的。語音相比于指紋或者面部信息來說由于有著可控性更低的因素,畢竟用戶可以自主決定是將手指放在指紋識別模塊上,或將臉放在鏡頭前,但卻無法這樣控制聲音的傳播。
更為重要的一點是,指紋信息很難被采集,面部識別通常需要配備活體檢測,但是聲紋識別不僅很容易收集,同時也很難判斷用戶在說出支付命令時的狀態。再加上如今AI技術已經全面擴散,通過深度學習模型、波形編輯工具,拼接出指定內容的語音數據,幾乎完全可以復刻出用戶的聲紋頻譜。
并且語音支付的安全問題不僅僅只出現在客戶端,服務端同樣面臨也有一定的風險。語音支付可以看做是一次數據交互,例如cookie機制所采用的是在客戶端保持狀態的方案,而Session(會話)機制采用的是在服務器端保持狀態的方案,在用戶第一次訪問服務器時會為客戶端創建一個Session,并通過特殊算法算出一個Session的ID,用于標識對象。
然而由于語音支付并不是一次性行為,用戶下次與服務器進行數據交互就需要通過SessionID來完成。然而,SessionID的實現機制導致了其可能會遭到劫持,比如說經典的XSS跨站點腳本攻擊、網絡嗅探、代理人劫持等不同攻擊模式,如果SessionID被劫持,黑客就能獲得目標用戶的合法會話,那么接下來就能像信用卡盜刷一樣掏空被盜者的錢包。
因此這或許也是谷歌自己坦言,如果反饋與性能都太過負面,該功能甚至可能不會向公眾推出的重要原因之一。因此在谷歌沒有解決至關重要的安全性問題之前,想要張張嘴就能完成購物體驗,或許暫時只能在智能音箱上得以實現了。