人機交互技術的現狀與演變 將來我們將如何與機器對話
計算機和其他機器是出色的工具,可讓我們提高生產力,了解更多信息并保持相互聯系。但是,為了使用它們,我們需要以某種方式與它們“通信”。從歷史上看,這一直是使用鼠標和鍵盤(或觸摸屏)的手動輸入,使用屏幕讀取計算機返回給我們的內容。
在過去的十年左右的時間里,我們已經看到了一種新的與機器交談的方式:語音和語音識別。但是這種“與機器對話”的模式會持續到未來嗎?如果是這樣,它將如何發展?
技術現狀
首先,讓我們看一下現代技術的狀態。人們在日常的大部分互動中仍在使用鍵盤,鼠標和觸摸屏,但越來越多的人開始轉向基于語音的互動。我們可以用一個簡單的短語在流行的搜索引擎上運行搜索。我們可以大聲說出要輸入的內容,我們的手機可以將其翻譯成書面文字。我們甚至可以安裝可以與客戶交流或直接與他們互動的數字標牌。
多年來,基于語音的交互已經變得非常復雜。在這項技術發展的初期,它基本上是一場博弈。在大多數情況下,系統無法正確“聽到”您的聲音,或者會誤解您想說的話。但是如今,最受歡迎的數字助理和語音識別程序可以像人一樣準確地檢測和理解人的語音。
與此相符,人類逐漸習慣了基于語音的交互。在2010年,您可能對其中一臺設備說“ OK Google”或“ Hey Alexa”之類的內容很愚蠢。但是到2020年,這是司空見慣的。實際上,當我們看到某人不經常以某種方式與他們的機器進行交互時,這很奇怪。
為什么聲音已經被接管
為什么近年來語音識別取得如此可觀的增長和發展速度?有一些可能的解釋。首先,語音比起手來做任何事都更方便。如果您正在開車,并且想在輸入信息時將手放在方向盤上,則可以簡單地“大聲”思考并加以處理。如果您一整天的打字都感到手指酸痛,可以切換到基于語音的輸入,并讓您的手稍事休息。如果您在客廳附近沒有設備,并且需要在剛剛觀看的節目中知道演員的姓名,則可以大聲說出查詢內容,并在短時間內得到解決。
在技術發展方面,聲音也是很容易獲得的成果。正如我們將看到的,還有其他一些人機交互模式,它們更加復雜,可能需要數十年的時間才能全面發展,但實際上,我們已經在短短幾年內掌握了語音搜索。
消費者看到了好處,技術不斷進步。因此,為什么基于語音的與機器的交互已成為新規范是有道理的。
語音的潛在問題
也就是說,即使是長期來看,基于語音的機器交互也存在一些潛在問題:
- 數據隱私。每一項新技術都會帶來對隱私的擔憂。我們基于語音的搜索和語音識別技術很多時候都在我們身邊。我們的人身上有一部智能手機,客廳的角落里有一部智能揚聲器。當我們不希望這些系統時,這些系統是否在聽我們的對話?他們收集哪些數據并將其發送給技術公司的主管?
- 誤解。即使近年來發展迅速,語音識別也會失敗。當人們用口音講話時,或者由于各種原因而無法表達完整的思想時,尤其如此。
- 學習曲線。無障礙獲取也可能是一個問題,特別是對于那些仍在講話中掙扎的人們。為了獲得最佳效果,您必須以清晰,直接的聲音說話,并準確地表達每個單詞。這并非對所有用戶都直觀。
- 背景噪音。如果存在很大的背景噪音,那么高質量的語音識別仍然會變得混亂。這意味著語音識別僅在某些位置和上下文中是理想的;例如,您不能在搖滾音樂會或建筑工地上使用它。
- 心理影響。我們仍處于語音搜索的初期,但從長期來看,我們可能會發現基于語音的機器交互具有心理影響。例如,我們可能會發現很難與機器交談而不感到某種情感上的依戀,或者由于我們與機器的相互作用,我們可能會限制自己以不同的方式與世界互動。
如何改善聲音
科技公司一直在尋找可以改善語音交互并在競爭中脫穎而出的方法。這些是最重要的重點領域:
- 準確性。語音識別系統已經至少與人類一樣好,其中一些系統已經超越了人類的能力。但是,在準確性方面仍有改進的空間,特別是在邊緣情況下。
- 預測功能。 結合預測分析,基于語音和語音的交互可能會更加令人印象深刻。機器可以問我們提示性問題,而不是依靠我們的單向輸入,并就我們可能需要的東西提出積極的建議。
- 情感背景。同樣值得考慮的是在數字助理中發展情感情境閱讀,甚至在響應中模仿人類情感內容。例如,數字助理可以通過您的語氣告訴您生氣或恐懼,并且可以用一種技術模擬的同理心來回應您。盡管“令人毛骨悚然”的因素在這個維度上可能很高,但可能會導致更自然的互動。
語音替代
那么,我們是否將語音作為與機器交互的一種方式而離開呢?這還有待觀察,但是有一些競爭者有一天可以取代語音和手動輸入,即使它們距離全面開發還差很多年。
- 手勢。最有趣的可能發展之一是以手勢形式與機器通信。您可以以某種模式移動眼睛以調用特定功能,或者可以空中移動手指來操作全息界面,而不是明確指示設備應執行的操作。手勢是無聲的,比語音更抽象,從而使手勢在許多方面更簡單,更易于訪問。但是,學習曲線可能仍然很陡峭,并且該技術還沒有準備好成為主流。
- 想法。少數公司正在研究直接腦機交互的可能性。換句話說,您也許有一天可以只用自己的思想來控制計算機,就像控制手臂和腿部的運動一樣。對于許多人來說,這是一個令人恐懼的想法,因為它暗示結締相互作用可以在兩個方向上起作用。但是,該技術仍處于最早階段,因此很難預測是否存在問題。
- 其他通訊方式。很難想象機器和人類通信的未來會是什么樣子,因此我們不能排除其他更抽象的模型的可能性。一些技術創新者可能想出了一種我們甚至還無法想到的新穎的直接交流方法。
目前,基于語音的控件和通信仍然是我們與機器交換信息的方式中的主導力量。該技術是如此復雜,以至于大多數人可以輕松利用其潛力。它的使用存在一些問題,包括隱私問題和有限的預測能力,但是可以通過進一步開發來緩解(或消除)這些問題。