思必馳趙恒藝:國內智能語音行業發展前景廣闊
原創【51CTO.com原創稿件】隨著人工智能的快速發展,作為人工智能領域中最先落地的應用之一,語音交互開始成為很多設備的標配,被越來越多的人關注。微軟、蘋果、IBM、思必馳、科大訊飛等國內外廠商都在研發語音交互技術的新策略新算法,似乎人類與語音的自然交互漸行漸近。
近日,在由51CTO主辦的2017WOTI全球創新技術峰會上,記者有幸采訪了思必馳副總裁趙恒藝,針對全球智能語音行業的發展現狀,思必馳DUI (AISpeech Dialogue User Interface)開放平臺以及思必馳未來的發展規劃等問題進行了深入交流。
思必馳副總裁趙恒藝
據趙恒藝介紹,目前,思必馳主要針對車載、家居、機器人/故事機等產品做垂直領域下的對話式交互,根據各個垂直行業做場景化的語音技術創新、優化,做差異化的語音解決方案。
全球智能語音行業的發展現狀
據今年年初,調查公司VoiceLabs發布的《2017年語音報告》顯示,2015年和2016年智能聲控設備的銷量共計650萬,2017年該數字將達到2,450萬。
目前,幾乎國內外所有的IT巨頭都在積極布局人工智能領域,并都相繼進入了智能語音市場,全球智能語音市場競爭日益激烈。在國外,蘋果收購英國對話公司VocalIQ并曝出在劍橋設有秘密研發地,據了解,思必馳的首席科學家俞凱是劍橋大學語音博士,也曾為VocalIQ的創始人之一;IBMWatson在英文語音識別領域也進行著不斷地升級,帶來更好的體驗。在國內,BAT已在人工智能領域全面布局,智能語音成為其必要一環;作為專業的語音公司,思必馳在其垂直細分領域的表現十分搶眼。
針對國內智能語音行業的發展,趙恒藝認為,一方面,從智能語音這個行業來講,整個華語行業有非常舉足輕重的作用。目前,在華語行業,特別是在語音行業的一些科學家都是黃皮膚、黑眼睛的黃色人種,中國人在行業的發展中扮演著重要的角色。而且,漢語言是非常具有自身特色的語種,具有自己的研發規律和特點。另一方面,從國家層面來講,我國首部國家級人工智能發展規劃——《新一代人工智能發展規劃》,更是將新一代人工智能發展提高到了國家戰略層面,為國內智能語音行業的發展提供了很好的環境,同時也為中國引領智能行業創造了機會。
人機如何更好的實現對話交互?
如何通過人工智能技術實現更自然的人機交互,這是企業都希望自己能夠做到的。趙恒藝表示,現在,人機交互到了一個比較關鍵的時期。隨著移動互聯網技術的快速發展,人們不再局限于鼠標鍵盤的交互方式,實現了智能終端觸摸屏的交互方式。如今,伴隨移動智能設備的快速發展,以及無屏化、小型化的場景開發,自然語言的交互必將成為主流的交互手段之一。但是現在仍然是一個開始,思必馳一直認為語音交互是非常重要的手段。
趙恒藝強調:“聲音蘊涵著內容,通過口語式的對話能夠從我們的設備端去連接到更大的世界,我們希望跟設備做一個很好的打通,語音除了服務之外,就是連接各種各樣的設備,比如智能中控可以控制家里所有的設備,就是很常見的一個場景。然而,目前在這個行業仍然沒有真正的打通,中間還有非常多的路要走,需要業界同仁一起攜手去推進整個行業的發展。”
以對話為核心的DUI開發者平臺
語音交互將使人機交互以人類最天然、熟悉的方式進行,這是未來智能生活的必經之路。作為在語音行業里比較有影響力的公司,思必馳推出了一站式對話定制開發平臺——DUI開放平臺。該平臺由趙恒藝帶領公司100多人的技術團隊,歷時大半年完成。平臺集專業技能商店、多場景覆蓋、一站式開發、數據可視化等優勢于一體,不僅面向普通開發者、企業用戶、也面向第三方平臺公司,提供語音識別、語音合成、語義理解等基礎技術能力,帶來一整套標準化方案,幫助企業根據產品具體需求,去實現更細致入微的智能交互。
趙恒藝表示,相對于市面上其他的平臺,DUI平臺的優勢在于我們不僅僅是一個對話式的定制平臺,也在于:
第一,本地和云端均可以進行相關的對話定制。現在,非常多的語音相關運用都是云端,思必馳DUI開放平臺既提供云端服務,也提供本地技能服務,以車載上的應用為例,DUI平臺可以在弱連接的情況下做到對話和運用,確保在網絡不佳甚至是無網的環境下,基本功能仍然可用。同時,DUI平臺支持全流程的定制,包括語音識別、語音識別前的信號處理、語音喚醒、對話邏輯等很多工作的參數定制,可支持整個對話流程中所有的技術細節的靈活設置。
第二,全流程可控。語音操控只是一個入口,在用戶通過語音跟設備對話的過程中,思必馳關注的不僅僅是設備獲取信息,獲取到什么樣的信息和內容,還包括如何形成最后設備端的出發與反饋,實際上,這仍然是需要在DUI開放平臺來解決的一些問題。滿足這些需要,就要連接到第三方設備、服務、數據,從后端的技能出發連接更多、更大的資源。
第三,可以做用戶運營。DUI平臺支持數據可視化,思必馳大數據團隊可以做到實時的數據更新,比較復雜和基礎的數據都可以做運營管理和呈現。比如:可以給產品者發季度報表,同時開發者綁定思必馳微信服務號的帳號之后,就可以在手機上看到自己產品的數據,從而時刻關注自己產品運行的情況,從而幫助開發者加快研發迭代,為他們的用戶能夠提供更大的價值。
展望未來,夯實技術基礎仍是重中之重
目前,思必馳已經與眾多業界一流公司達成合作,包括阿里、騰訊、小米、樂視、君正、聯想等等,幫助數億用戶通過思必馳自然語言交互技術,實現與智能家居、車載等智能終端的互動交流,在業界獲得了很好的口碑。
談及思必馳在未來兩三年內的發展規劃與目標,趙恒藝表示:“首先,夯實我們的技術基礎是重中之重,因為我們是技術驅動的公司。我們希望研究能力及核心的算法能力仍然保持在行業的領先地位,這是我們一定要做的事情。其次,在業務上,我們希望能夠做的更好,與我們的行業合作伙伴一起推進基于DUI開放平臺的交互。我們希望在整個DUI平臺的產出量上十億的規模。”
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】