ROOBO CTO雷宇:人工智能不會走大而全路線,垂直領域將先開花
原創【51CTO.com原創稿件】前不久,在剛剛結束的 以“人工智能,不止于技術的革命”為主題的WOT2017全球創新技術峰會上,ROOBO CTO雷宇做了《端上的人工智能交互》主題演講,演講結束后,記者采訪到了他,請他分享關于人工智能交互領域的精彩觀點。
好的人機交互系統什么樣?
雷宇認為一個好的人機交互系統需要從智能層、VOI層、硬件層協同,能夠承載豐富的內容資源,通過先進的人機交互實現離線人工智能,低延時的同時還能保證安全。
過去人們談人機交互主要是軟件層面的人機交互,例如觸控、鼠標到數控。但是未來的人機交互,需要將硬件、軟件、人工智能這幾部分串起來考慮,原因在于人們的輸入方式變了,輸入開始包含語音、圖像,所以在考慮人機互動需要將整體打包,形成硬件、軟件到云端三位一體化。
亟待完善的幾個技術核心點
在人機對話聊天的場景為主,雷宇認為在信號處理、交互識別還有對話各個環節都需要技術做支撐。在當前他認為就目前階段的前端的信號處理和語言的能力,都不足以把自然語言接受到和表達出來,這是很關鍵的問題。在兩到三年之內,需要解決的重點問題還在于信號處理到語音識別的結合,未來這些問題解決之后,最終還是看自然語言處理是否足夠智能。
在人機交互中,雷宇將VID看做是非常關鍵的環節,VID屬于信號處理和語音識別結合這塊人機交互最重要的連接層,因為信號處理只是把環境的噪音去掉,然后提取系統想要的人聲。但是這個人聲也包含疑似人聲,需要在信號處理同時做語音識別,VID的價值就在于去偵測到需要的聲音,傳遞上去被識別,它是一個承上啟下的作用,如果它不做好,兩端做的再好也沒有用。“這就好比一個設備里面的關鍵元器件,雖然它不是發動機里最精密的,但很多車的發動機并不出問題,而是需要換鏈條了,這就是鏈條的價值。”
在對話環節,技術上如何實現讓機器對人的語義來進行理解?雷宇告訴記者,現有技術更偏自然語言理解,這個技術本身不是一個新技術,但之所以重要,因為它不僅是將語音轉換成文字,更要去理解這段文字的意圖,這需要在自然語言處理以及知識圖譜共同努力才能做到。
現在人工智能智商等于3歲兒童
“人工智能現在如同一個蹣跚學步的孩子,3歲兒童的智商,還有很長的路要走,未來***是自然語言處理技術的進一步提升;第二是對于垂直領域知識圖譜的建設,還有深度學習技術的進一步加強,***還有推理能力的提升。” 雷宇在承認問題的同時,也表示了自己對人工智能未來發展的信心,他認為,技術的演進比人的學習成長速度要快很多,所以可能短短十年就可以取得不小的成就。
在雷宇看來,目前機器人領域還是以嘗鮮的角度比較多。他將機器人領域分為企業級市場和消費類市場,其中消費類市場還有很長的醞釀期,原因在于客戶并不知道自己的需求,同時用戶真正需和現有的實現能力相差甚遠。而企業級市場的用戶需求則更明確一些,例如以智能家居為例,用戶非常清楚哪些設備需要實現智能化,實現怎樣的功能。這個市場正在蓬勃發展,還有一段時間去培養。
談及人工智能未來發展時,雷宇認為未來的智能設備不會走大而全的路線,而是專注于垂直領域,例如醫療行業的醫療陪伴,教育行業的互動式兒童教育等功能。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】