微軟Windows 95語音識別零實現 未來五年可實現完美識別
現如今,語音識別已經是微軟的核心產品之一了,微軟在Cortana身上投入了那么多就能看得出來,語音識別技術的一大挑戰就是要讓系統識別出用戶究竟說了些啥。這實際上一直都是個挑戰,尤其是在全球這么多語言和方言的情況下。而微軟在這個市場上實際已經奮戰了超過20年。
微軟語音工程師與***科學家黃學東在接受采訪時表示,微軟在這部分市場的投入是20年前Windows 95時就開始的,不過當時語音識別的錯誤率接近100%。也就是說,那個時候的系統幾乎聽不懂你所講的每個詞,所以說當時用語音來控制電腦還是幾乎不可能的。
但隨后,這項技術就在大幅發展中,語音識別技術隨后準確度提升了20%,據黃學東所說,這意味著不久之后,0%的錯誤率是完全可以做到的。
他預測:“未來4-5年內,計算機就能達到和人類一樣了。”而實際上,這方面***的挑戰并不是計算機能不能理解人所說的每個詞,而是理解人所說的內容,這也是微軟目前專注于Cortana的核心問題。
也就是說,5年以后,我們要跟手機對話還是可以達成的,但可能情況仍然不會特別好。黃學東說,微軟已經明確這個是努力方向,而Cortana在Project Oxford和Microsoft Azure的幫助下,未來幾年內就會成為語音識別系統的先鋒。