【天翼開放平臺】數字內容智能全識別 輕量級開發福音
隨著移動網絡條件的改善、即時通訊工具功能的加強,人們之間的遠程溝通方式變得越來越多元化。從最基礎的文字,到現在風靡移動互聯網的語音應用(如微信、啪啪等),不同信息傳播形態之間的高效轉換成為下一個亟需解決的問題。但是對于團隊力量有限的一些開發者或創業者來說,自主研發如語音識別、圖像識別之類的技術難度較大。中國電信天翼開放平臺將這部分工作整合進了自身體系之內,為開發者提供了強有力的數字內容智能識別支持。
天翼開發平臺的數字內容智能識別能力目前包括以下四個方面:
語音合成:調用此能力可通過用戶提交的文本信息,對此文本數據進行語音合成,并獲取生成的音頻數據,即將文本轉換為語音。
手寫智能識別:調用此能力可通過用戶提交的筆跡坐標獲取該筆跡數據的識別結果,即可智能識別手寫筆跡數據。
語音智能識別:調用此能力可對用戶提交的語音進行識別,即可智能地將語音信息轉換成文本。
圖像智能識別:調用此能力可對用戶提供的圖片信息進行數字識別,即可智能地將印刷圖片轉換成為電子圖片。
所以,即使開發者欠缺對數字內容識別的研發能力,天翼開放平臺也能夠幫助他們跳過這一環,迅速處理好產品的后端,從而能夠把精力放到與用戶直接產生交互行為的前端上。
如今很多開發者紛紛開始將目光轉向微信、UC、百度等擁有億級用戶量的超級 App 上,Web App、輕應用等概念隨之興起,借助這些平臺進行輕量級開發成為創業者青睞的方式。但這些平臺本身主要提供的是渠道方面的支持,當開發者面臨需要處理多種數字內容轉換的場景時,輕量級開發原本具有的優勢就會因技術問題被削弱。
以微信為例,其產品本身的特性使得用戶習慣于進行語音交互。但并不是所有開發者都具有一直人工客服團隊。此時通過調用天翼開放平臺的語音識別能力,就能夠在后臺將用戶表達的語意轉化為文本并進行匹配分析,從而可以回復出用戶希望獲得的答案。
在移動終端逐漸普及之后,人們走在路上不僅要用眼睛去看,用耳朵去聽的需求也逐漸浮出水面,市面上逐漸興起的各種電臺類應用就是例證。天翼開放平臺的語音合成能力(文本轉語音)在涉及文章閱讀、外文單詞拼讀的功能上有著廣泛的應用場景。在搜狐新聞客戶端里,用戶就可以通過點擊每條新聞上面的虛擬播放按鈕,讓客戶端為自己讀新聞。
此外,隨著整個行業對身份認證和安全系數要求越來越高,對用戶身份的驗證成為未來的重要環節。用戶的筆跡、簽名、照片、掃描證件等都會成為個人信息的一部分。這些內容如何準確高效地以數字形式保存下來?手寫和圖像的智能識別能力將是一片蘊藏豐富的藍海。
目前天翼開放平臺的語音智能識別能力調用次數已超過一萬,其他能力也都達到五千次左右。未來天翼開放平臺必將會成為重要的數字內容輸入輸出的樞紐。