金山 AI Lab 首次公布落地計劃,它選擇了 AI 最難啃的一塊“骨頭”
“2014 年的時候我曾經說過,成立 30 年的金山 WPS 是被雷軍一腳’踢’到移動互聯網上的;現在來看,人工智能將成為金山后 30 年一塊最重要的敲門磚。”
12 月末,金山辦公 CEO 葛珂在北京的一場媒體發布會中表示。在該活動中,成立滿一年的金山 AI Lab ***公布了其落地計劃。
金山辦公 CEO 葛珂
自 2018 年 7 月金山辦公推出 WPS AI 助手,通過可模擬人的智能語音助手協助用戶進行智能協作起,金山辦公的 AI 戰略開始逐步實施,未來計劃實現“AI 知識圖譜技術”在金山 WPS Office 等產品的落地。
其具體的功能點包括:
“成語知識卡片”將從文檔中識別成語實體,提供成語的讀音、釋義和出處;
“成語讀音填充”將為含有生僻字的成語注音;
“成語知識問答”將針對用戶對成語的提問,進行推薦常用成語;
“成語寫作”可在用戶比較各個成語時,展開成語對應的知識卡片。
人工智能正成為金山集團當下的核心戰略。上個月,金山軟件集團召開了成立 30 周年慶典,金山董事長雷軍也在公開演講與全員郵件中多次談到人工智能的戰略地位。
“未來 30 年,金山將全力投入國際化和 AI。” 雷軍強調。
整個 2018 年,AI 成了互聯網巨頭業務板塊中的“香餑餑”,這從阿里、騰訊、百度等大公司在去年的組織架構調整中可見一斑。對于他們來說,人工智能的落地既需要與現有的數據、業務積累實現聯動,也需要與未來的戰略發展相互映襯(諸如百度自動駕駛的 Apollo、阿里天貓精靈的語音交互)。
而在以 WPS 等辦公軟件發家的金山軟件,其多年積累的語義處理、機器翻譯等場景則成為 AI 落地的***方向。目前,金山 WPS 全線產品月活躍用戶數超 3 億,產品已覆蓋全球超過 220 個國家和地區。每天用戶使用 WPS Office 來編輯的文件數量達到 5 億左右。
2017 年 5 月,金山集團成立 AI Lab ,由金山辦公副總裁姚冬直接分管,目前團隊涵蓋圖像、文本、語音三大方向,計劃將機器翻譯與圖文轉換、知識圖譜、智能協作等技術深度融合。
金山辦公副總裁姚冬
相比商湯、曠視、云從等 AI 公司在視覺識別領域扎堆進場,金山選擇了主攻人工智能中的 NLP(自然語言處理)方向,這樣的選擇有些特例獨行。
一般來說,人工智能可以被簡單分為自然語言處理、計算機視覺、人機交互三類模塊,而在其中,自然語言處理的起源時間最早,后期落地難度也***。
1956 年,“人工智能”概念在達特茅斯會議提出后,科學家們開始寄希望于用計算機模擬大腦理解語言學的過程,1962 年,一個名為“機器翻譯與計算語言學學會”(后更名為國際計算機語言學委員會,簡稱“ACL”)的機構在美國成立,學界開始對包含機器翻譯、語義理解等技術在內的人工智能模塊進行深入研究。
“機器翻譯遇到了很多難以克服的語義障礙,甚至一度進入低迷狀態。”中科院研究院博士生導師宗成慶對鈦媒體介紹道,2013 年,宗成慶成為國內至今唯一一位加入 ACL 的華人科學家,在他看來,在語音語義理解的機器翻譯操作中,需要面臨諸如“口音、標點識別不準導致語句翻譯出錯”、“政治經濟等專業術語機器無法勝任”等諸多挑戰。
不過,金山仍愿意在 NLP 領域進行嘗試。在金山辦公副總裁姚冬看來,這與集團在該賽道上的積累息息相關。
1997 年畢業即加入金山的姚冬,曾參與金山早期的兩款產品——金山詞霸與金山快譯的開發工作。他認為,起初受限于當時 CPU 計算能力、存儲、數據量三個問題,機器翻譯只是基于規則的模型。而隨著算力的升級與算法的迭代,姚冬一方面目睹了機器翻譯逐步大規模地應用,另一方面,他也見證了金山集團旗下云、WPS、稻殼網等產品的延伸,這也為金山的 AI 落地提供了更為豐富的場景。
在闡釋金山的人工智能戰略時,“務實”是姚冬多次談到的形容詞。他告訴鈦媒體:“金山做技術的風格是一定要落地,一定要把 AI 變成一個產品或服務直接面向用戶。這是金山 30 年來的一貫風格。”
以金山此次宣布的 AI 落地計劃中的功能點為例:當用戶寫作時突然忘記應該使用什么成語,只需通過對 WPS 文檔中內置的智能助手提問,比如“形容勤奮的成語是什么?”,即可獲得一系列描述勤奮的常用成語,同時每個成員還包含一份相對應的知識卡片,以幫助用戶做出選擇,并在用戶選定合適的成語時實現自動插入。
金山 WPS 推出的“成語智能問答”功能可以幫助用戶聯想合適的成語。
“公文輔助寫作”,是金山選擇用 AI 進行革新的另一大主場景。這項在今年年中推出的功能包括關鍵詞句自動校對,比如對“全面建成小康社會”這類的常用語句進行定向識別;以及對《全國人大學習方案》這類長文件進行智能要點匯總與目錄檢索。
根據金山辦公 CEO 葛珂介紹,目前全國政務系統中,金山 WPS 的覆蓋率已經超過了 50%,這就讓金山在 TO G 的垂直類別里獲取到足夠多的訓練場景;另一方面,由于政務領域對文本要求比較高,相關的格式、字體、字號都有所限定,再加上政府信息公開化的趨勢,有助于為金山形成高質量的語料。
除了功能點上的革新以外,金山辦公也十分注重人工智能的技術研究與實際業務的結合效率,在葛珂看來,當 AI 對用戶的價值通過金山辦公的產品不斷放大后,當中的商業化能力也會被自然而然地釋放出來。
“現在的用戶習慣已經變成是他們愿意為成果付費,而不愿意為一個工具付費。”葛珂對鈦媒體舉例談到。目前金山 WPS 的付費應用主要以模板素材、會員服務等增值功能為主,而 AI 助手可以做得,就是可以將 PPT 模板之類的素材與用戶需求更智能地匹配在一起,以撬動用戶的付費購買意愿。