微軟亞洲研究院博士:往返于研究與開發之間
在微軟亞洲研究院,有很多研究成果成功轉化為產品的例子,讓我們在期待今年技術節盛會之前,看看研究院技術戰略總監張益肇博士回憶他往返于研究與開發之間的故事:
在微軟亞洲研究院成立八個月之際,我帶著妻兒舉家來到北京開始了我研究生涯中的一個轉折;2003年,在研究院成立五周年之際,我來到了由研究院孵化出的微軟亞洲工程院,在一個全新的環境從事以前在微軟未曾涉獵過的產品開發類工作;2008年,在研究院將要迎來它十周年生日的當兒,我又重新回到了它的懷抱,繼續享受在研究過程中的樂趣。
給蓋茨作報告
在1999年7月加入微軟亞洲研究院的時候,我的主要工作之一就是組建語音組的研究團隊,2000年我們招募了初敏加入語音組,次年又招募了Frank Seide加入,他們倆的加盟很快地就帶動起了整個組在語音合成和語音搜索上的研究局面。TTS (Text to Speech, 簡稱TTS) 是語音組的重要項目之一,當時由初敏研究員主要負責,再加上彭煳,趙勇,趙晟,楊紅云,王慶等年輕同事的全力投入,很快地作出一個中文語音合成系統。也正因為這個項目,讓我經歷了三年的“BillG Review”(向蓋茨作報告)。
2001年,研究院第一年向蓋茨匯報中文語音合成技術的成果,語音的自然度和流暢感與傳統技術比起來要進步很多。蓋茨聽了匯報之后感覺一切都還不錯,但是他搖搖頭非常惋惜地說:“很可惜,我聽不懂中文。”因此,蓋茨對此無法給出針對性的意見,不過他仍建議我們是否可以把其他語言也做起來,2003年10月左右,浩大的Vista項目看中了我們研發的中英文語音合成引擎,并意欲轉換進Vista中。那個時候正好微軟亞洲工程院成立,于是語音合成項目成為了工程院成立時的最初七個項目之一。因此,那一年研究院和工程院組成的研發團隊一起給蓋茨集體做了一場項目匯報。當蓋茨得知我們這個項目正籌劃著做進微軟新一代操作系統時,他急切地關心起開發流程的時間表,可見他對這個技術的早日面市是何等得期待!
隨著TTS在Vista系統中的落地開花,Frank Soong博士帶領著語音組為更加平滑的語音合成技術而努力著,同時一個穩定的TTS開發團隊也在微軟中國研發集團的成長并逐漸茁壯,當初只有四五人的項目團隊如今已經發展成為二十多人,從事著除中英文之外的德文、西班牙文、法文、意大利文等其他二十幾種語言的語音合成系統的開發,主要側重于服務器上的語音交互方面的應用。讓我們倍感欣慰的是,TTS技術無論是從最初的算法模型設計、原型系統建立,還是到后來的產品轉化與現在更大規模的在服務器端的應用,語音合成技術的研究和開發,都是北京的研發團隊自發完成的,這充分證明了中國研究團隊的創造力和協作力。
蓋茨說過,微軟研究院的最大使命是使未來的計算機能夠看、聽、學,能用自然語言與人類進行交流。其實,這十年,我們都是圍繞著這個愿景展開著研究,也取得了階段性的成果,但是仍然還遠未達到人工智能的程度,所以研究是一個長期的過程,需要有探索的心態,并不斷拓展延伸的可能。TTS這個項目從初敏2000加入研究院開始到2006年底正式隨著Vista發布,從最初的中文語音合成,接著到英文,再到后來的中英文雙語合成,經歷了一個較長時間的探索過程,而這種摸索和堅持都要投諸于長期的耐心。
工程的魅力
隨著最后一次給蓋茨做匯報的落幕,我的職業角色也從一個單純的研究者向一名工程管理者轉變,2003年底我經歷了一次鯉魚跳龍門似的跨越,微軟亞洲工程院副院長的職務讓我重新認識了另一種職業的魅力。
張亞勤曾經說過研究是一種氣象開放、思維擴散的事業,而工程是一個不斷去粗取精,直到發現非做不可的事情為止的過程。這是研究和工程所體現出來的兩種不同的視野。研究和工程兩者唇齒相依,研究要以實現工程轉化為理想,而工程實踐也離不開研究的指導,這就像中國的太極一樣,雖然在工程需要有了一定的偏向,但是不能太規矩,以至于沒有新的設想和新的創造進行自我完善。它們之間如何拿捏得好確實是一項很大的挑戰。
無論是研究還是工程,制定明確的指標是激勵自己的團隊一個非常有效的方式。倘若在研究領域,我們可能用國際高水平論文的質量和數量、技術轉換的多寡等重要方面去激勵研究員們的學術創想,而在工程領域,我們則更多地通過參與新功能開發的數量以及對新產品發布的貢獻等方面來衡量一個工程師的價值。
除了激勵之外,如何在錯誤和失敗中吸取教訓也是研究和工程中都需要經常面對的一個問題,因為在這兩者中,挫敗是太尋常不過的家常便飯了。作為研究員或者工程師,我覺得樹立長向的思維非常重要,這樣能避免被一時的失敗而打擊。年輕時候的大起大落,從一段時間之后看來都是很小的變化,所以要用平常心對待,才能適應各種不可預知的挑戰。
從我個人而言,“保持樂觀的態度,做好悲觀的準備”的心態,是我在工作過程中勉勵并且安慰自己的一個非常實際的做法。凡事都要先給自己一個信心和動力,但是我們也要做好勇敢地面對可能出現的失敗結局。
作者介紹:
張益肇,麻省理工學院計算機博士畢業。1999年7月加盟微軟亞洲研究院任語音組主任研究員,從事自然語言理解方面的研究工作。之后在微軟亞洲工程院任副院長,帶領團隊參與開發了Windows Mobile 和Windows Vista 的產品。2008年6月重新回到微軟亞洲研究院任技術戰略總監。他曾是 Nuance Communications 公司研究部的創始人之一,也是電信領域自然語言界面研究的先驅。在此之前,他還曾在麻省理工學院林肯實驗室、東芝ULSI研究中心、美國通用電氣研究院擔任研究工作。他一直以“茍日新,日日新,又日新”來激勵自己每天的生活。
原為鏈接:http://blog.sina.com.cn/s/blog_4caedc7a0100cht3.html
【編輯推薦】