谷歌AI開源神器三歲了:它被用在很多你想不到的地方
2016年3月,“李世石對AlphaGo”人機大戰讓全世界都知道了人工智能的威力。這場大戰半年前,谷歌就已經把它的人工智能底層能力開放給了全世界。
2015年11月9日,谷歌正式對外開源了機器學習框架TensorFlow,到2018年11月正好3年。TensorFlow這三年一直保持著更新,2019年即將布2.0版本。應用方面也沒落下,谷歌用TensorFlow優化了旗下許多產品。

借助TensorFlow,谷歌讓產品更智能
在Gmail里寫郵件,系統會智能建議下一個單詞或完整的句子。在Google Photos里瀏覽時如果看到一張偏暗的照片,系統會自動提示你調整曝光,讓照片更亮一點。在谷歌翻譯里寫入一個句子,系統可以對整個句子進行翻譯而非逐字翻譯,大幅提高翻譯精確度和流暢度。跟谷歌的人工智能助理Google Assistant對話,再也不用一次次說出喚醒詞“Hey, Google”,一次喚醒就能持續多輪對話......
谷歌內部超過80%的軟件項目都采用了基于TensorFlow的機器學習,最新案例是可以自己打電話的AI系統——Duplex。

谷歌在2018年的Google I/O大會上發布的Duplex,具備語言理解、交互、時間控制、語言生成方面的能力,可以幫你打電話給發廊、餐廳等消費場所,詢問信息或預定。在和店員交談中,它還能模仿人類的語調,在說話間停頓、拉長,甚至使用“嗯“、”呃“一類語氣助詞。
將TensorFlow用于自己產品智能化,這是再也常規不過的操作了。在一些有足夠標注數據的垂直行業,TensorFlow可以發揮出更大的潛能。
上能發現“第二個太陽系”,下能預測余震位置
2017年12月,谷歌和得克薩斯大學奧斯丁分校合作,用TensorFlow分析開普勒望遠鏡獲取的數據,成功發現了兩顆新的地外行星:開普勒-90i和開普勒-80g,其中開普勒-90i所在的星系開普勒90,更是太陽系之外首個已知的八行星星系。
眾所周知,天文是一個數據量非常龐大的領域。前不久退役的開普勒天文望遠鏡,一直在用凌星測光法收集數據。
凌星測光法的原理是,當行星從恒星前方經過,會遮擋住一部分光線,開普勒望遠鏡就能探測到恒星光線減弱,體現在光變曲線中有一個“U”型下沉。

原理很簡單,但開普勒望遠鏡收集的數據實在太多,若逐一進行人工檢查,實在太耗時耗力。而且有的行星很小、很黯淡,對應的恒星卻非常明亮、巨大,觀察起來非常困難,就像在聚光燈下尋找一只螢火蟲一樣難。
谷歌的AI科學家想到,這個問題和Google Photos給照片分類十分類似,于是在TensorFlow的基礎上搭建了一個機器學習模型,對15000個已經被標注過的地外行星數據進行神經網絡訓練,判斷開普勒望遠鏡接收到的信號是否來自某顆地外行星。經過訓練后,該模型的判斷準確率達到了96%。
成功運作后,這個模型被用在了實戰中,很快從670顆恒星周圍找到了兩顆地外行星,分別是開普勒90星系中的開普勒-90i和開普勒80星系中的-80g。
得益于開普勒-90i的發現,開普勒90星系成為太陽系之外首個已知的八行星星系。
天文學界的共識是,一個和太陽系近似的星系中,可能有和地球類似的行星,生命存在的可能性較高。遺憾的是,開普勒-90i離太陽太近了,一年只有14.4天,地表溫度約427攝氏度,幾乎不可能有碳基生命存在。

TensorFlow不僅可以處理天上的事情,還能解決地面的麻煩,比如地震。地震造成破壞不可避免,但如果可以及時營救,能最大程度減少損失。
每次主震之后,災難并沒有完全過去,還可能有余震維持數月,繼續摧殘著被主震動搖的建筑物。地震學家一直致力于通過數據預測余震發生的時間、規模和地點,以安排及時的營救。
但是,地震學領域的數據非常復雜,每次地震事件都有很多變量,如不同區域地表的構成元素、地震模塊之間的交互、地震波傳遞能量的方式,單純靠人工在數據中找到聯系、繼而預測余震成本很高。基于過去的經驗定律和模型,地震學家們已經可以較好預測余震發生的時間和規模,但預測位置則相對困難。
為此,谷歌和哈佛大學的研究人員利用TensorFlow開發了一個深度學習模型,并且用包含超過13萬次主要地震的數據集去訓練。這個深度學習模型引入了一種以前常用于冶金術的馮·米賽斯屈服準則,以更好地找到復雜地震數據間的相關性,從而對余震位置進行預測。
這個模型目前還只能應用于靜態應力(更好預測),對于動態應力還有心無力。但正如哈佛研究團隊里的領隊Phoebe DeVries所說:“完全準確預測出余震位置還有很長的路要走,但我想機器學習在這方面有很大的潛力。”
行醫濟世,AI For Good
醫學一直是TensorFlow應用的重點領域,目前在檢測糖尿病視網膜病變、檢測轉移性乳腺癌、心血管疾病評估、癌癥檢測和分析病歷中小有成果。
以檢測糖尿病視網膜病變為例。全球范圍內有4.15億糖尿病患者面臨視網膜病變的風險,若是發現及時可被治愈的,但若是未能及時診斷,則可能導致不可逆轉的失明。
專科醫生檢測糖尿病視網膜病變最常用的方法之一,是用眼球后部的掃描片進行分析,觀察是否有病變的征兆(例如微動脈瘤、出血、硬性滲出等),并判斷其嚴重程度。但世界上許多糖尿病高發的地區,并沒有足夠的專業醫療人士去檢測該疾病。這個問題在南亞地區尤為嚴重。
為此,谷歌于2016年和美國、印度醫生合作,創建了一個包含12.8萬張眼底掃描圖片的數據集,用于訓練一個檢基于TensorFlow的深度神經網絡。谷歌把神經網絡的診斷結果,和7個專業醫生的診斷結果對比,結果表明前者的結果與眼科醫生小組的診斷相當。
2016年這個研究公布后,深受醫學界好評。哈佛醫學院的安德魯·比姆和艾薩克·柯漢表示,“這一研究展示了醫學新世界的樣子。”
目前,谷歌在醫學領域最新的消息是,新成立Google Health部門,并把一手締造了AlphaGo的DeepMind的健康業務納入其中。
實用之余,還會畫畫
別看TensorFlow“一本正經”,又是發現行星、預測余震,又是診斷糖尿病視網膜病變的,其實搞起藝術來也有兩把刷子。像AutoDraw,能幫助你將自己的一些涂鴉轉變成規整的畫作。

操作步驟也很簡單,點擊左側第二個按鈕,啟動機器學習識別模式,再隨便涂上幾筆。AutoDraw會即時識別這是什么,并給出一些圖形供你選擇,點擊一下即可替換。

AutoDraw之所以能猜出你畫的是什么,得益于一個名為“Quick, Draw!”的項目。這個項目采用眾包的模式來搜集成千上萬的涂鴉,組成數據集后用于訓練模型。模型能理解人們在繪制涂鴉時是在何時起筆、走筆方向、何時停筆,以及畫的是什么?

這個項目后來在中國也落地了,被做成一個叫“猜畫小歌”的小程序。7月份剛出來的時候,這個小程序火過一段時間。
(題圖來自Wired)