云計算是人工智能民主化的關鍵嗎?
在日本豐收的季節,一些農民每天花大量時間將農場的黃瓜分成不同的類別,而這是一些人決定采用自動化實施這種沉悶而耗時的工作原因之一。盡管他們不是機器學習專家,但他開始使用谷歌公司熱門的開源機器學習框架Tensor Flow,并開發了一種深度學習模型,可根據大小、形狀和其他屬性對黃瓜進行分類。這個系統并不完美(其準確率約為75%)。但這是人工智能在規模較小的家族企業也能很快轉型的一個標志。
像谷歌、亞馬遜、微軟、蘋果和Facebook這樣的行業巨頭當然非常了解這種變革力量。深度學習支撐著亞馬遜的推薦系統、谷歌公司的搜索和翻譯工具、微軟公司的Cortana個人助理,以及許多其他廣泛使用的應用程序和服務。大多數財富500強公司也有專門的人工智能團隊。但是這些廠商對人工智能的興趣已經網羅了大量的數據科學家的陣營,這使得大多數中小型企業渴望探索人工智能如何改善其業務,但缺乏專業知識。
即使那些有能力聘請頂級人工智能專家的企業仍然需要準備大量的數據集,并花費大量的計算能力來分析它們,并教他們的神經網絡識別某些模式或對象。但是,大型云計算提供商意識到這些問題,他們相信已經找到了幫助人們克服這些問題的方法。
機器學習即服務或云計算人工智能現在是AmazonWebServices(AWS)、MicrosoftAzure、GoogleCloud和IBMCloud等云計算平臺的主要組件。從本質上來說,這些企業提供的工作是通過為其客戶提供預訓練的深度學習模型(用于圖像識別)以及簡化構建、培訓和部署過程的工具云上的模型。
“有些數據科學家知道如何采用編碼的工具,有些軟件開發人員可能不知道如何正確調整算法,但是如果向他們提供API以進行編碼,誰都可以構建應用程序,最后還有點擊者的工具,這些工具基本上通過圖形用戶界面(GUI)相互關聯,涵蓋了世界上絕大多數人,SkyCype公司的首席執行官ChrisNicholson說。該公司為企業提供深度學習工具。
微軟Azure MLStudio,AmazonSage Maker,Google Cloud ML Engine都是類似的平臺,它們更接近數據科學家的終端,幫助深度學習專家大規模地培訓、優化和部署他們的模型。而Amazon Rekognition和谷歌翻譯等API則是以預訓練模型為基礎構建的API:用戶只需輸入想要分析的公用對象或需要翻譯的文本的數據圖像或視頻,然后等待API提供結果即可。
后一種方法的問題在于,深度學習通常用于解決特定的業務問題,而預訓練模型可能無法解決。換句話說,如果想讓它識別不同類型的黃瓜,那么采用可以識別不同品種的小貓的API是沒有用的。
“他們說:‘嘿,我們發現了一堆數據,我們訓練了一個模型,現在可以用它來預測圖像。'”Nicholson說,“但這是一個錯誤的解決方案在這個意義上,如果用戶想定制這個解決方案,在其自己的數據上訓練一個模型仍然是非常困難和必要的。”
為了彌合高度定制的神經網絡與基本的“一勞永逸”預訓練模型之間的差距,谷歌公司最近推出了CloudAutoML,該系統使用客戶數據自動構建自定義深度學習模型。CloudAutoMLVision是新服務的第一個版本,它允許用戶通過拖放界面創建用于圖像識別的定制機器學習模型。
過去幾個月,幾家公司一直在測試Cloud Auto ML。例如,迪斯尼公司已經使用該工具開發了一種方法,讓顧客可以在其商品中搜索特定的迪士尼角色,即使產品未貼上角色名稱標簽。而企業仍然需要為Auto ML服務準備自己的數據,但是,這對于一些企業可能會造成問題。
“有很多特定于組織的數據,比如他們如何處理發票或他們如何進行客戶檢查等。”Nicholson說,“對于收集這些數據的組織來說,這仍然是一個挑戰,因為很多組織首先并沒有真正掌握他們的數據。”
谷歌公司的云計算業務位居AWS和微軟Azure之后,名列第三位,因此谷歌公司試圖利用其人工智能專業知識贏得更多客戶并不奇怪。但考慮到培訓和部署深度學習模型所需的計算資源,所有主要云計算供應商都愿意為此目的租用芯片。
隨著企業對人工智能的興趣增加,機器學習工具無疑將被視為任何云計算服務的重要組成部分。事實上,IDC預測,到2021年,75%的商業企業應用程序將使用人工智能。“因此,企業需要提供這些類型的功能,就像他們需要提供容器功能或監控服務一樣。”IDC公司認知/人工智能系統和內容分析研究的研究總監Dave Schubmehl說。
但在企業急于部署深度學習工具之前,他們應該停下來考慮是否存在使用它們的明確商業案例。“人們正在以一種非常具體的方式使用深度學習來解決一個非常具體的問題。”Nicholson說,“那些不能確定他們想要解決的具體問題的企業不太可能成功。”