如何擴大AI的使用? 人工智能存在“1%問題”
關于人工智能(AI)的報道和評論為數眾多。有人說它能創造奇跡,也有人說它對人類構成威脅。但Databricks公司聯合創始人兼CEO阿里·高德西(Ali Ghodsi)要大家保持克制。Databricks來自加州大學伯克利分校AMPLab實驗室,致力于ApacheSpark。
高德西說,在Databricks為其500多位企業客戶提供支持的用例中,73%是基于AI。這些公司很多都在努力利用AI。但同時也有眾多夸張的故事,講述AI將如何掌控世界,又有多么強大、多么危險。
“當我們和試圖解決預測問題的財富2000強企業交流時,他們的說法和媒體的報道反差極大,”高德西說。
AI的1%問題
他說,大家都想涉足AI,承認其巨大潛力,如果你問首席信息官和C級高管,他們打算如何保持競爭力,人工智能的使用很可能在他們的最重要的五個事項之列。高德西指出,人們以為AI無處不在,但事實大相徑庭。
AI實際上存在“1%問題”。只有谷歌、亞馬遜等少數公司利用人工智能達成了他們的目標。這些科技巨頭擁有數以萬計的硅谷工程師,其中很多人擁有博士學位,或者本來是麻省理工、斯坦福和加州大學伯克利分校等頂尖學府的優秀教授,他們致力于解決范圍很小、為數也不多的問題,比如實現汽車的自動駕駛,或者讓人們點擊更多的廣告。高德西解釋說,他們在所從事的有限領域里取得了很大成功,但其余“99%”的公司沒有這些資源,發現自己試圖解決的問題異常復雜,不知如何下手。
早期應用
Databricks發現,在AI的早期應用方面,工業IT和醫療行業是兩個突出的例子。企業從傳感器收集數據,然后輸入Databricks,預測在某地發現石油的可能性,從而提高勘探效率,改善對環境的影響。在醫療行業,機構利用AI來幫助識別圖像中的癌癥腫瘤。但這兩個行業不僅需要數據科學家和數據工程師,還需要研究相關學科的專家,而這些專家通常不太熟悉AI、數據庫系統和數據倉庫。
就利用AI識別腫瘤的例子而言,這種應用還遠未實現安全自動化。高德西說,谷歌工程師能開發出區分貓和狗的AI技術,“就算搞錯了,也只是讓人好笑而已。那是貓,但長的像狗。”但在醫療領域,如果某人說這是癌癥腫瘤,但實際上并不是,那問題就嚴重了。
如何擴大AI的使用
高德西說,有三個問題必須解決,才能在更多的公司中更廣泛地使用AI。
- 技能差距——首先,需要領域專家。高德西說,比如識別癌癥就需要醫生,還有懂得利用機器學習軟件來建立預測模型的數據科學家。此外還需要了解數據庫和數據倉庫的數據工程師,他們知道數據應該存儲在哪里,如何解決大數據的多樣性、速度和其他問題。在充滿政治色彩、關系到管理和權力的氛圍中,讓所有這些不同的角色協同工作,這不是件容易的事。
- 工具繁多——高德西說,現在有太多的工具需要整合,其中很多都是開源的。這些工具涵蓋數據清洗、攝取、安全、預測和監控。想要使所有這些開源工具協同工作,企業必須雇傭開發人員,成功地實現軟件互操作,而這只是為了讓軟件協同工作。
- 基礎設施——高德西眼中的第三個挑戰是運營基礎設施,確保所有機器和集群處于安全狀態,數據以受控的方式流動,因為在受到嚴格監管的行業里,黑客入侵或信息泄露會使公司面臨嚴重的后果。
云是關鍵
高德西說,在踏上AI之旅時,這些是需要盡早解決的三個問題。為了解決它們,需要工具來實現協作、系統整合以及通過云加強基礎設施的一致性和可用性。
- 協作工具——擁有能夠實現多角色協作的工具,這是解決技能差距的最好方法。高德西說,這非常重要。
- 技術整合——技術需要整合起來,更好地協同工作,這樣才能清洗數據,把它轉換成數學格式以用于預測,添加更多數據,建立預測模型,讓軟件自動運行。高德西說,能否添加更多數據以豐富原始數據集,這關系到預測的準確性。
- 云——高德西說,想要確保基礎設施始終運行良好,云是很好的解決之道。云能帶來自動化、外包和確保基礎設施始終運行良好的能力。在AI方面取得成功的那1%的企業都是云公司。這也許是巧合,也許不是,但在AI方面真正取得成功的谷歌、Facebook、亞馬遜和其他公司都是云公司。他說:“我們認為,重要的區別就在于此。”
什么是AI,什么不是AI
高德西說,在AI被廣泛使用之前,還有很長的路要走,很多人擔心AI將取代人類大腦,但目前最先進的AI研究志不在此;AI實際上是人腦的補充,幫助人類更好地完成富有挑戰性的任務。
谷歌擁有世界各地所有網站的大量信息。它是AI,還是一個僅僅擁有很多信息的數據庫 高德西說,我們可以把這視為一個哲學問題。但毫無疑問,AI使人類能夠非常高效地查找信息,因為沒人可以在自己的電腦上存儲所有那些數據,并識別所需信息的來源。如果你有一幅地圖,想找出兩點之間的最近路線,軟件可以很好地做到這一點。但高德西說,在需要創造力、并非超結構的事情上,AI進展甚微。
高德西說,谷歌的AlphaGo之所以能戰勝人類圍棋冠軍,是因為它進行模擬的速度比人腦更快。但他說,如果你讓AlphaGo回顧其勝利,指出使它在比賽中取勝的關鍵落子,它就無能為力了。而人類可以大談特談他們迂回曲折的決策過程。AlphaGo只不過是運行一系列程序算法來模擬場景,從中找出最優解。它真的能取代人類嗎 顯然不行。
結論
“我認為,從本質上來講,AI對人類不是件壞事。”高德西說。他指出,AI沒有減少可供人類使用的資源,比如食物、教育和醫療。
但他認為,在AI被廣泛使用之前,需要先解決技能差距、工具繁多和基礎設施這三個重要問題。
哪些基因引起某些疾病這樣的問題實際上很難回答,但人人都說他們正在取得“巨大進展”。高德西說:“沒人會說‘這相當困難,充滿挑戰性。’”
他指出,另一個問題在于,關于AI的過分宣傳使人們誤以為AI對人類構成迫在眉睫的威脅,忽視了它的巨大潛力。
高德西說,Databricks的目標是盡可能地簡化這項技術,讓那99%的企業都能使用,實現AI“民主化”,幫助那些遠遠比不上“谷歌們”的公司利用AI。