機器學習機制正在崛起
譯文當量變積累到一定程度之后,就會引發顛覆性質變。“還記得人工神經網絡嗎?”Christopher Nguyen問道。“當我們為其配備足夠龐大的內存與計算資源,就會出現有趣的現象——它真正活了過來。”
作為Google Apps的前任工程技術主管,Nguyen提到的是他所建立的初創企業Adatao打造出的技術成果——這家公司剛剛從Andreessen Horowitz處獲得了1300萬美元投資。Adatao的價值主張分為兩大部分:
pInsights,基于文檔的虛擬化層,旨在為終端用戶提供面向大規模數據集的簡單實時化查詢機制;
pAnalytics,一套以Hadoop與Apache Spark為基礎的怪獸級數據處理引擎。
二者都包含有ANN(即人工神經網絡)組件,這一原本僅僅以構想形式存在的技術方案如今借助龐大的內存與處理能力最終走上了商業化正軌。
Adatao的目標在于將大數據分析帶入規模化體系,進而幫助用戶借助包含大型數據集圖表的Google Apps類文檔實現協作。我曾經親眼見證過該方案的演示效果,在采用由Amazon Web Services托管的八核心服務器集群(每臺服務器配備30GB內存)的情況下,面向數TB級別數據集的查詢任務能夠很快得以完成。為了實現承諾中的易用性,Adatao公司需要利用ANN識別處理當中的數據對象、從而對通過輸入簡明英文表達進行的查詢操作作出快速響應。根據Nguyen的說法,該系統能夠識別最多20000個對象。
如果Adatao能夠獲得成功,他們將成為當之無愧的游戲規則改變者。但最令我感到興奮的,仍然是其在人工智能方面取得的成就。
在觀看了演示實例之后,我立刻打電話給我的朋友Miko Matsumura——Hazelcast公司市場推廣事務副總裁,他曾經在耶魯大學取得了計算科學碩士學位。我告訴他,根據我個人極為有限的理解,人工智能的實現在很大程度上已經轉化為軟件而非硬件課題,而Adatao的ANN技術似乎為實現這一構想提供了鮮活且可資借鑒的例子。
Miko旋即向我提到了Paul與Patricia Churchland得出的結論,他們曾經指出那些否認人工智能可能性的反對派就像是在黑暗的房間里揮動磁鐵、并借此宣稱磁性并不能產生光亮——這樣的結論非常荒謬,無法發光只不過是因為他們的揮舞速度還不夠快。時至今日,我們已經具備了點亮人工智能這盞明燈的巨大內存與計算容量,因此可以說人類已經站在了邁向技術新紀元的起跑線上。
事實上,這場競逐早已開始,其主要實踐性應用就是大數據分析。正如James Kobielus在今年早些時候所強調,“機器學習的普及程度已經如此之高,我們能夠在多數大數據應用程序當中看到它們的身影。”
“我們的未來既充滿光明也滲透著黑暗氣息,”Miko這樣描述***次將機器學習機制納入大數據方案所帶來的影響。換句話來說,利用人工智能分析機制處理任何可用的互聯網數據——其中包括收集自移動與可穿戴設備的、更為詳盡的個人信息——網站與商家能夠獲取到***實用價值的分析結論。與此同時,這也令我們普通用戶不寒而栗,因為這種個性化幫助的背后隱藏著個人信息的大量外泄。
無論如何,機器學習與大數據協作的首要目標在于推動客戶提高消費額度并保持理想的忠誠度,這其實并不令人意外。不過其潛在影響將延伸到每一個學科,從醫療保健到氣象預測。隨著計算資源的廉價化與規模化,新的智能系統已經由構想變為切實可行,我們也迎來了全新計算階段所帶來的一系列質變。否認這一點,顯然無異于在黑暗中揮動磁鐵。
原文鏈接:
http://www.infoworld.com/t/big-data/the-rise-of-machines-learn-248037
原文標題:The rise of machines that learn