O'Reilly:企業數據的未來之路
原創【51CTO 12月29日外電頭條】編者按:Tim O’Reilly是O’Reilly媒體公司的創辦人,也是自由軟件和開源運動的倡導者。在2010年即將結束之際,他談論了數據挖掘方法、預測分析方法,以及為什么移動傳感器是他認為的未來計算的核心。以下是全文編譯:
現在許多公司是否認識到數據的重要性?
Tim O'Reilly:長期以來,數據可以說是大白于天下的秘密,只是大家沒注意罷了。我很早以前就明白,數據是互聯網時代獲得競爭優勢的關鍵。我早在2005年撰寫的一篇Web 2.0文章中闡明了這個觀點。很顯然,現在大家都明白了這點。像商務社交網站LinkedIn和網址縮短服務商Bit.ly這些公司如今還設有“首席數據科學家”這一職位。數據和算法是眾多公司開展業務所依賴的基礎,而這一點只會越來越明顯。
每天的數據越來越多,我們會看到創新的應用以新的方式使用數據。就拿Square公司來說。這家支付公司希望通過分析社交網絡,從一定程度上來減小風險。這一招果真管用嗎?誰也不知道。連谷歌都無力克服算法本身的限制。
最近《紐約時報》刊登了一篇文章,稱有個人想出這么個點子:獲得大量的負面評論也能換來很高的網頁排名。這就引來了新的問題。谷歌不喜歡進行人工干預,所以他們會對自己說:“我們怎么通過算法來解決這個問題?”(注:谷歌的對策是采用了算法解決方案。)
我并不了解谷歌的搜索質量小組內部出現的情況;但我認為,可能有一些新的數據源,谷歌可挖掘它們來改善業績。我一直在建議谷歌與那些有數據源但不善于獲取數據的人進行合作。
由此看來,我認為將來數據方面的合作會更多。幾家公司采取合作,可以完成單干無法完成的事情。我想到了一點:谷歌時代是人們并不認識到數據有多寶貴的時代。許多數據就在那里,誰都可以獲取。此情此景不復存在。有些數據源現在得到了牢牢保護。
舉例來說,Facebook就不會隨便由谷歌這樣的公司獲取其數據來改善谷歌自己的業績。Facebook對于這些數據有自己的用途。與此同時,以前谷歌允許Facebook用戶提取Gmail聯系人資料,然后添加到Facebook好友列表,現在給予的回應是設定了自己的限制(51CTO編輯注:Facebook一直不允許用戶導出自己的聯系人數據到谷歌,這使得谷歌在前兩個月對想要進入Facebook的谷歌用戶發出“您的關系網可能被Facebook鎖入”的警告)。這就是為什么我認為將來會出現更多的數據共享協議以及更多的數據許可。
谷歌與Facebook的聯系人信息之爭是表明新的數據挖掘方法的一個早期例子。我不知道為什么谷歌沒有更早一點表態說:如果你獲取我們的數據添加到你的網絡中,為什么我們不能反過來也這么做?”這確實是個值得深思的問題。如果Facebook想確保自身數據的私密性,那是一回事。但如果它從“數據共同體”得到了好處,卻什么回報都不提供,那是另一回事。
我還預計會出現重大的開放數據運動。這些運動與之前出于政治或宗教動機的開放數據運動將不一樣。谷歌/Facebook之間的沖突這個例子就表明了開放數據之爭的動機不是出于宗教或信條,而是出于功利。
源源不斷的數據會如何改變商業分析領域?
Tim O'Reilly:先后創辦了Palm Computing和Handspring這兩家公司的Jeff Hawkins說,人的大腦就是一部預測引擎。如果你沒有料到要邁的下一步,走路時就會絆一跤,那是由于你的大腦進行了預測,你的雙腿按這個預測邁步子。
網上服務正以類似的方式變得智能化。比如說,谷歌最初在廣告方面的競爭優勢來自于它能夠預測哪些廣告最有可能被點擊。人們其實并不明白這種預測的重要性。谷歌擁有一個更出色的預測引擎,這意味著它更智能化。從某種意義上來說,擁有更出色的預測引擎實際上決定了更智能。你比別人更了解真實情況。
以前的預測引擎基于商業智能,人們通過研究分析結果和報告來獲取商業智能。新的預測引擎出于本能反應:它是自動化的。當谷歌在進行實時拍賣,搞清楚哪個廣告會出現、哪個廣告會給自己帶來最大的經濟收益時,新引擎就在起作用。當華爾街人士開發實時買賣報價算法,以確認該把股票賣給誰時,引擎就在發揮作用。這些例子都基于預測分析方法,而這種分析方法由機器來自動管理,而不是由研究報告的人來管理。
預測分析是今后幾年值得思索的一個領域:應該考慮它是如何工作的,怎樣成為這方面的行家里手,它如何改變眾多行當,以及它與現有經營模式可能會發生怎樣的沖突。
醫療保健業就是可能會帶來沖突的一個例子。我覺得,預測分析方法在醫療保健業無疑大有機會,而且有希望在個體化醫學領域大有作為。某些療法比另一些療法更有效,而且結論是有數據證明的,但現有體制不是根據療法效果來補償費用的。設想一下:醫療保險體制的工作方式如同谷歌,那將會是怎樣。那樣的體制會說“你想開什么藥,可以開什么藥,但我們會按照哪種藥藥價最低的標準來補償費用。”那樣一來,醫生很快會開藥價最便宜的藥物。我們現在的做法恰好與之相反:醫生開醫藥公司要求他們多開的藥物。最后,醫生建議采用從數據上來看效果不見得更好、但費用高出三倍的特殊藥物。制藥公司的經營模式都取決于這個畸形的市場行為。如果我們改用預測分析方法,那么實際上有望大幅削減成本,并且讓整個體制運作更順暢。但是你如何才能實現這個目標呢?
預測分析方法會逐漸進入到新的領域,并創造機會。一個典例是在政府2.0峰會上登臺亮相的一家公司PASSUR Aerospace,該公司一直在為航班準點進港管理預測分析工作。差不多10年來,它一直在跟蹤分析美國的每一架商業班機,并將分析結果與氣候及其他因素方面的數據關聯起來。這家公司在預測航班何時實際進港方面,比各大航空公司或美國聯邦航空局還要準確。因而許多航空公司聘請該公司幫助管理預測航班何時進港。
移動傳感器出現在了你最近的多次談話中。為什么傳感器那么重要?
Tim O'Reilly:最近我與O’Reilly AlphaTech Ventures公司(OATV)的聯合創辦人Bryce Roberts談論了傳感器如何把OATV的一大批投資項目聯系起來。英國Path Intelligence公司使用手機簽到功能來統計購物大廈及其他場地的人流量。基于位置的社交網站Foursquare使用傳感器告訴別人你在哪里。RunKeeper軟件可以在你跑步時跟蹤你,這是另一種基于傳感器的應用。
智能手機是一種移動傳感器平臺,這個想法絕對是我認為的計算未來的核心。我認為,它也應該是每個人憧憬的計算未來的核心,因為我們學會使用手機及其他設備中傳感器的方式將是出現重大突破的幾個領域之一。
【編輯推薦】