數據壟斷會不會導致互聯網癱瘓?
編者注:福布斯的Jon Bruner最近對Tim O’Reilly進行了采訪,雙方談到了互聯網的數據壟斷問題。認為數據壟斷的可能性是真實存在的,但是會受到不斷創新的數據收集方式的抑制。此外,由于人們對壟斷的天然厭惡,即便其出現,可能也會成為創新企業的機會。

Google像下圖這樣的車跑遍了在全球的各個街道,Google借此掌握了一個先進的道路情況數據庫。收集的這些數據將會成為其無人駕駛汽車的關鍵部件,而這個數據庫要想從頭復制一遍,其代價也許要高得令人生畏。但是Google所繪制的道路狀況仍有機會讓有些創新企業家用不同的方式進行繪制。
Tim O’Reilly上周跟我談了互聯網公司收購大規模專有數據集一事。“現在出現一股這樣的勢頭,即數據在某些情況下成為壟斷勢力之源,”他告訴我,把數據比作“Intel Inside”之于市場準入門檻。他稍后補充道:“未來還會有很多創新,我相當可以肯定還有空間容納更多這樣的東西。”其風投合伙人Bryce Roberts以一篇文章跟進,預測了Web 2.0的終結—也即我們10年彈冠相慶的用戶生成數據(博客、共享照片、留言板)的自由存在,正被密碼保護阻隔在社交網絡之外。
數據壟斷的可能性真實存在,不過我認為其崛起會受到僅幾年前才出現的數據收集方式的抑制。這個世界的數據不是一家運營商就能掌握的。
以Google Maps為例:通過派遣一輛輛的遙測汽車到全球各地,依靠高清晰照相機、激光測距儀以及GPS接收器來收集數據,Google已經建立了一個高度精確的道路數據庫。這一數據對該公司開發商用自動汽車的的努力極為重要。如果這些汽車普及起來的話,Google將會由于道路數據的質量而擁有了巨大的商業優勢,而對于后來白手起家想要依法炮制者來說,其代價將會是十分高昂的。
不過無論Google打算如何共享或者不打算共享這些道路數據,其所映射的道路就在那里,別的創新企業者還是可以去繪制自己的道路數據。實際上,Google收集道路數據的辦法,也即購買和裝配汽車,然后雇人駕駛穿行全球各地的每一街區,這種辦法早已有點過時。你可以想象,下一個偉大的道路數據庫可能是由照片共享網站上帶地理標記的圖片拼湊匯編而成的3D模型,或是來自于手機或車載資訊通的位置數據聚合而成,藉此可找到道路中心線和推斷出速度限制。
當然,社交網絡有點不一樣:具有隱私意識的用戶已經把海量的有價值數據提交給Facebook,然后用密碼鎖定起來,對于中立的網絡爬蟲來說其可達性沒那么高。一旦你將個人生平和消費喜好交給了Facebook,Facebook當然就可以用它們去賺錢,不過這些個人資料和消費喜好仍舊可以存在于Facebook之外的世界??梢猿霈F在各種各樣其他的東西上,等待著另一家現在也許還沒有出現的公司的接收。除非Facebook找到讓你的生日歸其版權所有的辦法,其數據庫的巨大價值一樣可以為其他尋找相同數據的新公司提供巨大的激勵。
而Facebook為了成為整個社交互聯網的基礎平臺,不管怎樣都會讓自己的用戶數據具備一定程度的自由度。只要用戶允許,該網站的API允許外部應用以與用戶類似的方式操作—發布狀態更新,或者看到“like”。
通過截屏這種方式,你甚至無需得到用戶許可就可以獲取有價值的信息。我曾經寫過腳本,通過提交正確的cookies來扮演一個名為 Testingoutsome Features 的Facebook成員,此人20歲,是阿爾圖納的賓州中央鐵路公司的一位退休消防員,同時是生育運動的粉絲。一個人在自己出生15年之前就已經退休了,還有就是此人有幾天每秒鐘瀏覽多達10個人的檔案,對于這些如此不協調的信息Facebook一點反應都沒有。我還可以提取大概17.5萬左右在薩拉·佩林的Facebook墻上留言的人位置信息—這些都屬于倘若未經用戶許可API訪問不到的數據。誠然,Facebook可以突然關閉訪問,讓自己成為一座牢不可破、僅供自己享用的喧囂之城,但實際上看,市場的某種東西讓Facebook有理由把自己的部分數據泄漏出去。
某些很有前途的數據尚未被大規模收集,也不會像狀態更新數據那樣容易受到壟斷。上周在Where會議上我交談過的大多數人對于獲取周邊數據的新辦法均感到興奮。像Tim在接受我的采訪中提到的Alohar Mobile這樣的公司,希望收集我們不斷釋放出來的各類零散數據—比如通過智能手機的感應器收集我們的運動信息,通過Twitter feed收集我們的想法,然后將其轉化為內容充實的數據集,據此可推斷出一些有用的結論。其結果可能比你所認為的審慎數據還要有價值,因為周邊數據可以被不斷地收集,而且這些數據并不需要人定期地提供,比方說,到一家喜歡的飯店簽到。這還提供了非常棒的背景信息—因為不斷的測量使得理解行為變化更加容易。
大公司在獲取周邊數據方面顯然更有優勢(如果Facebook決定開始收集手機感應器以外的信息的話,其龐大的應用庫會賦予該公司巨大的優勢)不過從某方面看,這類數據要想壟斷會更加困難。
【編輯推薦】