大數據時代人們開始擔憂“數據暴政”
上知天文、下知地理、運籌帷幄、決勝千里,這說的可不是諸葛亮再世,而是當下最時髦的“大數據”。
什么是大數據?目前尚無一個標準概念,那些你在網上瀏覽新聞、收發郵件、下單購物等網絡“足跡”都以“數據”的形式被記錄并存儲下來。分析這些可追蹤、可分析、可量化的數據,能夠影響商業領域、醫療行業、政府機構的工作模式。
據《明鏡周刊》報道,2012年互聯網共產生2.8個10"21字節(1個10"21字節=1,000,000,000,000,000,000千字節),專家預測到2020年,新數據將增加到40個10"21字節,到那時,每天新增的數據就需要205億個DVD光盤來存儲,且每隔兩年這個數據將成倍增加。
《紐約時報》《明鏡周刊》接連發表文章分析大數據對各行各業的改變,并探討對“數據暴政”(指數據驅動時代里人的隱私空間和創新能力)的擔憂。
編譯/許敏
[IT業] 數據也可以轉變成金錢
臉書10億用戶的數據信息至少值1000億美元
谷歌和臉書(國外的社交網站)就是純粹的大數據。他們的商業模式是建立在對用戶信息的收集、分析和分類之上,廣告商通過分析結果可以精準地投放廣告。對臉書的投資商而言,臉書10億用戶的數據信息至少值1000億美元(約合人民幣6131億元)。
目前,業界將大數據的商業機會分為兩類:一類是以IBM、微軟、惠普等公司提供“硬件+軟件+數據”的整體解決方案為代表,它以平臺性為特征,提供基礎服務;另一類是以臉書、亞馬遜、谷歌等公司為代表,基于自身海量的用戶信息,提供精準營銷和個性化廣告推介等。
2012年,運用大數據的全球貿易達46億歐元(約合人民幣365億元),預計到2016年,這個數字將達到160億歐元(約合人民幣1272億元)。
[公務] 警察吃著午飯抓到小偷
大數據使用一年,圣克魯斯市盜竊案下降11%,警方破案率提高56%
大數據是很多人的幫手,但對于小偷來說卻是絆腳石。
美國加利福尼亞圣克魯斯市的警察在地下停車場附近就餐,沒幾分鐘就抓住了一名偷車賊。神奇吧?其實,警察之所以會選擇中午時分在停車場附近就餐,是因為大數據告訴他們那個點可能出現偷車行為。
過去兩年,圣克魯斯市近100個警察局在日常工作中都用到了大數據,通過分析警方提供的相關數據,大數據預測具體時間、具體地點可能會發生盜竊、搶劫、偷車等行為,幫助警方辦案。不過殺人等行為暫時沒法預測。
“一開始,我們對此都很懷疑。”圣克魯斯市警察局副局長斯蒂芬·克拉克說。“但這些數據證明了自己的準確性和有效性。”斯蒂芬介紹,大數據使用一年來,圣克魯斯市的盜竊案下降11%,偷車案下降8%;警方破案率提高了56%。
[娛樂] 網站預測《紙牌屋》會紅
Netflix在全世界有3300萬用戶,比誰都清楚大家喜歡看什么電影
美國在線觀影網站Netflix也受益于大數據。
Netflix最開始的業務是出租DVD,現在為3600萬客戶提供在線觀看電影業務。通過眾多數據分析,Netflix成功預測美劇《紙牌屋》會紅。
Netflix在美國有2700萬訂閱用戶,在全世界有3300萬,它比誰都清楚大家喜歡看什么樣的電影和電視。有研究表明每天的高峰時段網絡下載量都是出自Netflix的流媒體服務,去年人們在網上看流媒體視頻的時間比看實體DVD的時間還多。每天用戶在Netflix上產生3000萬個行為,比如你暫停、回放或者快進時都會產生一個行為,Netflix的訂閱用戶每天還會給出400萬個評分,還會有300萬次搜索請求,詢問劇集播放時間和設備。
它知道用戶很喜歡戴維·芬奇(《七宗罪》的導演),也知道凱文·史派西主演的片子表現都不錯,還知道英劇版的《紙牌屋》很受歡迎,三者的交集預測了《紙牌屋》的成功。
[生活] “魔法地毯”能自動報警
地毯存儲步伐次數,如果屋主的步數少于正常范圍,會發出警報
曼徹斯特大學利用大數據發明了一種“魔法地毯”,它能幫助獨居者在出現異常時及時發出警示。從外表上看,“魔法地毯”和普通地毯沒啥區別,同樣鋪在地板上,但“魔法地毯”存儲了獨居者每天走路的步伐次數。如果獨居者這一天走路的步數少于正常范圍,“魔法地毯”就會發出警報,盡早提醒是否出現意外。
由85個雇員組成的公司BlueYonder是一家分析大數據的公司。該公司通過綜合梳理超市刷卡信息、天氣資訊、學校放假信息以及交通報告等數據,為像沃爾瑪這樣的零售商提供“精準的預測”。
這些“預測”對商家來說非常重要,因為它能避免發貨錯誤、降低存儲成本。
舉個例子,BlueYonder曾建議某家超市將牛奶、巧克力棒和蘋果放在一起,幾天之后,這三種商品銷售量大增。真正的原因是,BlueYonder了解到超市附近新開一所學校,公司分析了人群特征得出了結論。
觀點:需要警惕“數據暴政”
沒錯,大數據之于商業等領域真是如虎添翼。但對普通消費者來說,利與弊孰輕孰重?
一份由奧美公司所作的調查報告顯示,75%的人不希望企業存儲自己的個人信息,有90%的人反對企業收集自己上網瀏覽網頁的記錄。
微軟研究院的高級研究員博伊德曾表示:“如今,我們社交網絡化的社會絕對有制造恐慌的天分。在大數據時代,對隱私泄露的擔憂就是強大的緊張和焦慮的源泉。人們普遍認為,最令人焦慮的在于你根本不知道什么時候自己的隱私就無意中被泄露出去。”
人們最擔心的,是對這種數據的無限制利用。美國暢銷書《爆發》中指出,人的行為看似隨機無序,但實際上是存在某種規律的。社交網絡如此發達的今天,大數據把人的行為進行放大分析,從而能夠相對準確地預測人的性格和行程。所以,不排除有這樣一種可能:在忙完了一天的工作之后,你還沒有決定要去哪兒,數據中心卻早就先于你準確預測了接下來的目的地。
這向我們提出警醒:大數據時代,如何界定大數據的權益歸屬?如何控制大數據的使用風險?如何保持我們全社會的數據民主?
另外,有多少人會真的愿意接受一個“數字驅動經濟”的世界?那些數據能預測你的孩子在學校表現得怎樣、什么工作適合他/她、他/她有多大可能會變成罪犯、有多大可能會患病,你真的愿意活在一個如此清晰預測未來的世界?
電視臺或音樂唱片公司通過數據分析能夠較好地迎合觀眾或聽眾的口味,但對于創意產業來說真的利大于弊嗎?那些創新、直覺和驚喜又去哪里了呢?
互聯網專家葉夫根尼·莫羅佐夫提出“數據暴政”的概念,他指出,那些基于大數據制定的政治、經濟決策,每隔一段時間要由獨立的審計員進行核查,以防出現濫用數字力量的情況。