奧巴馬競選幕后CTO:大數(shù)據(jù)就是胡扯!
Harper Reed曾是在幕后助力奧巴馬在2012年競選連任的首席技術(shù)官,日前他在澳大利亞悉尼舉行的CeBIT大會上稱大數(shù)據(jù)就是“胡扯”!
他說,他最早在2007年接觸到“大數(shù)據(jù)”這個詞,當(dāng)時是指一種存儲方面的難題。“我們在2007年使用這個詞,當(dāng)時是指數(shù)據(jù)難以保存。當(dāng)時做大數(shù)據(jù)的人做得很好。”但是并非每個人都做得很好,知道如何做,或者有這么做的工具。6年之后,像Hadoop和Hbase意味著保存和準(zhǔn)備大量的數(shù)據(jù)用于分析,這些不再是復(fù)雜的難題,但是“大數(shù)據(jù)”這個詞依然存在。
Reed更希望“大數(shù)據(jù)”這個詞沒有得到如此廣泛的使用,因為他認(rèn)為很多考慮對大數(shù)據(jù)進(jìn)行投資的人,可能并沒有足夠多的數(shù)據(jù)能稱得上大數(shù)據(jù)。
作為奧巴馬2012年競選的首席數(shù)據(jù)科學(xué)家,Rayid Ghani表示認(rèn)同Reed的觀點(diǎn)。他透露說,他個人在國內(nèi)存儲的數(shù)據(jù)比競選中使用的數(shù)據(jù)更多。
所以Reed認(rèn)為,這次CeBIT大會的參會者中,少有人的數(shù)據(jù)量可以真正稱之為“大”。
他說:“你可能會中等量的數(shù)據(jù)。”他認(rèn)為大數(shù)據(jù)這個詞現(xiàn)在更多地代表著分析工具,而非數(shù)據(jù)本身。
即使是“大”數(shù)據(jù)或者“中量”的數(shù)據(jù)包含的個人信息,Ghani表示,分析過程也可能并沒有用之來得出有價值的東西。
他說:“比如,你開什么樣的車,這種數(shù)據(jù)信息在競選中是沒什么用處的。我們并不使用這種私人數(shù)據(jù)。”他表示,比較有用處的是簡單的數(shù)據(jù)點(diǎn),例如對“你支持總統(tǒng)嗎?”這種問題的回答。對問題的回答,以及個人是否曾經(jīng)參加過競選,奧巴馬的團(tuán)隊利用這些信息可以識別出哪些人是值得他們關(guān)注的。
Reed還提醒25歲以上的人們不要對隱私問題感到恐慌。年齡稍大一些的人會對像Facebook挖掘用戶信息這樣的事耿耿于懷,而年輕人則對使用服務(wù)的隱私控制比較了解。他說,年齡稍大的人并不會費(fèi)心去了解關(guān)于隱私控制的事情,因此他們對自己隱私的擔(dān)憂是普遍存在的。“不要將我們自己的恐懼投射給別人。”