劍橋大學(xué)專家觀點:大數(shù)據(jù),大責(zé)任
大數(shù)據(jù)如今已成為媒體大肆炒作的對象。以超快速度處理大量信息的能力,正在顛覆全球各地的商業(yè)模式。但大數(shù)據(jù)與一切技術(shù)一樣,也會帶來風(fēng)險。所有的技術(shù)使用者都應(yīng)注意:大數(shù)據(jù)意味著大責(zé)任。
近期我與他人聯(lián)合主持的一項研究得出結(jié)論:僅僅使用公開的Facebook“贊”(Like)信息,也能瞬時生成極為詳盡的用戶心理-人口特征資料,包括種族、性格、智商分?jǐn)?shù)、幸福感、藥物使用、性取向、政治觀點和宗教信仰等有效的個人統(tǒng)計信息。
一旦掌握了數(shù)據(jù),便不難建立起能夠自動更新的模型。我們抽取了5.8萬個Facebook資料的“贊”和個人屬性信息,并通過自己的調(diào)查表加以衡量——我們沒有理由認(rèn)為研究結(jié)果不具有代表性。
推測的依據(jù)不是那些規(guī)模不大、一眼便可看出聯(lián)系的“贊”數(shù)據(jù)集。對科學(xué)感興趣與智力水平高存在聯(lián)系,但喜歡炸薯圈或鐘愛摩根?弗里曼(Morgan Freeman)的嗓音也同樣具有信息量。將成千上萬類似數(shù)據(jù)聚合在一起,就能有效地推斷出個人特征。
Facebook只是開始。“贊”是一類可用于推測的數(shù)字記錄,而其他種類的數(shù)字記錄還包括Twitter消息、電子郵件、網(wǎng)絡(luò)搜索、瀏覽記錄、信用卡交易和線上/線下的購物信息。
與任何偉大的技術(shù)一樣,這種推測功能既可以為善,也可以作惡。
快速、自動化的心理評估可能對招聘產(chǎn)生革命性的影響。何不先對數(shù)百萬名應(yīng)聘者進行評估(在征得他們同意的情況下),再邀請最適合的一小部分人參加面試?這對招聘方和應(yīng)聘者都是省時省錢的方法。何不根據(jù)個人特征自動調(diào)整產(chǎn)品和服務(wù)?試想一下,英國《金融時報》能夠根據(jù)個人性格和情緒針對性地推薦在線文章。再試想一下,開放、外向的人和保守、內(nèi)向的人搜索“倫敦過夜”時,可以得到不同的結(jié)果。
當(dāng)然,這也有不利的一面。個性化的廣告或許會被認(rèn)為對用戶和廣告商都有好處,但如果力量的天平向廣告商傾斜,可能會把顧客玩弄于股掌之中。一位情緒不穩(wěn)定的用戶可能會因為其心理特征而被誘導(dǎo)購買不必要的保險。推測某些特征的能力甚至?xí)θ藥砦kU。目前已經(jīng)可能推斷出用戶的性取向或宗教信仰,這會令他們的安全受到危害——這種情況不僅僅發(fā)生在不太自由的國家。
由于意識到播放列表、購物記錄和“贊”能夠泄露如此多的信息,許多人可能對在線技術(shù)望而卻步。在我看來,這種“數(shù)字排斥”對個人和經(jīng)濟而言都不是好事。推測個人特征和喜好的潛力是巨大的。我不是政策制定者,但我相信,我們應(yīng)當(dāng)設(shè)計出盡量降低相關(guān)風(fēng)險的政策和工具。我們應(yīng)當(dāng)遵循兩項原則:透明度和控制權(quán)。
首先,我們需要幫助用戶了解,他們的哪些個人數(shù)據(jù)是公開的,這些數(shù)據(jù)目前和潛在的用途是什么。其次,我們需要讓用戶完全控制住自己的數(shù)據(jù),自行決定數(shù)據(jù)將如何得到使用。這兩方面可能已出現(xiàn)了技術(shù)解決方案,但還需要培養(yǎng)用戶意識,并建立合適的法律框架。
對可用于推斷的數(shù)據(jù),用戶應(yīng)享有完全的控制權(quán)。由公司和政府等第三方存儲并管理個人數(shù)據(jù),已經(jīng)成為通行做法。但一定要這樣做嗎?試想“贊”或購買記錄并不存儲在社交網(wǎng)絡(luò)或網(wǎng)店中,而是安全地保存在你的電腦或個人云帳戶中。推測仍然可以進行,但會受到用戶的控制,讓用戶能夠?qū)徍藢€人特征的推斷結(jié)果。
我愛Facebook。它是將人們聯(lián)系在一起的偉大技術(shù)。我希望助一臂之力,確保我們在知道個人信息安全情況下繼續(xù)利用這一技術(shù)。
本文作者為英國劍橋大學(xué)心理測量學(xué)中心(Cambridge University's Psychometrics Centre)研究員。他與心理測量學(xué)中心的同事大衛(wèi)?史迪威(David Stillwell)和微軟研究院(Microsoft Research)的托雷?格雷佩爾(Thore Graepel)合著了這項有關(guān)個人特征的研究報告。