放眼海外,看看美國的數據交易產業是怎樣發展的?
一、美國數據交易的典型模式
美國數據資產交易主要有三種模式。
第一種是數據平臺 C2B 分銷模式。用戶將自己的個人數據貢獻給數據平臺,數據平臺向用戶給付一定數額的商品、貨幣、服務等價物或者優惠、打折、積分等對價利益。
第二種是數據平臺 B2B 集中銷售模式。數據平臺以中間代理人身份為數據提供方和數據購買方提供數據交易撮合服務,數據提供方、數據購買方都是經交易平臺審核認證、自愿從事數據買賣的實體公司;數據提供方往往選擇一種交易平臺支持的交易方式對數據自行定價出售,并按特定交易方式設定數據售賣期限及使用和轉讓條件。美國微軟 Azure、Datamarket、Factual、Infochimps 等數據中間平臺代理數據提供方、數據購買方進行的數據買賣活動,大多屬于此類模式。
第三種是數據平臺 B2B2C 分銷集銷混合模式。數據平臺以數據經紀商(data broker)身份,收集用戶個人數據并將其轉讓、共享與他人,主要以安客誠(Acxiom)、 Corelogic、Datalogix、eBureau、ID Analytics、Intelius、PeekYou、Rapleaf、Recorded Future 等數據經紀商為代表。
美國數據經紀商產業發展現狀。在美國數據交易的三種主要模式中,第三種數據平臺 B2B2C 分銷集銷混合模式發展迅速,目前已經形成相當市場規模,塑造了在美國數據產業中占據重要地位的數據經紀產業。
二、美國九大數據經紀商
Acxiom。為市場營銷和欺詐偵探提供用戶數據和分析服務,數據庫中包括了全球范圍內7億用戶的個人數據,其中包括涉及幾乎每個美國用戶的3000條數據段。
Corelogic。向商業和政府機構提供包括財產信息、消費信息和金融信息在內的用戶數據及其分析服務,其數據庫中包含7.95億條資產交易歷史數據、9300萬條抵押貸款申請信息以及涵蓋99%以上美國住宅物業的1.47億條特定資產信息。
Datalogix。向商業機構提供涵蓋幾乎每個美國家庭、涉及金額超過1萬億美元以上的用戶交易信息。2012年9月,Facebook 宣布與 Datalogix 建立合作伙伴關系,以便評測其10億用戶在社交網站上瀏覽某一產品廣告的頻次與其在某一實體零售店完成購買交易之間的關聯關系。
eBureau。向營銷商、金融公司、在線零售商以及其他商業主體提供預測評級和數據分析服務,最早只是分析某人是否可能成為潛在的優質客戶或者某筆交易是否存在商業欺詐,后來發展為向其客戶提供數以億計的用戶消費記錄,而且每月還以300萬條新增消費記錄的速度在急速增長。
ID Analytics。主要提供以身份認證、交易欺詐檢測和認證為目的的數據分析服務,其認證網絡中包括了數以百億計的數據集成點(aggregated data points)、11億條獨特的身份數據元素,涵蓋了14億條用戶交易信息。
Intelius。向商業機構和客戶提供背景調查和公開記錄信息,其數據庫中包含了200億條以上的公開記錄信息(public record information)。
PeekYou。擁有能夠分析60家社交媒體網站、新聞來源、網站主頁、博客平臺內容的專利技術,向客戶提供詳細的用戶配置文件(consumer profiles)。
Rapleaf。是一家數據集成商,擁有一個以上能夠連接超過80%以上美國用戶電子郵件地址的數據點以及30個其他類型的數據點,并且不斷在其電子郵件地址列表中增補電子郵件用戶年齡、性別、婚姻狀況等信息。
Recorded Future。通過互聯網捕捉用戶和企業的各類歷史數據,利用該類歷史數據分析用戶和企業的未來行為軌跡,截至2014年5月,已經實現對502,591家不同開放互聯網站點各類信息的接入和抓取功能。
三、美國數據經紀商從哪采集數據
美國數據經紀商不是直接從用戶處收集數據,而是主要通過政府來源、商業來源和其他公開可用來源等三個途徑收集數據。由于一個數據經紀商只能提供一個用戶行為軌跡所需的很少數據元素,因此數據經紀商必須將其所掌握的數據匯集起來,描繪出用戶生活更加復雜的多維圖景。
聯邦政府數據源。上述9家數據經紀商中的6家直接從聯邦政府渠道獲得其所需要的數據。
地方政府數據源。有些數據經紀商并非直接從地方政府獲取其所需要的數據,而是通過其他數據經紀商獲取其所需要的地方政府數據,后者往往通過雇傭人員對地方政府官員展開公關,以便獲取對地方政府數據進行編纂和整理的機會;或者與地方政府具有業務往來關系,地方政府同意其在業務往來中自動收集、獲取地方政府數據。
公共數據源(包括社交、博客、互聯網等)。一半以上數據經紀商表示他們收集通信錄、電話本、新聞報道等其他可用公共數據。
商業數據源。除1家數據經紀商外,其余9家數據經紀商都通過廣泛的商業渠道來購買其所需要的用戶個人數據。例如,數據經紀商從零售商、產品目錄公司等渠道購買詳細的商品交易信息,部分數據經紀商還從期刊發行商那里購買詳細的用戶訂閱類型。
互為數據源。數據經紀商的絕大多數商業數據源實際上來自上述9家數據經紀商之外的其他數據經紀商。部分數據經紀商共享同一數據源,每一家數據經紀商都能從不同數據源收集到相同或相近的數據。
四、美國數據經紀商的產品類型
數據經紀商通常提供市場營銷產品、風險控制產品和人員搜索產品等三類數據應用產品。2012年9家主要數據經紀商的三類主要數據產品全年總收入大約為4.26億美元。
市場營銷產品
有5家數據經紀商面向其客戶銷售自己的市場營銷產品,2012年全年營業總收入大約為1.96億美元。美國聯邦貿易委員會(FTC)將數據經紀商的數據營銷產品分為下列幾類:
第一類是直銷產品。包括郵件、電話營銷、電子郵件營銷等三類;
第二類是在線營銷產品。包括通過互聯網向用戶進行營銷(互聯網營銷)、通過移動設備向用戶營銷(移動營銷)以及通過有線電視和衛星電視向用戶營銷(有線電視衛星電視營銷)等三類;
第三類是營銷分析。所有這三類產品都能使數據經紀商的客戶面向其客戶量身定制各類市場營銷信息。
風險控制產品
接受調查的10家數據經紀商中有4家面向市場銷售其自己開發的風險控制產品,2012年的年收入總額為1.77億美元。美國聯邦貿易委員會(FTC)將風險控制產品分為身份認證產品和欺詐偵測產品兩類。
人員搜尋產品
上述9家數據經紀商中有3家面向市場銷售其自己開發的人員搜尋產品,2012年的年收入總額為0.52億美元。人員搜尋產品主要提供用戶個人數據,這類產品能使用戶基于最少的數據元素便能發現最多的用戶相關信息。數據經紀商通常會提醒用戶不要將上述個人數據用于《公平信用報告法案(FCRA) 》規定以外的其他目的,包括就業資格認定、信用評級、保險費評定、房屋買賣以及其他類似或相同目的。
五、美國數據經紀的產業特征
美國數據經紀商有如下產業特征:
數據經紀商通過多種信源廣泛收集用戶個人信息,絕大多數情況下用戶對此并不知情。
數據經紀產業由多層互為提供數據的數據經紀商所組成。數據經紀商不僅為終端用戶提供數據,同時也互相互為提供數據。
數據經紀商收集、存儲著海量數據元素,幾乎覆蓋了每個美國用戶。
數據經紀商聯結并分析用戶數據,以便做出包括潛在敏感推理在內的用戶推理。數據經紀商從用戶數據中推理用戶興趣,根據用戶興趣結合其他信息對用戶進行分類。
數據經紀商將線上線下數據與市場用戶的在線數據相結合。數據經紀商依托網站注冊功能和瀏覽器 cookies 抓取跟蹤功能來發現用戶在線行為軌跡,推理用戶離線行為特征并向其推送在線互聯網廣告。
六、美國數據經紀產業的利弊分析
用戶能從數據經紀商收集、使用數據的眾多目的中真正獲益。數據經紀產品能夠預防欺詐、增加產品銷量、向用戶推送量身定制的廣告。
許多數據的收集和使用行為對用戶造成一定程度的風險。如果用戶因數據經紀商的錯誤而不能完成一項風險控制產品的交易,用戶往往因不知情而使自己受損。
數據經紀商一定程度上會向用戶提供其個人數據的選擇權,但是這些選擇權絕大多數情況下是不完整、不可兌現的。用戶通常情況下不知在哪里去行使其選擇權或者不知如何行使選擇權。
儲存用戶數據永遠都具有不可預知的安全風險。雖然存儲數據對于實現未來商業目的是有益的,但是數據存儲的安全風險可能要遠遠大于其商業利益。
七、對我國大數據交易的借鑒意義
參照美國數據經紀產業發展模式,以數據開放共享推動大數據交易資源建設,以交易和產品雙足運行推動大數據交易時新發展,可能是我國未來大數據交易產業健康良性發展的可選之路。
一是大力推進公共數據開放共享。堅持政府數據以開放為原則、不開放為例外,堅持政府數據開放先行、公共數據開放跟進,推進落實公共數據開放共享,為數據交易產業提供不竭資源源泉,活躍、繁榮數據交易產業,做大作強數據交易產業量體。
二是夯實大數據交易基本功能。鼓勵數據交易機構積極探索實踐,推動大數據供需有效對接,搭建大數據討價議價撮合機制,探索大數據交易交割模式,增強大數據流通變現能力,引導大數據資源以多種價值形態參與社會生產生活活動。
三是構建適用于大數據交易的云端集散中心。鼓勵數據交易機構積極申辦云存儲中心、對象存儲空間、可尋址存儲空間、云數據多點共享協同中心、集聚式自助管理系統、中央存儲平臺等云交易系統,通過云平臺實現數據集中,形成自主可控且能增值利用的大數據集散中心。逐步面向社會公眾開放數據接口,引導第三方數據開發者和社會力量對數據進行社會化開發、匯聚和整合,推動大數據按照等價支付、有序流動的原則在云架構中進行自由流動,帶動整個數據價值鏈的規模化發展。
四是與數據源保持同步更新數據。數據交易機構應當與數據源簽署明確的數據更新協議,按照數據源數據升級時間表的頻度,與數據源按日、按周、按月、按半年或按年同步升級數據。由于用戶本人往往是最原始、最可靠的數據源,為了激發基于用戶身份信息(PII)的用戶端應用和服務的創新浪潮,用戶應當被賦予明確的權利,以便其能夠以可行、機器可讀的方式接入用戶個人數據,使得用戶能夠表達其政策訴求、使用偏好和締約要求,推動用戶和數據源簽約公司共同參與大數據的治理和精用。
五是推動大數據交易和大數據應用連體融通發展。數據交易機構應當瞄準重要行業的重大應用需求,利用前沿性的大數據分析挖掘技術,實施大數據資源價值的深度分析和關聯開發,探索富具市場特色、滿足市場特需的數據創新應用模式,形成適用于重點行業大數據挖掘技術、分析流程、領域模型等關鍵應用和產品。
六是打造全國性的大數據交易產業鏈。數據交易機構應當以推動數據資源開放、流通、應用為宗旨,廣泛聚集大數據提供方、數據開發者、大數據交互平臺、大數據使用方及數據投資者,推廣應用個性化醫療、數字金融、智能交通、精準營銷等基于大數據的新型商業模式,在基礎設施、數據資源、數據應用等關鍵環節形成產業合力,打造全國性的大數據流通、開發、應用產業鏈。