解密奧巴馬的大數據精準營銷戰
政治選舉和產品營銷本質上沒有什么區別,兩者都是通過各種營銷手段, 把候選人最終“賣給”選民的過程。因此,隨著社會化網絡和大數據分析與營銷的進一步融合,美國總統大選已經演變成了一場基于大數據分析的精準營銷大對決(2012年奧巴馬競選團隊的數據科學家數量比上次競選增長了五倍)。在“數據科學家如何幫助奧巴馬TKO羅姆尼”一文中,我們揭示了奧巴馬競選團隊的獲勝密碼——社會化分析+個性化精準營銷,但其中的戰術細節、使用的新工具、新方法等“微創新”依然鮮為人知。
最近,MIT科技評論的一篇深度報道詳細復盤了美國大選中的數據分析戰。 文中的觀點和信息雖然在我國的選舉中用處不大,但 對企業營銷人士來說還是很有借鑒意義——正如哈佛商業評論所言:數據驅動的決策可以讓管理者不再依賴直覺。你只需要將總統替換成“某品牌牛奶”,將選民替換成“消費者”,就可以將美國總統大選作為結合大數據分析的精準營銷案例進行解讀。 以下將該報道為大家編譯整理如下:
2010年, 在奧巴馬入主白宮后的兩年后, 民主黨在中期選舉中慘敗。 民主黨在國會中的優勢, 保證了奧巴馬的金融改革和醫療改革的順利進行。而在2010年中期選舉后, 民主黨在眾議院的席位的優勢地位被共和黨取代。 在參議院中, 也僅僅以微弱優勢勉強保住席位優勢。如果說中期選舉是奧巴馬及民主黨全國委員會的期中考試的話, 很明顯,這個成績是 “不及格”。
“不及格”也不一定完全是壞事。 至少 Dan Wagner是這么認為的。 這位數據分析的專家在2009年就被民主黨全國委員會任命為總監, 負責收集和分析選民信息,以幫助民主黨選舉團隊以電話和直郵方式進行選舉宣傳。 Dan Wagner把收集來的選民信息輸入他的統計模型, 生成了一系列關于選民態度和偏好的分析報告。他要求民主黨的技術部門的工程師們據此開發出了一套軟件。 他把這套軟件叫做“Survey Manager”。#p#
預測結果誤差不到2.5%
這一年秋天, 在紐約州國會議院的特別選舉中, 早在選舉日之前很多天, Dan Wagner的Survey Manager就預測出的正確的選舉結果,而預測選票與實際結果的票數差不到150張選票。 一個月以后, 由于馬薩諸塞州的愛德華 肯尼迪參議員的去世, 馬薩諸塞州也舉行了國會特別選舉來填補肯尼迪參議員的空位。在這場選戰中, 人們普遍認為民主黨候選人Martha Coakley將毫無疑問在這個傳統的民主黨大本營的州獲勝。而Dan Wagner的Survey Manager則正確地預測出了共和黨候選人Scott Brown將最終獲勝。這些預測引起了民主黨全國委員會的重視。 奧巴馬全國競選陣營的副總監Jeremy Bird說:“當你正確預測我們能贏是一回事,而當你能正確預測我們會輸, 就是另一回事了。”
而這個“另一回事”, 是在“會輸”的5個月前就做出的預測。 從6月份開始, Dan Wager就建立模型, 對國會選舉的74個選區的部分參議員選舉結果進行預測。 而這些預測的結果“令人難以置信”的準確。 Dan Wager并沒有采取傳統的抽樣分析的方式, 而是一個一個選民進行統計。 他最初預計到民主黨將會在中期選舉中有麻煩來自于幾千個民主黨的調查電話的反饋結果與民主黨的選民數據庫的比對。 根據調查電話的反饋。 那些民主黨的鐵桿選民表示將要去投票的比例,要大大低于概率統計所預計的比例。 而Wager能夠準確地衡量出民主黨每次的競選宣傳活動所能提升的選民支持率。 從這些分析, Wagner認為, 民主黨的宣傳活動所能去的的效果, 不足以彌補與共和黨在支持率上的差距。
他的預測與最終結果的差距平均不到2.5%。 “這讓很多不明白這些預測背后的數學模型的人,也理解了這些數學模型能產生的價值”。 奧巴馬競選陣營的總監Mitch Steward補充道:“自從國會特別選舉結束后,他的預測在民主黨就成了金科玉律了。”#p#
顛覆傳統調查方法
Dan Wagner的成就, 遠遠不止在選舉前幾個月預測出選舉結果這么簡單。 Wagner和他的數據分析師團隊改變了20世紀以來一直沿用的公眾調查方法。
傳統的調查, 通過對人群分類, 對每類人群選取一部分樣本, 以樣本來代表這類人群。而Dan Wagner和他的團隊, 則是針對每一個個體選民進行統計, 他們的預測是基于每個個體選民的偏好做出的。他的技術給公眾調查提供了新的思路。 公眾調查的人群可以不再是以簡單的區域政治區分或者像傳統的政治宣傳或者商業宣傳的用戶細分一樣采用傳統的人群特征 如年齡, 性別等進行分類。而是可以針對每一個個體選民的特征的綜合。 候選人可以根據這些個體選民的情況, 進行針對到每個人的個性化宣傳。
照片:Dan Wagner, 奧巴馬2012年競選團隊首席分析師(長的有點像比爾 蓋茨)
在奧巴馬的2012年的選舉勝利, 要歸功于他的那只強大的技術團隊。這個團隊, 使得奧巴馬的支持選民可以輕松地通過網站, 社會化媒體, 以及移動設備來參加到奧巴馬的競選過程中。 他們設計的移動APP,可以使奧巴馬的助選人員直接打印宣傳材料, 而親自不必跑到每個競選辦公室去; 他們設計了一個網站, 采用游戲積分墻形式的Dashboard,顯示在籌款活動中捐款者的排名; 他們還設計了一款叫做“target sharing”的挖掘工具, 幫助每一個奧巴馬支持者從自己的Facebook好友中, 找出那些合適的宣傳對象。
在這一切的背后, 是一套對選民的評分系統。 這套評分體系可以針對每個選民進行預測。 使得每次競選時,不但可以知道某個用戶是誰, 還可以知道如何才能去影響用戶。#p#
選民的評分系統
4年前, 24歲的Dan Wagner在芝加哥的一個咨詢公司里做分析師,他采用芝加哥大學研究的軟件進行計量經濟學方面的分析。 當他知道伊利諾伊州參議員奧巴馬決定競選美國總統時, 他決定應該為他的老鄉做些支持。 于是, 他加入了奧巴馬的競選團隊。他的工作從選民數據輸入開始, 隨著奧巴馬競選的展開, 他對選民數據采集以及利用統計模型分析選民數據越來越熟悉。 很快, 他被任命為大湖/俄亥俄河谷地區的首席用戶分析。 這一地區一直是美國總統選舉爭奪最激烈的地區。
隨著奧巴馬2008年的勝利, 他的高級幕僚們大多數都去了華盛頓去準備政府工作。而Dan Wagner則留在竟選總結小組, 對競選中的技術環節進行總結, 找出不足。
在2008年的競選中, 奧巴馬的團隊的分析師們創造出了一套評分體系。它給每一個選民進行兩類評分, 一個用來評估用戶參與投票的可能性, 一個用來評估用戶支持奧巴馬的可能性。 這些評分的基礎來自于大量的調查。 在每一個爭奪激烈的州,奧巴馬的呼叫中心每周會進行5000到10000個短調查用來衡量用戶的支持偏好,還會向傳統社會調查那樣進行1000個左右的更深入的調查。 根據選民登記信息, 消費者數據庫, 選民過去投票情況,再結合這些數據, 分析師們建立了一個預測每個個體選民的支持偏好的算法。

這套系統的價值非同小可。 它可以形成一個針對性宣傳的閉環。 它可以指導志愿者去敲哪些選民的門或者打哪些選民的電話,而通過志愿者與這些選民的交談記錄的反饋回服務器, 算法模型可以指導志愿者是否應該去敲下一家的門。 這種模型的效率和規模性使得民主黨在對選民分析中占得先機。 當時共和黨候選人麥凱恩的分析團隊,只能根據選民的數據進行根據統計模型一次性靜態的分析, 無法在選舉過程中根據不是事件作動態的分析。 而奧巴馬的團隊, 則可以根據實時的反饋數據, 每周做出動態分析。比如麥凱恩指定阿拉斯加州的女州長佩林做副總統競選人, 或者雷曼兄弟倒閉 這樣的事件, 對選民支持率的影響等等。
不過, 奧巴馬的團隊的數據架構也是有缺陷的。 那就是是選民的信息數據與競選過程中與選民互動的數據是相互孤立的。主要的原因由于這些系統是由不同的公司開發的。 而他們并沒有必要把這些不同的系統統一起來。
競選總結小組認為, 在下一次競選的時候, 這樣的情況需要得到改善。 它提出的報告, 建議民主黨建立一套“選民關系管理系統”,可以使在整個競選團隊成員, 對目標人群不是簡單的按照投票人, 志愿者, 捐款者或者網站用戶來看, 而是把他們不同方面的信息整合起來, 做為一個“公民“來全面衡量。 “我們意識到我們的數據架構在不同競選團隊之間的數據共享和整合方面有問題。 我們應該整合數據, 提供選民的全面信息。” 總結小組的數據庫應用開發工程師Chris Wegrzyn 這樣說道。
Chris Wegrzyn是民主黨全國委員會的首席分析程序員。他負責一系列系統和軟件的采購, 這些采購的目的, 就是使競選團隊能夠擺脫對單個供應商的依賴, 按照自己的需求搭建系統。 為此, 民主黨安裝了一套西門子的企業級電話呼叫系統,可以每天進行120萬次電話外呼來進行選民調查。 此外, 他們還購買了價值28萬美元的HP的Verica軟件, 使得他們不但可以訪問民主黨自己的1億8千萬選民數據庫, 還可以獲得所有通過網絡與奧巴馬競選團隊有交流的選民,志愿者或者捐款者的信息。
2008年后去華盛頓的團隊成員, 在2011年第二任競選時大多數又回到了芝加哥繼續工作。經歷了2010年中期選舉的慘敗后, 他們對Dan Wagner的分析到原子級的模型倍加欣賞。作為第二任選舉, 他們要做的事情很簡單, 那就是, 讓那些2008年投給奧巴馬的選民繼續投給奧巴馬。 為此, 他們需要成功的動員選民投票,同時吸引新選民來彌補一些不投給奧巴馬的老選民的空缺。
在2012年選舉年開始的時候, 奧巴馬團隊已經擁有所有2008年投票給他的69,456,897名選民的姓名。 選民在投票時可以采用匿名投票, 不過, 奧巴馬團隊的分析師們可以通過在各選區的民主黨的統計, 分析出那些投票給奧巴馬的選民的姓名。 有分析人士在電視上只是抽象地說奧巴馬的2012年選舉是“重塑08年的支持者陣營”。 而在奧巴馬競選團隊里, 他們真的是在一個選民接一個選民的“重塑”08年的支持者陣營。#p#
實驗
當Jim Messina被任命為奧巴馬競選團隊的主管后, 他給下屬定了這樣一條規定“任何決定都必須以量化的數據為基礎”。 不過, 這與2008年奧巴馬第一次競選時人們常常提到的“以數據為導向”的方式還是有所不同的。 當時奧巴馬的競選團隊主管David Plouffe, 就致力于以“選舉工程學”的方式, 挑戰執政的共和黨。 他熱衷于各類指標, 表格以及報告。 Pouffe想要了解的問題包括”上周末某個地區競選辦公室的志愿者是如何安排的”以及“某次籌款活動具體籌到的款項是多少”這樣的問題。
盡管2008年的競選中對數據的依賴性很高, 08年的競選并沒有采用21世紀政治中最重要的創新方法。 1998年, 耶魯大學的Don Green 和Alan Gerber進行了政治學上第一次的隨機控制性實驗。 他們通過對紐黑文選民隨機地通過郵件, 電話或者拜訪的形式進行投票動員。 然后統計何種方式能夠達到最大的效果。 這掀起了一股實驗性的熱潮 Don Green, Alan Gerber及隨后的其他研究者對于投票動員, 面談以及不同競選口號進行研究, 以確定不同方式的不同效果。
在2008年競選中, 奧巴馬團隊采納了這些研究中的一些研究成果來幫助修改宣傳文案或者是談話腳本,但是從方法論上采用這種實驗式的方式。 從Dan Wagner開始, 民主黨決定進行他們自己的實驗。 Dan Wagner說:“我希望全國委員會成為民主黨的研究的主要推動力量。”
為此, 他聘請了華盛頓的研究機構Analyst Institute 來協調各種不同的實驗性研究。 其中很多的研究是關于選民注冊這個方面的, 因為這個方面最容易進行量化衡量。其中一個研究發現,選民注冊不需要僅僅是被動等待,也就是說, 競選組織者不必只是坐等未注冊選民上門, 領取注冊表格, 然后等他們投票。 通過新技術, 可以分析所有適齡的居民, 比對選民注冊數據, 找出未注冊的選民。通過一些商業數據庫, 可以得到選民的家庭地址。 而通過定向模型可以判斷出該選民是民主黨還是共和黨支持者, 競選團隊可以據此給選民寄送選民注冊資料。
民主黨的競選團隊還包括了來自Analyst Institute的社會學家。 團隊知道吸引更多的民主黨支持者去投票是2012年選舉成功的關鍵。不過競選團隊的計劃, 可不是僅僅地讓那些未注冊的支持者去注冊投票那么簡單, 他們野心勃勃地想挑戰現代政治里最困難的部分, 那就是, 改變人們的支持傾向。
隨著數據能夠詳細到個人, 這樣的改變傾向的實驗變得可行了。 通常這類的實驗可以計算出實驗對于整個人群的態度改變的效果。而現在則可以衡量到每個個體選民被某次宣傳所改變的程度。 從2006年開始, 已經有研究表明這樣類似的可控性實驗的可行性了。實驗用直郵方式宣傳某個民主黨州長候選人, 發現這種方式對那些完全黨派中立的選民的影響, 反而要遠遠小于那些輕微親共和黨的選民。
這個研究以及其他一系列后續研究, 揭示了傳統的針對性宣傳的局限性。 這些宣傳基于一些人們長期以來認定的假設,例如 中間派的選民最容易被說服, 但是這些實驗提出了另外一些不確定性因素。 那些50%可能性投票給民主黨或者共和黨的人,可能是因為兩黨都在爭取而變得猶豫不決。 也可能僅僅是因為他的數據缺失而導致兩黨都沒有關注他。 Chris Wyant在2008年是奧巴馬競選團隊的地面組織者, 現在則是2012年團隊在俄亥俄州競選的總監, 他說:“其實我們對那些50%可能性投票的選民的了解最少, 我們對能夠說服他們都沒把握。”

競選團隊用來發現那些最可能投票的選民的方式, 被Analyst Institute稱為“實驗性項目”(Experiment-Informed-Program, EIP)用來測試不同的宣傳口號或文案對于影響公眾支持率的有效程度。
傳統的方式, 一般是采用Focus Group 的形式,通過小組的投票, 確定那類語言表述最合適。 這樣做的缺點就是結論可能會因為Focus Group的設置或者樣本過小而不夠準確甚至歪曲。 Mitch Stewart說:
“這聽起來挺不可思議的, 一個全國性的宣傳, 決策卻基于一個160人的樣本? 而人們在過去幾十年居然一直是這樣做的!”
而EIP則是利用傳統的形式, 先確定一系列宣傳表述,然后在拿到實際場景中進行實驗。比如說, 就奧巴馬的某個相同政策, 實驗人員會有4類不同的宣傳表述,實驗人員會通過直郵, 隨機地給實驗選民某個宣傳表述。然后通過跟進的電話調查, 來確定各個表述對選民支持度的改變的效果。
2012年3月, 競選團隊測試了不同宣傳表述對奧巴馬醫療政策的效果。 一類表述主要闡述了奧巴馬的政策改革,另一類則重點宣傳選民們能夠得到更多免費體檢等好處。 實驗測試了不同特征(如年齡, 性別等)對不同宣傳表述的反應。 特別是婦女, 比如, 老年婦女對關于政策中關于加強預防性提示的政策更加接受,而年輕婦女則對其中關于避孕的保險以及禁止保險公司向婦女多收保費等政策更加青睞。
在Paul Ryan被提名為共和黨的副總統候選人之后,奧巴馬競選團隊做了關于針對奧巴馬醫療保險改革批評的EIP實驗(編者: Paul Ryan在競選中主要抨擊的是奧巴馬的醫療改革方案)。 當時, 對奧巴馬醫療改革方案的反對聲很大。 競選團隊的公關負責人Terry Walsh說:“我們從EIP中, 發現了一些贏得支持的機會, 這太令人興奮了。 因為當時我們幾乎聽到的都是反對的聲音。” 這樣的發現, 是傳統的社會調查所做不到的。這些傳統的方式很難動態地發現人們觀點的改變。 通過EIP, 競選團隊發現, 45歲到65歲的人群, 相比65歲以上的人群, 在聽到奧巴馬關于醫療保險改革的解釋后, 更容易提高對奧巴馬的支持程度。 而65歲以上的人群恰恰是奧巴馬醫療改革的最大受益者。
在另外一個EIP實驗中, 競選團隊發現,那些對奧巴馬關于婦女同工同酬以及健康保護的觀點贊同的人們, 主要是一些對奧巴馬支持概率在20%到40%之間的人。 也就是說, 這些人基本贊同共和黨的觀點, 但是在婦女問題上與共和黨觀點不一致。 于是, 在競選宣傳時, 奧巴馬專門就婦女問題單獨進行了闡述。目的就是為了爭取這部分選民的支持。 Terry Walsh說:“關于婦女問題的闡述的目的, 就是要把選票從羅姆尼手里奪過來。 如果我們就某個特定議題進行闡述, 我們有可能說服那些對奧巴馬支持程度較低的選民轉而支持奧巴馬。”
此外, 奧巴馬的競選團隊還利用EIP實驗,展開了大規模的志愿者一對一勸說活動。 傳統上的政治競選, 通常都是通過大眾媒體渠道來闡述自己的政治觀點。 利用志愿者進行一對一勸說有很高的風險。 比如你可能不知道哪些選民能夠被勸說。可能會在那里碰到競爭對手, 志愿者也不一定知道用什么樣的語言去打動選民等等。 Jeremy Bird說:“如果用不好,這樣做可能會有負面影響, 反而會影響候選人。”
從2012年2月開始, 奧巴馬的志愿者們總共進行了50萬次的一對一勸說。 在此之前, 競選團隊先是隨機地進行電話訪問,志愿者通過電話訪談記錄, 確定出一對一勸說可能有效的選民組。“通過談話, 你就會發現的確有些人比其他人更容易被改變。”Jeremy Bird說。 然后, 分析師們就對這些目標選民的可勸說程度, 根據選民的各種特征值, 進行評分, 從0到10, 來表明通過一次勸說, 該選民會轉而支持奧巴馬的可能性。 這個實驗還讓各地的競選辦公室教會志愿者如何去說服選民。 加州的志愿者就是一個例子。盡管加州不是一個競選激烈的州, 志愿者利用電話勸說其他州的選民成為奧巴馬支持者的轉化率相當的高。
有了這些EIP實驗, 奧巴馬競選的組織者就有充分的信心,他們派出了大量的志愿者對目標選民進行上門或者電話一對一勸說。
這些方式改變了政治競選的模式。 不過所有這些都需要數據分析的背后支持。 Chris Wegrzyn開發了一個叫“AirWolf”的程序, 可以把那些用信件寄取選票的選民和他們的電子郵箱地址進行匹配。 奧巴馬的各地競選辦公室會定期提醒選民寄出選票。 如果他們寄出了, 他們會收到感謝信。 而競選辦公室的工作人員每天都會有一份尚未寄出選票的選民的名單。 根據名單, 他們可以通過電話或者上門拜訪的方式進行跟進。 Dan Wagner說:“這本質上是一種線上和線下相結合的方式。”
除了對各地競選辦公室的支持, 作為首席分析官, Dan Wagner的工作還包括對競選總部的各部門的支持。 他有一個54人的分析師團隊,在一間無窗戶的辦公室里辦公(這里被他們形容成“山洞”)。 Dan Wagner把他的團隊定位成為“內部咨詢師團隊”。他說:“我們基于我們的數據庫,創造出一些工具, 同時,幫助各個部門更好的使用數據工具。”#p#
共和黨陣營
當看到奧巴馬陣營在招聘文本分析, 在線廣告以及在線實驗的人員時, 羅姆尼的顧問們感到的是擔心和困惑。在共和黨的黨內初選時, 羅姆尼好像是唯一一個會進行21世紀競選活動的共和黨候選人。 他有條不紊的競選安排, 很輕松地成為共和黨的候選人。
盡管在共和黨內優勢明顯, 羅姆尼的團隊在專業性上與奧巴馬團隊相去甚遠。
在2002年競選馬薩諸塞州州長時, 羅姆尼聘請了一家總部在弗吉尼亞的公司——TargetPoint。 該公司利用商業消費者數據庫和選民數據庫, 建立預測模型。 TargetPoint的CEO Alexander Gage是最早將商業營銷的理念引入政治競選宣傳的人之一。
這些數據分析技術幫助小布什在第二任競選中在針對目標選民的宣傳上取得較大優勢。 然而, 在此之后,共和黨并沒有在這些技術方面進行進一步的加強。
民主黨后來居上,到2006年, 民主黨不但在采用商業營銷技術方面追上了共和黨,他們還把社會化媒體營銷方法也整合了進來。
羅姆尼的幕僚們知道奧巴馬正在建立一只內部的數據分析團隊。 不過他們并不認為自己也有這個需要。羅姆尼的數字媒體總監 Zac Moffatt說:“我們不認為我們的內部團隊會比從市場上找來的團隊強。 我們的方式就是找到最好的公司, 與他們合作。”
因此, 羅姆尼的團隊繼續與TargetPoint合作。 TargetPoint幫助羅姆尼進行一次性的選民細分工作, 然后這些細分名單被分發到各地的競選辦公室。 而這種靜態細分的模式,正是奧巴馬在2008年選舉后所擯棄的模式。
2012年5月 TargetPoint的副總裁Alex Lundry離開TargetPoint, 加入羅姆尼的團隊, 來幫助創建羅姆尼的內部數據分析團隊。他找來了芝加哥大學政治科學系的博士后Tom Wood, 以及布什2004年競選團隊的成員 Brent McGoldrick。 但是, 羅姆尼的數據分析團隊的人數, 還不到奧巴馬團隊的十分之一。
羅姆尼的數據分析師們無法深入研究個體選民的情況。他們把目標集中在研究如何提高競選廣告的效果。
Lundry認為傳統的電視廣告衡量體系不能滿足需要。于是, 他們創建了一種叫做“信息流”的方式。 他們把政治話題分解成“模塊”。他們先劃分了大約200個“模塊” 比如關于汽車業失業的問題,奧巴馬政府資助太陽能公司的問題等等。 當有新的政治話題產生以后, 他們就把它加為新的模塊。 他們通過TargetPoint的“全國媒體監測”系統,來監測不同模塊在各媒體上被提到的頻度。 Lundry的團隊關注每個模塊的兩個方面的表現:第一是被社交媒體的傳播(特別是Twitter上的傳播), 第二就是被傳統媒體的覆蓋程度。

Alex Lundry 創立了羅姆尼團隊的數據分析團隊,這個團隊的規模還不到奧巴馬團隊的十分之一
Lundry團隊的最終目標是要衡量不同的政治話題對羅姆尼支持率的影響。 他們采用了金融市場常用的向量自動回歸模型來衡量“全國媒體監測”系統的數據與羅姆尼在蓋洛普每日民調中的支持率的關系。在2012年7月, 他們發現了一個他們稱為“Wood三角形”的流程。
當一個模塊通過廣告或者新聞方式進入公眾討論3 到4天 后。 可以通過跟蹤在Twitter上的話題討論, 如果發現話題成為了一些精英政治人物的討論話題后,這些模塊在1到2天后, 很大可能被紙媒, 廣播或者電視所報道,從而會影響羅姆尼的支持率。 Lundry發現, 這樣的規律是普遍存在的。
因此, Lundry的團隊, 把廣告看作是功能飲料。它的作用是挑起話題或者對原有話題進行保鮮。 如果某個模塊的自身能量不足(不足以在精英階層掀起足夠的話題), Lundry會建議對這個話題進入公共話題討論5到7天后, 投入廣告進行刺激。 Lundry還發現, 這樣的刺激的效果通常會在14天左右消失, 這時他會建議進行另一個話題的廣告。
這些發現給共和黨競選團隊的組織者一些信息流的理論, 但是它沒法提供具體的如何進行資源分配的指導。因此, 共和黨競選團隊只能去觀察民主黨的動作。 如果奧巴馬團隊在某個州或者某個地區加大力度, 估計那是一個很重要的地區, 也許羅姆尼也應該在那里加大力度。 Lundry說:“我們只能采用這樣的被動策略, 他們(奧巴馬那邊)的人手比我們多太多了。”
于是, 共和黨的競選團隊開始每周跟蹤奧巴馬團隊的廣告發布和奧巴馬在不同地點的時間分配。目的是試圖找到奧巴馬團隊在做資源分配決定背后的計算。 這有點像當初微軟的Bing去反向工程Google搜索那樣。 就像羅姆尼的政治顧問Dan Centinello說的那樣:“我們隨時關注總統的動向。”
但是, 奧巴馬的媒體購買策略真的很難猜。 比如Lundry注意到,在9月上旬民主黨大會結束后, 奧巴馬在臨近佛羅里達州邊界的阿拉巴馬州小鎮Dothan投入了68個電視廣告。 Dothan可以說是美國最小的媒體市場之一, 而阿拉巴馬州則是絕對的共和黨大本營。即便有媒體專家認為, 這是為了影響旁邊的搖擺州佛羅里達州的選民。 但是Dothan的電視臺能覆蓋的佛羅里達選民也只有9000人。 而其中7000人在2008年大選中投給了共和黨候選人麥凱恩。 “這是一個共和黨占絕對優勢的媒體市場”, Lundry說。 “而且市場又那么小, 但是他們偏偏在那里投廣告。”
羅姆尼的顧問們都很熟悉大眾傳媒的理論, 但是奧巴馬這樣追逐小眾選民的做法他們卻無法去衡量。分析師McGoldrick說到:“我們知道, 一定是他們的算法指導他們去這么做的。”#p#
媒體爭奪戰
2011年夏天, Carol Davidsen收到了一封來自Dan Wagner的電子郵件。 作為民主黨的支持者。 Carol經常會收到來自民主黨的募捐郵件。不過這封郵件有所不同。 它提供了一份工作。 Dan Wagner從2008年以來的所有給民主黨的捐款者中,找出他們職業中有“數據”或者“分析”關鍵字的人, 給他們發郵件邀請他們加入新成立的數據分析部門。
Carol當時在Navic Networks工作, 這是一家微軟的子公司, 她負責編寫軟件記錄用戶使用機頂盒錄制節目的歷史數據。 接到了Dan Wagner的邀請后, 她決定接受這份工作。 于是, 她在2011年底, 成為奧巴馬競選團隊技術部門的一名產品經理。 負責“NarWhal” 項目。 這是一個將不同數據庫進行整合的項目。 通過Narwhal項目, 當發送郵件招募志愿者是, 可以參考他的捐款歷史, 確定應該向支持者募捐多少款項的算法可以把他過去對募捐的反應情況作為變量來考慮。 這種整合技術可以強化了A/B測試的效果。 A/B測試是網站開發中經常使用的技術。 在奧巴馬2008年網絡募捐中起到很好的作用。 它主要通過隨機地給不同的用戶展示不同版本的設計來測試用戶的反應。 有了Narwhal的數據庫整合, 分析師們可以針對某個用戶分析更多的屬性, 從而優化宣傳的手段。 “我們發現了很多可以拉近選民的手段, 如在總統生日卡片上簽名, 或者得到一個免費的保險杠貼紙, 會比別的方式更加容易吸引選民。” 奧巴馬團隊的數據分析師Amelia Showalter說道。
如果說在線傳播是奧巴馬2008年競選時,采用數據實驗和分析方法最活躍的傳播渠道的話(事實上, 隨機發送郵件和A/B測試, 然后比較點擊率或者捐款額對在線傳播也比較容易),那么大眾媒體傳播是當時最少使用這些方法的渠道了。 電視和電臺廣告必須按照地域來購買。 而從尼爾森或者Scarborough這樣的市場調查公司購買到的關于各頻道用戶觀看情況的數據庫里, 關于用戶的數據也有如用戶年齡和性別的簡單信息。 這些信息對于那些做做鞋帽廣告的廠商來說足夠了。 但是對于政治廣告的投放來說, 還是遠遠不夠的。
作為競選團隊的媒體經理, Jim Messina需要投放約5億美元的廣告。 她希望能重新設計廣告投放流程, 包括廣播, 有線電視, 衛星電視以及網絡上的投放。 Amy Gershkoff是競選團隊的媒體計劃總監, 她說:“對廣告主來說, 投放的渠道非常多。 對每一分錢的花費, 都有成千上萬種選擇。 我們的用戶數據非常豐富。 但是和媒體數據的關聯成了最大的挑戰。”
2012年初, Dan Wagner就把媒體計劃列入了數據分析部門的職責范圍。 Wagner把這一職責定義為“為提高宣傳和爭取選民的有效性而進行的資源優化配置的研究與實踐”。 通俗地說, 就是對每次宣傳活動,都要計算出在給定接觸時間, 給定成本下, 因此而贏得的選民數。
不過具體到傳統媒體購買來說, 這樣的計算幾乎不可能。 因為競選團隊沒辦法把他們的選民數據庫和有線電視公司的用戶數據庫關聯起來。而奧巴馬的幕僚們發現, 有線電視的用戶數據常常會有誤導。 Terry Walsh說:“我們并不關心一個35歲的婦女在看什么電視節目, 我們關心的是, 看那些節目的觀眾里面, 哪些是我們所能夠去說服的選民。”
Carol Davidsen以前的工作就是和機頂盒的數據打交道, 她了解其實很多數據都是可以從機頂盒的原始數據中得到的。 而市場研究公司由于用戶隱私的要求,會把用戶個人這部分數據屏蔽掉, 重新包裝進行銷售。 “作為媒體購買來說, 最大的問題就是信息不夠。” 她認為。
于是, 她開始和市場研究公司進行談判, 找到一種既可以使市場研究公司避免違反與有線電視公司關于用戶隱私的協議,又可以使競選團隊獲得需要的數據的方式。 她們與一家叫Rentrak,的市場研究公司簽訂了一份價值35萬美元的協議。 奧巴馬的競選團隊提供選民列表和地址, 如果與Rentrak數據庫里的用戶帳單地址吻合, Rentrak就會返回一個特定的用戶ID以及對應機頂盒的數據, 而不必給競選團隊提供用戶個個人信息。
這樣, 奧巴馬的競選團隊建立了他們自己的“尼爾森”研究數據, 包括所有還沒有完全決定支持奧巴馬的觀眾的數據庫。 競選團隊決定在5月份進行一輪針對羅姆尼的廣告攻勢。 為此, Carol Davidsen主持開發了一個叫做Optimizer的廣告發布監測系統。 這個系統把一天分為96個按15分鐘劃分的時間塊。 從全國60個頻道的觀眾中, 評估出哪個時間段能夠以最低平均成本覆蓋可說服選民。 Terry Walsh說道:“這次競選中對于媒體購買的革命性創新就是, 把哪些面向大眾的廣播形式的媒體, 變成了’窄播’形式的媒體。”

當奧巴馬團隊在電視媒體上投放廣告時, 是因為Optimizer認為這樣的購買會更加有效。 有的時候, 購買全國性有線電視廣告比去那些競爭激烈的州去購買本地有線電視廣告更加經濟。 有時候, 購買全國電視廣告還有一個好處, 就是可能會推動競選捐款以及吸引那些共和黨州的志愿者們。
奧巴馬的媒體購買行為也使得羅姆尼的分析師們感到困惑。 他們也有一套自己的媒體監測系統叫Centraforce。 所用的數據的一部分也和Optimizer所采用的一樣。 有的時候, 這兩個系統采取的行為也是相似的。 比如都會去某個媒體進行投放。 不過, Lundry認為, 奧巴馬的媒體策略要靈活地多。 奧巴馬的投放有時會在一些極其細分的市場上, 或者在很小的媒體上投放, 要么就是有的時候, 受眾看起來并沒有什么價值。 不過, 由于缺乏選民數據模型以及像奧巴馬團隊所采用的EIP實驗所積累的目標選民數據。 羅姆尼的團隊很難具體分析奧巴馬的策略。 正如McGoldrick所說:“對他們的系統進行反向工程也沒什么用, 因此你就算了解了他們算法, 也做不了什么。”#p#
民意測驗
盡管選民意見的分析表格看上去像民意測驗。 分析師們并不愿意把它叫做民意測驗。 競選團隊有很多的民意測驗來源。總共有八家民意調查公司每天都在提供民意測驗報告給他們。 競選團隊的選民意向研究總監David Simas說:“在這次競選中, 我們采用的定性分析比任何一次競選都要多, 我們采用的定量分析也比任何一次競選要多。 我們需要做的就是在競選的各個層面上, 利用這些分析所得出的結論。”
Simas把自己的研究工作比做是“空中交通管制”。 它以一系列用戶的主觀感受為基礎。 競選團隊的首席民意調查專家Joel Benenson進行了一些用戶訪問。 他要求受訪者寫下一個詞來描述對他們的感覺, 最多的詞是“失望”。 這既表明了對奧巴馬政府的失望, 也從一個更大的方面表明了很多選民對經濟形勢的失望。 Simas說, 這就是我們這個研究開始時的狀況。
奧巴馬的幕僚們根據這些用戶感受來撰寫宣傳詞, 來突出奧巴馬和羅姆尼的差異。 Joel Benenson進行了全國性的調查,測試何種語言能最大程度地打動選民。 他們還聘請了4家民意調查公司去一些特定的州區調查哪些全國性話題對該地區的影響最大。 奧巴馬的媒體顧問們據此撰寫了500多個廣告文案。 通過在線的Focus Group進行了測試。
同時, 競選團隊也需要準備應付一些負面的情況出現。 比如民主黨顧問Hilary Rosen關于羅姆尼太太“從沒做過一天工作”的評論等等。 競選團隊的Focus Group總監David Binder建立了一個包括了100個未決定選民的討論區。 Simas有時候就會去跟蹤討論區的討論, 去研究哪些新聞會引起選民的注意。 有時候, Simas還會故意讓Binder放一些奧巴馬的負面新聞, 用來觀察討論區的反應。“對我來說, 這是一個判斷(某個事件)會不會真的帶來麻煩的最快的方法。”Simas說道。
當Dan Wanger把他的投票預測與民意調查過來的投票預測做對比的時候,可以看到一個很明顯的區別。 那就是, 在一些爭奪激烈的州, Wagner分析報告里奧巴馬的支持率要低于民意測驗,同時, 羅姆尼的支持率也低。 原因這些州存在大量舉棋不定的選民。 有時候, Dan Wagner分析出來的未做決定的選民數, 是民意測驗得出數目的兩倍。,因為他采用了完全不同的測驗方法:
依照Dan Wagner的方法, 需要對一個人做大量分析后才能決定是否把他歸類為非選民,而傳統民意測驗則僅是通過簡單的問卷就將其排除。因此Wagner的選民數據庫的選民總數往往比傳統民意測驗的多。
Terry Walsh說:“在我們內部, 有時候需要花很多時間解釋為什么這些數字不一致。 其實, 這兩者不需要相同。”
這種分析研究能夠使得競選團隊對傳統民意測驗觀察不到的很小的支持率變動做出反應。 比如在10月中旬, Simas注意到Wagner的分析報告里,在威斯康辛州綠灣縣, 羅姆尼的支持率領先優勢從1到2個百分點拉大到了6到9個百分點。 而綠灣是威斯康辛州唯一支持率異動的地區。 盡管一個標準的民意調查的800人樣本里, 可能有100個是綠灣的受訪者, Dan Wagner的分析研究是基于每周在威斯康辛州5000個電話訪問的結果。 Wagner的分析研究所訪問的綠灣地區的選民, 可能比民意調查訪問到的整個威斯康辛州的選民還要多。 “我們有理由認為, 這樣的異動并不是誤差。” Simas說。 于是, 民主黨方面立刻采取了行動。 競選團隊發起了一系列針對羅姆尼的廣告, 抨擊羅姆尼對外包的支持。 此外,包括前總統克林頓以及奧巴馬總統本人, 都親自前往綠灣去拉選票。 最終在綠灣, 羅姆尼僅以50.3%對48.5%勝出。
絕大多數情況下, Wagner的分析方法得出的選民支持率,要穩定的多。 不像民意測驗那樣, 每天甚至每個小時都會劇烈變動。
這也可以理解, 通過上百個屬性來判斷一個人的投票傾向, 當然要比向蓋洛普那樣給選民一個7個問題的問卷要可靠的多。 Mitch Stewart說:“那些變動的民意測驗結果會讓你緊張, 其實支持率的變動沒那么劇烈的。 這時候, 看看分析報表你就會平靜下來。”
而羅姆尼的幕僚們被民意調查搞得過于樂觀了, 他們認為可以通過類似蓋洛普的方式來預測選舉結果。他們的民意調查專家Neil Newhouse進行民意調查的時候,通過詢問用戶的投票意愿, 以0 到10 打分。 7分以下的被認為不準備去投票。 這樣的方法, 忽略了像EIP實驗所揭示的用戶行為變化以及競選宣傳的影響。結果, 共和黨陣營低估了很多被奧巴馬競選宣傳所鼓動起來去投票的選民的人數。
在選舉的前一天, Dan Wagner和他的團隊成員們離開辦公室,來到芝加哥的民主黨選舉辦公室的實時監控區。 在一個月前, 分析師們已經開始計算那些提前投票州的選票情況。 通過選舉委員會提供的投票人名單, 以及Dan Wagner模型中每個投票人的支持率傾向評分,他們可以預測該州的投票結果, 并和實際做比對。
在選舉日當天, Dan Wagner的分析報表變成了預測。在俄亥俄州提前投票的漢密爾頓縣, 選舉委員會公布了103,508名選民的名單。 根據Dan Wagner的模型, 有58,379名選民的支持傾向超過50.1, 也就是說, 他們更加可能投給奧巴馬。 這使得Dan Wagner的預測奧巴馬的支持率是56.4%, 也就是超過羅姆尼13,249張選票。 提前投票地區的選票, 在俄亥俄州選舉結束后最先被統計出來, 而最終的結果, 奧巴馬在漢密爾頓以56.6%勝出。 在佛羅里達州的提前選舉地區, Dan Wagner的預測也只有0.2個百分點的誤差。 Jeremy Bird說:“看到這前兩個預測結果, 我們就知道, 這次贏了。”
奧巴馬這次的第二任競選的勝利優勢, 超過了很多外界的估計。 他的團隊成員們當然很興奮, 不過并沒有感到驚訝。 第二天, Mitch Stewart照舊去到辦公室監測最后一個州佛羅里達的選票統計結果。 總統的結果已經出來了。 他只是去看一看實際結果和預測結果之間的差異。#p#
傳承:大數據里出政權
選舉日結束的幾天后, 競選團隊的一部分成員, 想4年前一樣,被要求留在芝加哥。 對2012年的競選進行總結。 這個項目被命名為“傳承”。 目的是使2012年選舉所做的各種創新不僅可以在下一屆民主黨總統競選團隊復用, 更需要成為民主黨競選的一個常態。 既然在總統競選中,奧巴馬證明了對人們的一些微小改變可能會改變選舉結果, 這樣的技術是不是也能用到國會選舉呢?
數據分析使得奧巴馬競選更加以人為本。 它使得全國競選時對選民的了解, 達到了競選本地議員時對當地選民的了解程度。 Simas說:
“數據分析讓我們把一個全國總統競選變得好像本地競選一樣。”“在本地競選中, 你會像街坊一樣了解選民, 誰與誰是什么關系,他們經常去哪家咖啡館, 這次競選有點這樣的感覺。”
在美國, 很少有像總統競選這樣的,能夠影響1.2億美國成人的營銷活動。 幾乎沒有任何企業或者政府機構能做到這一點。 而奧巴馬的團隊, 利用數據分析做到了。 數據分析不但能夠對公眾進行前所未有的細化分類,更可以改變他們的觀點。
原文連接:http://www.ctocio.com/hotnews/10664.html