深度探討互聯網變現與計算廣告
劉鵬:大家好,我是老的清華人,諸位都是95后了,你們出生的時候我入學。我在清華電子系呆了十年,04年年底博士畢業,畢業以后在MSRA,師從Frank Soong老師。我接觸廣告是從08年底,現在京東的副總裁張晨老師剛從美國回來建雅虎的研究院北京分院,我是北京最早的員工之一。雅虎當時是一個很有意思的公司,現在大家拿雅虎不當回事,其實雅虎當時還是很強的,它的市值也曾經超過一千億美金。并且雅虎有一個特點,它的產品線什么都有,有新聞、門戶、搜索、郵箱,當時在全球范圍么還是比較領先的。它的變現的形態和廣告的形態比其他的網站都豐富,那個時候我們接觸到很多的有意思的產品,像搜索。日本的雅虎市場也是很大的,還做北美的廣告,包括很多的廣告形式都是從雅虎開始做的。
雅虎那個時候有兩位科學家,一位叫Andrei Broder,是美國工程院院士,他希望把廣告里面有意思的事情系統的計算整理成一個學科,他跟另一位是經濟學家Preston McAfee在斯坦福開了一門研究生的計算廣告課程。遺憾的是,我沒有在網上找到全課的錄像,僅僅找到前幾部分的PPT。
后來大家從學術界和工業界對廣告開始重視起來了,以前學術界不重視,但是工業界一直很重視。Andrei整理這個課以后,學術界、工業界都開始重視這個問題。后來Andrei想把它系統性的總結和整理一下,但是他的工作繁忙,一直沒有做。我的功力跟他差太遠,但是我也想做一些分享。三年前我在偉倫樓開過一個系列的公開課,當時聽的大部分是工業界的人,學生來的比較少。因為在校的同學之了解搜索,了解social network。但是一旦進入互聯網工業界,你會發現廣告絕對是互聯網核心的業務,沒有比這個事再重要了,因為大家掙錢全都是靠這個。清華的師弟宋波老師給我錄了一些課程,放在網易云課堂。
后來總結了這些東西,為什么總結這么長時間?因為互聯網領域變化太快了,不要想有一個模特脫光了讓你對著畫一天,其實沓老在動的。就像廣告行業這幾年發生的變化太大了,不斷想跟著工業界的節奏在走,但是發現新產品、新技術層出不窮。到今年之所以有一個總結,是因為移動的走向差不多有了確定的模式。
大家來這個講座我相信并不是沖著我來的,是沖著大數據這個題目來的,剛才主持人說我是大數據界的噴子,其實我根本不屬于大數據界。因為瞧著眼熱,我經常發表一些有關大數據不和諧的聲音。大家對大數據的認識和討論是有點魚龍混雜的,這是我真實的觀點。

今天借這個機會從計算廣告的角度談一談我對數據的理解。所以我的題目叫做互聯網變現和計算廣告,談他們兩者之間的關系。
我們還是從一些不太嚴肅的風格開始,這是我在公眾號里寫的一片文章,談談互聯網思維。什么是互聯網思維呢?針對中國市場,我總結了三個點:
第一,不要錢,和我今天這本書直接相關。互聯網上最核心的商業模式是免費傾銷加后向變現。嘀嘀、快的的模式不客氣的講就是傾銷,但是不是每一個企業傾銷完了都能夠活下來或長大,企業在用傾銷的方式獲得了市場占有率以后,你的免費產品怎么掙錢呢?這就要大量用到后向變現的方式,后向變現就是把我免費產品獲得無形資產變成錢的過程。我總結了三種資產:第一,流量,別人在用你的APP的時候你可以順便在上面放一點東西,夾一點私貨。第二,數據,大家都是奔著大數據來的,肯定對這一點很有興趣,數據怎么變成錢呢?數據能不能掙錢,會有很多人問這個問題,我覺得這個問題特別可笑,數據不僅掙錢,而且是規模化的盈利,這是十年前就已經發生的事情。為什么現在大家還在討論數據能不能掙錢,這說明很多大數據領域的人并沒有真正研究過去在互聯網里對數據的使用方法和變現手段。我們覺得有一個規律:一切規模化、個性化傳遞信息的商品,它的售價都會趨向于邊際成本,一個網站或者一個APP邊際成本是多少,每多服務一個用戶,邊際成本應該是零或者是很小一個數,很自然的這些產品的定價都應該是免費的。其他的商品,比如說電視,樂視的電視是多少錢銷售的?毛利為零,甚至是負毛利銷售,他有非常明確的后向變現的手段,不要擔心他掙不到錢,他只要能夠做到一定規模,掙錢是板上釘釘的事情,這種掙錢的方式是先進的,別的方式會被打敗。手機很明顯也會趨向于零毛利的銷售。有一些牌子的手機現在毛利已經很低了,甚至是負的,這都不奇怪。還有一些大家可以去探討,比如說電影,我堅定的認為電影的票價絕對應該是零,這件事情什么時候會發生?以我最保守的判斷,絕對不會超過十年。它的原理是這樣的,比如說最近有一個片子叫《港囧》,之前一部叫《泰囧》,它的票房非常好,等于賣給了三千萬人,三千萬人對于大眾喜聞樂見的方式來說,太少了,如果我們用免費的方式把它變成三億人看,后端產生的商業價值難道僅僅是十個億嗎?可是問題就來了,如果我們僅僅把前端免費,后端的變現不掌握,你的片子就白虧了,所以后端變現的體系是非常重要的。我本人也看過一些電影,包括植入的廣告,包括各種形式,他們從植入廣告這一點來說,他們的商業模式還屬于比較低級的階段,現在這種方式支撐不了把片子免費,還獲得十億以上的收入。這里面有很多利益相關方在里面。不要錢,如果你想知道我的書寫什么,我希望大家了解什么,重點是了解這個東西,免費的流量和數據如何變成錢的,它涉及到很多復雜的產品技術。
第二,不要臉。現在大多數互聯網產品的營銷方式和產品點是無底線迎合用戶的狀態。特別是在面對比較年輕用戶的時候,各個互聯網公司在產品的文案上、產品的營銷點上都是非常出格的,是跪舔用戶的狀態。
第三,不要命。互聯網有一種工作方式叫996。9點工作到9點,每周工作6天。這在很多創業公司和大的公司都是廣泛存在的。為什么互聯網的人能夠這樣瘋狂的工作?關鍵的一點是全員持股。硅谷最核心的一個發明就是告訴大家,這企業是你們都有份的,硅谷的全員持股是比所有的技術創新都重要。其他的技術創新是在這個基礎上產生的。包括馬老板說的,馬老板把自己的股份給員工分了多少,他自己就剩下百分之七點幾的股份,這是大家拼命在阿里加班的前提,價值觀并不重要。

我們重點看第一點,后向變現,或者叫商業化。
第一,商業模式探索。所有免費用戶產品在做到一定量以后都會面臨這樣一個詞:商業化。這是一個很大的領域,跟商業化相關的問題也很多。我這邊舉了一些例子,碰到這些問題你就要從商業化里面找答案,而不僅僅是要用用戶的角度去找問題。
第二,流量變現。
第三,數據變現,通過免費的用戶產品,積累了一些用戶行為或者其他相關數據,這些數據怎么變成錢?近些年來大家發現數據變現的能力在某種意義上還要強過流量變現的能力。數據怎么變現?大家先不要去看大數據領域講的東西,你先好好學習學習廣告,因為數據的變現、數據的交易、數據隱私保護的邊界在廣告領域得到了充分的研究和工業界實戰。你要不了解廣告,一定是從頭走一遍彎路。
第四,具體操作層面的東西,商業產品的建設和運營。比如說一個公司有廣告,有游戲聯運,返利購買,他們之間是不是有內在的聯系?其實他們都是泛廣告產品,背后的商業邏輯基本是一致的,應該共用某些產品和技術平臺去實現一個公司整體的商業化戰略,這些大家在實際工作中才有感覺,前幾個問題都是蠻有意思。我特別希望同學們如果在你的學習之余,除了了解一些用戶產品,還能了解一些商業產品的思維、技術,對于你將來參加互聯網公司的工作很有幫助。

書的內容是基于我的公開課,以及在北大、北航的研究生課總結出來的。對互聯網創業者、對互聯網行業的從業者,對計算機相關專業的研究生,我都希望他們從這里得到一些有價值的東西。
從大數據說起,大數據這個詞并不是來自于學術界,也并不是來自于純粹的工業界,而是咨詢公司提出來的。這個詞的立意非常好,讓大家在大的場景下了解數據的價值和作用。由于它這樣的起源,在中國現在的狀態上,它與工業界實際的數據運用的現狀以及學術界的研究存在一定的距離,很多時候是概念到概念。所以我常常講BIG是漢語“逼格”的音譯。我認為必須要找到一個落地的點來看看大數據到底做什么。
我自己對大數據的認識是從工業界來的,工業界對大數據最直觀的認識是傳統的工具用不了了,微博上有一些朋友來問我,我現在學大數據是不是應該學SASS這個軟件,這讓我覺得很難回答,我覺得跟那個沒有關系,但是賣這個軟件的人肯定跟我過不去。我們先要了解大數據研究的是什么:傳統的IOE的企業研究的是交易數據的加工和處理,這是非常困難的。因為它要求正確率極高,一條都不能錯,實時性要求極高。別以為現在拉一個互聯網企業出來就能做交易系統,這十有八九是吹牛。可是互聯網企業處理的大數據和IOE處理的交易數據有點不一樣:我們關注的大數據主要是行為數據,它跟交易數據有區別:交易數據指業務實施過程中不得不記的數據,比如說存取款、利息,這些數據你不記的話業務沒法開展;但是行為數據是可記可不記的數據,比如說網站瀏覽日志。互聯網企業一開始也不是想到要記這些數據,因為服務器自然而然的記下來了,后來他就想能不能為變現帶來一點作用,于是就開始挖掘這些數據。行為數據的兩首先筆交易數據大很多,交易數據的量如果是1,行為數據一般都在100以上。另外,它對一致性的要求比較低,網站的日志丟千分之一對大多數業務都沒有關系。這意味著原來IOE架構對于處理這種行為數據是不合適的,因為它太貴,我們要用一種更便捷、更低成本的方案來處理。所以工業界我們看到是用到的工具完全變了,去IOE化。如果現在互聯網企業一擁而上,把銀行系統都換掉,那是災難性的。可是原來IOE的也不要輕易的說你們在做大數據,你們做的事情跟大數據嚴格來說也沒有關系,還是在做傳統交易數據的挖掘和整理。

這個圖講的是大數據問題的特點。如果數據可以采樣,就不是大數據問題,C類問題,是數據可以采樣的問題,比如說要統計360在各個省的用戶占比,顯然是先對用戶數據采樣,采樣十萬分之一。這類問題的特點是稀疏的采樣數據,計算的基本不變,這不是大數據問題。你們現在碰到大多數大數據專家都拿這樣的案例在糊弄大家,他們把數字大,就當成大數據。大數據應該是A種線這樣的特點,這樣的問題不能對數據采樣。典型的大數據問題是所謂的個性化問題,廣告是一個個性化問題:我們要對每一個用戶描述其行為特征和個性偏好。如果采樣到一百萬人,你能影響的廣告效果和空間的那部分人群就變成了一百萬人,這個系統使得你的系統收益大幅度下降。個性化推薦也是類似。新的問題比如個人征信業務,也需要對每一個人做描述。

我們也可以從另外一個角度理解大數據的應用:如果數據計算的結果是給人看的,不能成為大數據的問題,一定是要給機器看的,要形成一個閉環的決策過程。
數據應用分成兩類,一類是Insight,洞察,比如說360對每個省的人口占比,這個結果打出來的是一張表,財務報表、人口統計、百度遷徙地圖,這就叫洞察,洞察是整體上把握一些宏觀規律,供運營人員和領導用的。這樣的領域不能說沒有大數據的問題,但是大多數問題跟關系不大。
另外一類應用叫Automation,自動化,輸出的是個體的行為特征信息,如果對十億人進行分析,顯然領導是看不了的,只有機器能看。在這種情況下數據的結果主要用于微觀的數據實施,面向機器和銷售人員。自動化的應用大數據的成分要多很多。我特別不希望大家被宣傳帶歪了,不能弄一張報表就叫大數據,那個叫商業智能。大數據簡要說就是面向大規模的加工行為數據,并且把這個加工結果自動的反饋給機器做決策的應用。這是我的看法,肯定有很多人不認同。

再來看看數據是怎么變現的。左邊這個廣告位投放的吉列剃須刀的廣告,這個廣告位賣一萬塊錢,這是流量價值。由于吉列是主要面向男性用戶的廣告主,只給男性用戶投吉列廣告,省出來的用戶都是女性用戶,可以再找一個化妝品的廣告投給女性用戶,并向每個廣告主各收六千塊錢。對媒體來說,投入產出比提高了,收到了一萬兩千塊錢。特別需要強調的是,多出來的兩千塊錢是什么,就是數據變現的價值。你知道了每一個人是男是女,在原來一萬塊錢基礎上可以憑空多掙兩千塊錢。僅僅知道一個性別就可以多掙兩千,你要知道更多這個人的信息和購物偏好,顯然可以掙更多的錢,這些錢就是數據變現帶來的錢。
你們在學校可能不太了解廣告,但是它太重要了,我們從三個點說明它的重要性。首先從整個互聯網來說,這個行業的大半部分的收入是來自于廣告,大概要到七成到八成左右。當然有人說互聯網是不是沒有別的掙錢方法了才用廣告掙錢?這種說法是錯誤的。互聯網公司做的產品好用,還是微軟做的產品好用?免費產品一定做的比收費產品好用。因為在互聯網公司里,用戶產品的部門和商業產品的部門是分開的,管用戶產品的老大根本不考慮掙錢的事,這把他所有的精力和能力都解放出來,讓他可以全身心的服務用戶。我的觀點是:沒有任何的收費產品現在還能做得過免費產品。如果不了解后向變現,不了解廣告,你真的不可能徹底的了解互聯網。谷歌、臉書90%以上來自于互聯網廣告,淘寶八成是來自于廣告,騰訊一半來自于廣告,騰訊游戲業務里面有很大一塊是游戲聯運業務,本質上仍然是CPS收費的廣告業務,算上那一塊應該有七成以上。這是一個先進的商業模式,不是無可奈何的事。

大數據有很多應用,但目前規模化的應用我認為目前只有這樣幾個:個性化推薦是一個、計算廣告是一個、個人征信正在嘗試中。Palantir是蠻獨特的,它是面向政府和公眾數據的定制大數據應用,但是在中國的前景還要觀察。



廣告的規模化營收有多大?北美2013年在線廣告總收入是四百億美金,中國2013年是一千億人民幣,去年達到一千五百億人民幣。中國從07年到2013年在線廣告漲了10倍,從17億美金漲到180億美金。相對比的電視廣告增長了一倍。美國從07到13年電視廣告基本上沒有漲,08、09年的經濟危機的時候還跌了很多。網絡廣告美國在07年已經很成熟了,兩百億美金,但是它仍然增長了一倍多。報紙廣告的數字則慘不忍睹,中國的報紙跌的速度可能比美國還要快,我家附近的方圓一公里以內的幾個報亭都沒有了。很多紙媒的老板跟我討論,我們辦電子版是不是就能解決問題呢?我個人認為是解決不了,但只這個問題不展開說了。我希望用這個圖告訴大家,在線廣告是一個發展及其迅速的市場,它的季度復合增長率都達到兩位數。并且這個增長速度現在沒有變慢,而是在變快,這是因為移動互聯帶來了大量的新的機會。
傳統廣告主要做Brand Awareness,即品牌廣告,是為了帶動長期的利潤率和離線的轉化率,他希望你記住這個品牌,將來選擇它的可能性變大,可承擔的利潤空間也會變大。可是互聯網廣告除了能做這種廣告,還創造了一種嶄新的市場---效果廣告市場。為什么互聯網可以做效果?我們知道線下發Coupon的效率是很低的,可是線上數字廣告可以很方便的對每個人投送不同的內容,短期有購買欲望的人一定是很少一部分人,這特別適合數字化媒體。你并沒有看到在互聯網廣告快速增長的過程中,電視廣告快速下降,這是因為以谷歌、臉書為代表的互聯網廣告面對的是中小型的效果型的廣告主,這部分的廣告主的總預算加起來比五百強的廣告費多太多了。
說到計算,為什么上面這些事要用計算來解決呢?因為商業產品或者廣告特別好的一點是,可以用一個公式來表達優化的目標,這一點比用戶產品要簡單很多。微信火了以后有很多分析師就討論,為什么微信比手機QQ好?但是這些討論都是馬后炮,或者并不能根據這些討論重新造新的爆款產品出來。因為用戶選擇微信或者QQ是非理性的,有一些調研說95后更喜歡手機QQ,這就證明在用戶產品優化過程中很難找到一個明確的優化目標。但是廣告不一樣,它優化目標很清楚。這個大括號里面有兩項,一個是r,一個是q, r是收入,投一次廣告出去掙了多少錢,q是成本,你得到這次展示的機會付了多少錢,這兩個一減就是你的利潤,你投廣告的目的就是為了優化利潤。前面那個求和,表示優化的是一組廣告展示上的總利潤,這也是廣告跟個性化推薦最大的差別之一:廣告主有預算的限制,有時還有投放量下限的要求,這使計算變得很復雜。r的術語叫做eCPM——期望千次展示收益。eCPM是廣告系統最想要優化的指標,就是要提高r,降低q。除了在DSP中,降低q對于大多數的廣告產品來不是核心任務。
廣告的過程很簡單:再廣告展示出來后,如果用戶對它發生興趣,可能就會發生一次點擊,然后他在會在落地頁上進行更復雜的操作,如果想要這個東西,就會進一步到轉化頁下單。點擊的過程是發生在媒體上的,轉化的過程是發生在廣告主站內。點擊和轉化兩個量發生在不同的媒體,這帶來了一個有意思的分工:點擊率和一次點擊平均帶來的收益。這兩個量的分解,決定了在線廣告很多有意思的付費模式。




我重點講講廣告產品的發展過程,讓大家了解一下數據在廣告業務里發展的核心動力作用。在廣告行業里,我們的生產力是越來越多越精細的數據要用到廣告交易過程中。由于要用數據,產品在不斷地進化。左上角幾個灰色的我們叫做合約廣告,合約廣告是從線下廣告直接演化而來的:線下廣告以雜志舉例,每期開一個位置,雙方簽訂廣告合同,這一期放誰的,他給我多少錢。而線上最早的也是這種方式。當時美國有個大的門戶叫美國在線,它跟雅虎是不一樣的,因為它當時是收費的。而雅虎是免費的,為了變現,雅虎就開出一些banner,投一天或者投幾個小時多少錢,也是簽一個合同,簽完了就執行,這是最原始的方式。這種方式叫CPT,即按照時間來付費的廣告模式,在這樣的方式里前面講的數據變現的模式用不了,因此它作為主流存在的時間并不長,很快進化到展示量合約的模式。展示量和約就是前面講到的數據變現的模式:把流量分成男女兩部分分別收買,但這產生了新的問題。你說你的流量一半是男的,一半是女的,這可不一定,比如說一個汽車網站,九成都是男性,只有一成女性,因此廣告主會要求一個量的保證。這種加入了展示量保證的合約,是廣告領域第一個里程碑式的變革:售賣的標的已經變成人群了,不再是廣告位了,廣告位只是一個載體。
這個變化進一步發展,會遇到新的問題:如果用特別精細的數據來變現,比如母嬰人群,我們定義女性里面孩子在負一歲到正二歲之間的女性用戶為母嬰人群。這個人群的變現價值高,因為她們往往呈現出全天侯且非理性的購物狀態,因此這部分人群單價可能比正常人要高三四倍,我希望把她們單拿出來單獨售賣。可是單拿出來有個問題:這部分人的量很少,這有兩重原因,首先是確實量就不多,其次是我通過數據能發現的更少。這個小人群如果單簽一個保量合同,會發現由于量不穩定,合同很難執行。實際上雅虎GD現在都解決不了這個問題,所以廣告主一千到兩千就飽和了。還有一種情形是搜索廣告,搜索廣告的標的物是關鍵字,有的次三個月可能才有一次搜索,保量是行不通的。
這種狀況催生了一種新的售賣模式,就是廣告產品上另一個里程碑式變化:競價廣告。競價的本質是把定價權交給需求方,而原來的定價權是在供給方的。競價的方式是每個人說這個東西你出多少錢,誰出的錢高就給誰。我不需要跟你約定你拿不拿得到,你自己出價,拿到算你的。這樣就把整個市場盤活了,大量的中小企業主開始進入。

繼續發展下去,市場上又產生了實時競價廣告,或者叫做程序化交易。這兩個詞現在很火,它的本質還是希望更多的數據進入到市場中,特別是第一方數據,這里的第一方是指廣告主。前面我們說的那么多數據,男女也好,母嬰也好,都是供給方給的定義。但是會有一些人群定義,比如說京東的流失用戶,這是廣告主自己的定義,別人沒有任何能力來加工,因為他們你沒有這個數據。廣告主希望用自己的數據來指導營銷。這種數據的價值是高的,甚至遠遠超過第二方數據。但要想這種數據在交易過程中用起來,現在大家認為比較合理的模式就是程序化的模式,供給方實時問廣告主,我這里有一次展示的機會,在這個展示即將發生的那一刻,把請求送到京東的服務器,問你要不要這次廣告展示機會,如果要你定一個價格傳給我,注意這里仍然是需求方定價。除了定價以外,這里把選擇的機會也都交給了需求方。這樣的交易模式盤活了很多東西,比如說今天的數據交易,如果沒有需求方選擇模式,數據交易量的需求絕不會有這么大。

面這個框是廣告交易,下面這個框是數據加工和交易,但是下面這個是廣告市場重要的支撐,我呼吁大家,如果你對數據感興趣,對大數據的價值和交易感興趣,廣告里面的產品你是不能忽視的。因為這里面你確實已經做過很多東西了。它遠遠先進于其他行業所做的廣告交易。

在這兒解釋一下三方數據的概念,廣告平臺是第一方,廣告主是第二方,其他的跟廣告交易無直接關系的是第三方。
典型的廣告系統是一個個性化系統,它由一個在線投放引擎,一個分布式計算平臺,一個實時的流計算平臺構成。
在這個系統里,數據都是環形流動,我們要盡量避免單點、高在線的同時讀寫,并且與線上打交道的所有環節應該沒有關系型數據庫。你可以看出一個真正的大數據系統跟傳統的商業智能和數據挖掘是不一樣的。如果你線上系統發生了與數據庫的數據交換,一定不是一個最優的方案。總之,我們需要一個更輕量級的,吞吐量更高的、一致性可以稍微差一點的系統。

數據交易是很有意思的一個問題,國內最近有兩個數據交易所,一個是貴陽交易所、一個是長江交易所,我也關注了他們做的事情,我覺得很好,讓大家認識到數據的價值,并且想辦法用商業化的方式來運作數據,如果不以商業化的方式來運作,數據交易很難規模化。可是我又看到他們在交易機制上的設計,或者他們對交易數據的理解,跟我認為的大家的狀態有一點距離。數據交易應該是什么樣的?它關鍵的問題和障礙都在哪?其實沒有解決的問題是哪些?我把這些總結成三個“定律”,當然是個人初步的思考。

第一定律,數據只能交易,不能共享。因為數據變成錢太容易了,你希望百度拿數據拿出來大家共享一下,你還不如說讓李彥宏把他帳戶里面的錢打給你一部分。但是數據共享在有些層面是確實在發生的,發生的情況有兩種:一種是子公司和母公司之間。另一種是政府的數據可以共享,因為政府沒有直接盈利、變現的需求。可是我仍然覺得如果政府的數據簡單拿出來共享也不見得是好的模式,還是要用商業化的手段做成轉移支付。總之我的第一個觀點是:數據只能是做價的交換或共享,而做價的交換本質上就是交易。

第二定律,數據交易該怎么做?我簡單了解過貴陽和長江交易所,他們的交易有最大的問題,在廣告數據交易里面碰到過這個問題,并且部分的解決了:數據交易必須要實現部分交易,才會有真正的市場。我知道全國每一個人的男女,打成一個包拿出去賣,買的人會非常少。因為如果我就在華東五省投廣告,買其他省的數據對我都是成本。廣告里的數據交易比這還進了一步,不僅僅是部分交易,而且是按效果交易。你在Ad Exchange上買了一次展示,贏得了這次展示機會才交錢。這也是把定價權向需求方轉移的過程。我認為在將來任何一個行業,如果能做到定價權向需求方轉移,這個行業就有機會做大。按照部分數據交易、并且按照效果交易,這是我們在廣告市場里摸索數據交易得到的經驗。

第三定律,怎么給數據定價?這個問題廣告市場雖然有解決方案,但是效果并不理想。有一個數據交易平臺叫Bluekai,它的數據量很大,但是它不怎么掙錢。后來仔細討論,我覺得數據的交易跟流量交易不一樣:比如說你知道一個人是男是女,這個信息你是可以賣給很多人的,但賣的人多了,數據就貶值了。比如說這塊地,有的瓷磚下面有金子,有的沒有金子。某人有一幅藏寶圖,這藏寶圖就是數據。但是我們每個人都知道這個藏寶圖,會發生什么呢?大家都知道這塊地上有金子,大家先來搶這塊地,大家先把這個地價抬高。這叫做數據價值向流量價值發生的轉移。我個人的設想,將來數據交易應該是限量的。比如一個用戶是母親,一定時間段只讓產生三次或者五次交易,這樣的話有一個巨大的好處:它有可能讓數據交易也變成競價的方式。這個母親的信息我只給三個人用,你們自己來競價,最后排的比較高的三個人用。只有數據交易能夠變成競價的方式,并且是在這么細的粒度上競價,這個市場才能真正打開。

數據定價和交易本身是特別有意思的問題,而且有可能激發一個巨大的市場,而且這些問題工業界都沒有解決,將來大家如果從事大數據,這會是很有意思的一個點。
我的觀點是,要想了解數據的變現和數據的交易,了解計算廣告是一個必不可少的環節,甚至說是最重要的環節。因為所有的數據使用的歷史和產品發展的歷史在廣告行業走過一條完整的路。其中的彎路沒有必要再走一遍。數據的變現和交易都是有市場基礎的,并且有它的價值所在,但是數據交易本身有很多問題,有的是在廣告市場里已經得到了驗證和解決的,有的是我們在廣告市場發現問題但沒有解決的,還有一些要顧及到隱私問題。