360劉鵬:數據變現與交易的歷史與未來
原創【2015年11月28日 51CTO.com快訊】WOT2015"互聯網+"時代大數據技術峰會于今日在深圳前海華僑城GW萬豪酒店盛大揭幕,42位業內重量級嘉賓匯聚,重磅解析大數據技術的點睛應用。秉承專注技術、服務技術人員的理念,自2012年起WOT大會已成功舉辦七屆,積累了大量技術專家資源,成為業界重要的技術分享交流以及人脈拓展平臺。
本次峰會涵蓋九大技術主題,分別是:互聯網金融、O2O電商架構、醫療應用、商業創新、移動大數據、技術創業、社交網絡、數據安全、廣告數據技術。51CTO作為本次大會主辦方,將通過圖文直播與后期視頻展示,全程跟蹤報道這場技術盛宴。
下面是360商業產品首席架構師劉鵬帶來的主題為《數據變現與交易的歷史與未來》的精彩演講。
各位深圳的朋友,大家上午好!我叫劉鵬,來自360。今天給大家帶來的題目叫做“數據變現的歷史與未來的展望”,為什么讓我來講,曾經有一本書《計算廣告》,各位可能不陌生,最早提出這個研究方向的是我們的老板,中國工程院的院士,他在斯坦福講過幾次。
比較遺憾的是中國一直沒有人整理,大家都在悶頭掙錢,怎么樣把它變成錢?就是我們研究最本質的問題,還有公眾號,為什么要有公眾號?書里的很多內容是不太好寫或是編輯不讓發的內容,負能量的東西很多,所以我叫負媒體。
非常感謝大會邀請我做報告,我也準備了十本簽名書送給提問的朋友。剛才李大學老師講得很好,和我講的意見非常一致,接下來我就可以少說一點。我說一下我的看法,互聯網思維“三個不要”。
1,不要錢,是我們講的互聯網商業模式,互聯網希望變現的方式是免費產品加上后向變現的商業模式。在數據的支持下能夠自動把合適的信息放到合適的人面前,這樣所有的產品我們叫做互聯網思維,網站和APP都是互聯網產品,我們看到我們用的互聯網產品大部分是免費的。
今天的內容進一步深化,比如說樂視賣的電視會低于成本,電視也是規模化傳播的產品,它的邊際價格就是生產價格,他的定價是從信息通道,這個地方就談到廣告,互聯網談到的廣告和線下看到的廣告、電視里看到的廣告是完全不一樣的。大家不要簡單臨界為平臺,往往是原生的信息夾雜著,你未必能看得到。其實和傳統廣告并不是一樣的展現形式。
2,不要臉,不要臉是我在中國市場看到的情況,今天我不知道是好還是壞,客觀的情況是,如果你不能做到匯總用戶,基本上是很難在市場上有勝出的機會,我們是全心全意為用戶服務,用戶的思維是不是要引導?
3,不要命,不要命我覺得諸位可能有同學,有的是在互聯網企業工作,創業公司也好,大的公司也好,互聯網企業做了一件事情,做了所謂的全員持股,996我覺得在創業公司,你沒有看到太多的怨言。在大的公司,我們公司也有,有的是在一些項目上線的時候會出現007的方案,也不太罕見。
重點說的是不要錢,不要錢是把互聯網中積累的用戶數據和用戶流量變成錢,就談到我對大數據的觀點,大數據說白了是咨詢公司提出來的,工業界怎么看大數據?我上個月提了幾點,其中最關鍵的一點是這樣,如果一個問題通過采樣進行技術分析,比如他要有一個貨物的銷量,他不可能采樣一部分進行分析,這樣的結果沒有意義。廣告是特別典型的裁量,中國有十億人,要分給十億人,不可能分給一百萬人,這是無法采樣的配置是大數據關注最關鍵的。
我們是工業界來看最主要的區別和傳統的區分,首先是交易數據和行為數據的區別,交易數據指的是傳統的企業重要性在業務運轉過程中不得不記的數據,像進銷存的數據和銀行的存取款利息,這是必須有電視話費清單的清單,這個對你的影響不大,它的一致性要求很高,一點都不能錯。另外從行為數據的角度來看,我們指的是在業務的運行過程中,比如說對互聯網企業來說,他的日志為什么記下來,服務器自然把日志記下來,逐漸把數據用上,對電信有沒有行為數據?其實他也有,比如說通話的內容,這些不是業務需要記錄的,這個蘊含巨大的價值。這個行為數據很關鍵。
另外像醫療,他的交易數據就是各位看病的時候,行為數據是你日常的健康指標。數據規模是巨大的,以廣告為例,創業公司做廣告的時候,每天的展示量可以到一百億,這個大于日常的交易,他對一致性的要求很低,所以他的處理機制完全不一樣,我們用ICE五是做不了的,同時我也不是互聯網企業的架構,放在銀行的多,這是兩個完全不同的。
傳統的數據應用本身,像剛才說的廣告,個人征信,每個都需要具體的分析,還有剛才大家講的智能的訂單和進貨的問題,每一件單都要通過歷史的數據分析,我們的數據量非常大,并且一條都不能扔,那怎么辦?一定要用新的架構和新的計算方法。
關于大數據應用的場景,我們會看到兩種,一種是洞察,數據產生的結果,最典型的是財務報表,我們把企業的財務數據連成三張表,我們希望原來數據的比選,把我的日志數據連成幾張表,放在運營決策的鏈上,讓他們更有效的調整運營結構,這件事我個人覺得,在實際當中很困難,為什么很困難?財務報表能看到三張財務報表非常有限,里面提煉出往什么方向走,不是每一個人拿到表都可以用,我看到的實際情況,如果我們把大數據使用的場景場所在洞察數據這塊,我每次用都是為了給領導一張表,給運營的人提供一張表,我基本上沒有看到太成功的例子。我們希望的應用是個性化的應用,比如說廣告,我是用數據驅動用戶劃向的標簽,這樣的過程是自動化的。
大多數的情況下,自動化都是個性化,每個人進行相應的決策分析,有些情況下不一定針對人,比如說對貨物的關系,對SKU的管理,我個人覺得這三個點,大數據應用的觀點,主要是看你有沒有利用大數據解決問題,你能不能找到裁量分析的方法,各位可以結合自己的產品和業務,在這些不討論這個問題。
數據變現我用一個圖解釋,各行各業可能有不同的解釋,數據變現模式非常簡單,左邊是一個廣告位,投放的是吉列剃須刀的廣告,因為只有一半男性用戶會看,如果我有數據,我知道每個人的性別,我就把這個男性用戶的部分單獨分出來留給吉列,比如說6000,對吉列投入產出高,他的投入變成6000,剩下的一半流量打包賣給化妝品的廣告。這樣的結果是什么?這是真實的產品、真實的案例,最后的結果我掙到的錢是1.2萬,道理很簡單,希望大家能理解的是,多出來2000塊錢的本質,多出來的2000塊錢是數據變現的價值,如果我知道得更清晰我就可以掙更多的錢,流量10000,數據價值2000,所以廣告市場是非常重要的數據變現的起點。
也可以說大數據迄今為止形式規模化,互聯網的意義來說就更大了,互聯網從國際性的巨頭Google和facebook、360和小米,其實都是后向的概念,這個行業到目前為止70%到80%的收入來自于廣告,對用戶來說都是這樣。
數據變現市場不斷的存在,大數據到底能不能掙錢?其實這是可笑的,因為這個市場已經很巨大了,去年在線廣告市場是1600億,前年是1100億,今年這個數據超過2000億,并超過所有除互聯網以外所有的廣告。數據變現在互聯網世界是規模化的發展。
計算廣告核心的挑戰,有一個網站,有一個網頁,我知道用戶的身份,我要找到合適的廣告投放,目的是優化我的收入和成本差,也就是優化我的利潤,這個收入的數據叫做千次展示,就是這樣的公式,我們所有的任務都是在收入和成本的差,產品和技術,實際上在計算廣告和數據發展,有四次數據使用的變革:我需要更精細的服務,我可能要知道他有孩子,孩子多大了,我知道這樣的數據我怎么變現?原理上可以賣得更高價,沒法采用合約制的方法,簽訂合同和廣告主約定孩子的母親在未來一周內有多少的量,我們的廣告向競價,競價本質是需求方定價,供給方媒體是采用撮合定價的方式,價高者得的方式,這種定價主要是在搜索引擎里得到了巨大的發展,結果大家也可以看得見,自從互聯網廣告產生了以后,數以百萬級的廣告主,原來沒有任何廣告渠道和機會的中小企業得到了推廣的可能性。
第三個是實時競價和程序化交易,他自己篩選,實時向需求方廣告主是不是需要,以及服務價格。這樣的方式根本上解決了整個數據市場的交易問題,我可以用任何我希望的方式,并且按我的方式定價,他使得數據交易和交換規模化的發展起來。
我們在移動上發現,他不是簡單的模式,沒辦法獲得用戶的滿意,從推特開始,現在廣告的增長可以看到,大家都是在采用一種原生化的方式。用這個東西去規范廣告展示和廣告投放,這樣在移動上會獲得非常好的增長空間,也是有比搜索廣告更加受歡迎的未來潛力,這是我們講的四次主要變化,可以看到廣告市場整體的推動力都是被動的,越來越精細。
這個是廣告技術市場格局,上面是需求方,下面是從事數據加工和交易,上面是廣告交易,數據加工和交易在廣告市場上是無比重要的支持,這些公司既不買廣告也不賣廣告,這點我個人要說一下,中國有挺多的數據交易,我個人的看法,我希望的數據交易沒有什么關系,我看了他們的交易,還是以報告和統計數據為主,傳統的咨詢可以調動,希望用戶的數據和用戶標簽的層面規模化、自動化的對接業務,這個在北美市場,數據交易并不是交數據報告,這個屬于洞察應用,我的看法不是大數據。第一方是廣告主,第二方是廣告平臺數據,第三方是其他來源數據。
關于數據交易我總結了三個規律,這是我們在實踐中碰到的問題,希望和大家多第出我的觀點:
1,我認為數據是不能關聯交換的,只能交易不能交換和共享。為什么這么說?因為數據本身就等于錢,前端數據變成錢很容易,如果現在有人說,我是一個創業公司,為什么騰訊不跟我做交換和共享?這個很荒謬,你還不如讓馬化騰把他帳戶上的錢打給你,你看到大量的數據是共享是發生在公司之間有更高層的資本合作,否則是違反規律的。
2,數據交易該怎么做?顯然如果我有十個數據提供方,有十個數據需求方,如果大家點對點的方式做數據交易,這是很低效的,我們要和用戶行為進行交易,我們要做數據的傳遞,這復雜的程度,廣告里的數據交易怎么發展起來?所有的數據提供方都把自己的數據放在廣告交易上,廣告交易是分發廣告流量的核心節點,當需求方DSP向廣告層整合,他不產生額外的消費,需求方和交易所這是特別清涼和合理的方式,數據的交易還出現了一個功能,數據交易實現了部分交易,我是一個廣告主,我只需要對一個地方的數據進行布局,如果有數據提供方,他提供的數據是的難點,我沒法買,再便宜對我來說都是成本,只有在這個條件范圍內,收錢的時候是根據是否贏得了展示機會,所以實現部分交易,讓很多規模不大的參與到這個過程中,首先是定價,第二個是數據交易。
3,到底怎么給數據定價?現在的方式還是不夠的智能,數據產品和其他所有的實體產品或是跟我們講的廣告產品也不一樣,比如說有一瓶水,你賣給甲以后不能再賣給乙,這次機會給了第一個廣告主,第二個廣告主就不可能再獲得,我知道一個人是男的,這份信息可以賣給兩個人,也可以賣給五個人,也可以賣給十個人,目前工業實踐中發現,如果你賣給十個人以后,和賣兩個人相比,一個是賣奶粉一個是賣紙尿褲,競價使得流量的價格抬起來,數據獲得的增益反而少。
我個人看的現象是,數據交易蠻發達的,但是價格偏低,價格偏低是我們沒有找到這種產品的核心定價資格,也沒有找到真正市場化、競價的資格,找到這些點,他的規模更真的。
還有爆發能力,現在的狀態,廣告里的數據用行為交易,在中國是沒有的,看到所有的交易所和深圳都沒有關系。
再說一點關于數據的隱私問題,我每次都會講到這個問題,這個問題大家的認識很多,數據隱私就是我現在根據用戶行為數據指導廣告投放和內容投放,如果因此對用戶造成傷害這是我們不希望看到的,什么時候會造成傷害?關于隱私之前沒有標準,而且可以聽到專家討論的觀點,政府要立法、出臺規章制度,這句話是對的,但是告訴大家的是,這樣的規章制度只能解決20%的問題,80%是產品和技術。歐盟有一個負責隱私保護條例制定的委員會,PII別人能找到你的信息,eBay可以給你騷擾文件。BII文件是脫敏。國外的網站有一個三角一個I,這是非常聰明的辦法,既解決了用戶的顧慮,同時對業主也沒有影響,雖然聲音很大,但是比例很低,對業務沒有實質性的影響。第三點是要求不能長期屬性數據使用用戶的行為數據,用戶行為記錄兩年以上是不允許的,不論借用什么樣的介質,管理上的漏洞風險會很大,嚴格禁止保護,不能進行備份。這三點是最基礎的,對互聯網不太解決問題。
著名的比賽Netflix推薦大賽,每個用戶會打分,在幾輪的討論中,一個參賽者看到這個記錄,發現這條記錄和他的同事應該是同一個人, 同事之間會經常交流,這種數據是級別的,我們談到某位朋友,我知道背景就可以準確的過濾,我怎么知道可以,這側是告訴我們,原來我們注意到的認識誤區,真正顧慮的東西是熟人,而不是陌生人把你的電話號碼賣了。如果你被別人窺探了隱私他對你的傷害比用戶多很多。
這個例子告訴大家,所有的業務把用戶行為按照互聯網的業務體系,我們只能往前做著走,千萬提醒大家,電信把他的數據公布出來進行買賣,我們在里面找一個我們的熟人,比如說一個領導、一個局長。
我個人的觀點,隱私是大數據頭上的達摩克理斯之劍。
我講的內容就是這些。謝謝大家。
以上是51CTO.com記者為您從一線帶來的精彩報道。更多精彩內容盡在51CTO.com獨家報道,敬請期待!
【責任編輯:李英杰 TEL:(010)68476606】