盤點:大數據公司的四種數據獲取方法
對于所有號稱涉足大數據的互聯網公司而言,可以從兩方面判斷其前景與價值,其一是否有穩定的數據源,其二是否有持續的變現能力,其中包含數據理解運用的經驗積累。涉及大數據的公司發展在互聯網時代如雨后春筍,除了巨頭百度騰訊阿里巴巴外,還有一些成立時間不算久但底蘊深厚的公司。如國云數據、帆軟等。不過不管公司多大,獲取數據都是非常重要的基礎。
就數據獲取而言,大的互聯網企業由于自身用戶規模龐大,把自身用戶的電商交易、社交、搜索等數據充分挖掘,已經擁有穩定安全的數據資源。那么對于其它大數據公司而言,目前大概有四類數據獲取方法:
***、利用廣告聯盟的競價交易平臺。比如你從廣告聯盟上購買某搜索公司廣告位1萬次展示,那么基本上搜索公司會給你10萬次機會讓你選取,每次機會實際上包含對客戶的畫像描述。如果你購買的量比較大,積累下來也能有一定的互聯網用戶數據資料,可能不是實時更新的資料。這也是為什么用戶的搜索關鍵詞通常與其它網站廣告位的推薦內容緊密相關,實質上是搜索公司通過廣告聯盟方式,間接把用戶搜索畫像數據公開了。
第二、利用用戶Cookie數據。Cookie就是服務器暫時存放在用戶的電腦里的資料(.txt格式的文本文件),好讓服務器用來辨認計算機。互聯網網站可以利用cookie跟蹤統計用戶訪問該網站的習慣,比如什么時間訪問,訪問了哪些頁面,在每個網頁的停留時間等。也就是說合法的方式某網站只能查看與該網站相關的Cookie信息,只有非法方式或者瀏覽器廠家有可能獲取客戶所有的Cookie數據。真正的大型網站有自己的數據處理方式,并不依賴Cookie,Cookie的真正價值應該是在沒有登錄的情況下,也能識別客戶身份,是什么時候曾經訪問過什么內容的老用戶,而不是簡單的游客。
第三、利用APP聯盟。APP是獲取用戶移動端數據的一種有效手段,在APP中預埋SDK插件,用戶使用APP內容時就能及時將信息匯總給指定服務器,實際上用戶沒有訪問時,APP也能獲知用戶終端的相關信息,包括安裝了多少個應用,什么樣的應用。單個APP用戶規模有限,數據量有限,但如某數據公司將自身SDK內置到數萬數十萬APP中,獲取的用戶終端數據和部分行為數據也會達到數億的量級。
第四、與擁有穩定數據源公司進行戰略合作。上述三種方式獲取的數據均存在完整性、連續性的缺陷,數據價值有限。BAT巨頭自身價值鏈較為健全,數據變現通道較為完備,不會輕易輸出數據與第三方合作(獲取除外)。政府機構的數據要么全部免費,要么屬于機密,所以不會有商業性質的合作。擁有完整的互聯網(含移動互聯網)的通道數據資源,同時變現手段及能力欠缺的運營商,自然成為大數據合作的***目標。