終于有人把數據采集講明白了
1.數據采集的常見方式
為什么要去研究數據采集呢?
大家可以回想一下自己在工作中是否會經常遇到以下問題:
? 真實數據與后臺獲取到的數據差距很大。
? 同一數據在不同的指標內有兩個完全不同的結果。
? 需要統計的數據與采集獲取的數據不是同一類。
其實,這些問題的本質都是因數據采集環節定義不清晰造成的,可見,我們必須要重視數據采集的方法與定義,而不僅僅是將需求扔給開發部門完成。
下面先來學習一下日常工作中用到的數據采集方式,具體可以分為如下兩類。
非透明采集:指看不到原始數據,只能通過統計上報采集,常見的方法如埋點。
透明采集:直接提取業務線中現有的系統數據庫中的數據,如日志服務器數據的整理抽取,在POS機的交易數據庫中抽取訂單數據等。
(定義1:數據采集方式)
在日常工作中,這兩種采集方式通常是結合使用的,可以此來豐富數據采集維度。但必須要強調的是,大家在設計數據采集方案時,一定要把握設計的度,否則很多新入行的產品經理可能會走向如下兩個錯誤極端。
1)采集數據顆粒度過細,導致應用緩慢。
很多產品經理在定義數據指標時,由于不能清楚地定位數據平臺的監控范圍,害怕遺漏,便將產品中的所有元素都埋上點,導致一個圖文資訊類產品在用戶打開后流量消耗和看視頻一樣巨大,嚴重拖累產品體驗。
2)數據統計點過少(顆粒度過大),導致發現問題時無法定位具體原因。
當然,除了以上問題,也出現過另外一種過激的場景:為了避免應用過于臃腫,而只采集了日活、月活、留存等通用的用戶數據,當用戶量抖動變化時,根本無法定位究竟是什么原因導致的,數據使用者看到了這樣的結果卻又無法追溯問題,內心其實比不知道用戶流失還難受。
讓我們繼續回到L公司的案例中,了解具體實戰中要怎么正確進行數據采集設計。
2.數據核心采集方式:埋點
到底什么是埋點呢?埋點的完整定義如下:
所謂埋點,又稱事件追蹤(Event Tracking),是指針對特定標識用戶的行為或事件進行捕獲、處理與傳輸等操作的全過程。(定義2:埋點)
通俗點來說,就是在用戶使用的客戶端中加入一個記錄者,忠實地記錄用戶的每一步操作,幫助我們洞察用戶的真正行為。例如,用戶到底喜歡什么,厭惡什么,從而讓我們獲取到正確的一手用戶數據。
通常情況下,一個埋點主要由三部分組成:目的、所服務的指標和埋點細節說明。
對于埋點的設計,在工作中有如下三個一般性的設計原則。
- 反應事件:必須能準確地獲取要監測的事件。
- 描述完整:必須能清晰地反饋用戶的完整行為。
- 用戶追蹤:必須能判斷出哪類用戶有問題。
滿足這三個一般性設計原則才稱得上是一個比較完整的數據埋點方案。
原則1:反應事件
在工作中我們需要統計的用戶行為是多種多樣的,因此在設計埋點時也應該按照不同的類型進行劃分,埋點的監測行為可以分為如下三類事件。
- 點擊事件:用戶點擊按鈕觸發的事件。
- 展現事件:用戶的操作界面中出現了多少次該事件。
- 停留事件:用戶停留在該頁面的時長。
原則2:描述完整
劃分不同的用戶事件只是完成了需要監測的事件,為了能清晰地反饋用戶行為,我們還需要將用戶的行為再做一個細分,用戶的行為可以劃分為如下兩類。
- 有效行為:指觸發了帶有業務含義的操作,通常用來分析活動/產品的有效性。比如,Banner廣告位點擊、推薦商品點擊等,據此來得到轉化事件的觸發率,并評估運營活動/推薦算法的有效性。
- 點擊行為:指用戶在產品內的一般性點擊,通常用來幫助推進產品迭代。比如,用戶經常誤觸某些元素,我們就要分析是什么設計誤導用戶認為那里是可以點擊的,從而進行產品迭代,將用戶的操作引導到有效行為上。
原則3:用戶追蹤
要想實現用戶追蹤,我們就需要使用多種埋點方式來獲取全面的用戶數據。在埋點技術的發展過程中,埋點一共被劃分為四類,如下表所示。
下面從兩個維度來對這幾種埋點方式進行排序。
1)從準確性上來說,代碼埋點 = 服務器埋點<可視化埋點<全埋點。
2)從個人推薦上來說,代碼埋點 = 服務器埋點 >可視化埋點 > 全埋點。
關于作者:劉天,曾為國家科研項目帶頭人,TMT領域投研顧問/MBA特約講師/互聯網峰會特邀演講嘉賓,先后就職于萬達、叮咚買菜等公司,負責過多個集團級中臺與電商平臺業務的產品整體規劃。
本文摘編于《高階產品經理必修課:企業戰略驅動下的數據體系搭建》,經出版方授權發布。(ISBN:9787111694502)轉載請保留文章出處。