成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

從玄學走向科學:AB測試驅動的科學增長

大數據
AB測試讓大膽創新快速試錯成為可能,能夠激發創新,提升收益。改良、發明、發現和從失敗中吸取教訓的動力使人們不斷學習,發現新的、更好的方法,創造有價值的東西。

一、科學革命,人類文明的新篇章

“Now I am become Death, the destroyer of worlds.”

“現在我成了死神,世界的毀滅者。”——核物理學家奧本海默在目睹了第一顆原子彈爆炸的駭人景象后,引述《薄伽梵歌》說道

1945年7月16日凌晨5點29分45秒,科學家在美國新墨西哥州的阿拉莫斯沙漠中引爆了第一顆原子彈。這一秒可以稱之為近百年來人類文明中最具有歷史意義的一刻,從這一刻開始,人類不僅僅只是在改變歷史進程,甚至有了終結歷史進程的能力。

科學革命將人類帶到阿拉莫斯沙漠,帶上月球表面,搭載著刻錄了人類文明喧囂的鍍金唱片的旅行者一號甚至已經飛往太陽系之外。近百年來,科學革命之下的人類文明發展之快,是任何最瘋狂的夢想家都難以預料的。

在過去的數百年中,人們愈發相信可以通過加強科學研究來獲得前所未有的強大力量。而且這并不是盲目迷信,而是經過了嚴謹的邏輯推導和反復的觀察和證明,就像數學一樣精確,就像我們可以自信地說出,1+1就是等于2,而絕不會是其他什么答案。如果沒有科學帶來的確定性和賦予人類的強大力量,人類永遠無法分裂原子,無法在月球上漫步,更不可能沖出太陽系。

二、從玄學走向科學,為什么要做AB實驗

一個人預測和應對未來的能力,取決于他對事物變化背后的因果關系的理解;一個人理解這些因果關系的能力,來自他對以往變化的發生機制的研究。——原則:應對變化中的世界秩序-瑞·達利歐

1、告別野蠻生長的經驗時代

十多年前,曾經有過這樣一句話:“站在臺風口,豬都能飛上天?!?在當年智能手機普及引發的移動互聯網大潮之中,“風口上的豬”成為許多企業的真實寫照。

然而,今時今日,野蠻生長的互聯網紅利期一去不返,流量成本愈發昂貴,產品迭代試錯成本高昂,制約了企業進一步增長的潛力。許多當年趁著潮水涌入的玩家們,如今面臨著日益嚴峻的增長乃至生存困境。原因其實很簡單,只有潮水退去了才能知道誰在裸泳,企業增長最終要依靠的,仍然是科學而又行之有效的增長策略,以及苦心歷練而成的基于科學而非玄學的綜合能力。

數據驅動是科學增長的底層邏輯。成功不應該靠玄學或者運氣,而是有一套完備的方法論,每個人都應該學會,并且都能夠學會。我們要像科學家研究原子彈和登月火箭一樣做產品增長,通過科學實驗,大膽假設,小心求證,發掘出增長背后的“第一性原理”。

當今的時代,日新月異,變化萬千,被稱之為VUCA時代(復雜性Complexity、模糊性Ambiguity、不確定性Uncertainty、波動性Volatility)。在不確定的時代下,科學增長的數學般精準的確定性,成為了我們最值得信賴的依靠。

通過科學的AB實驗,我們可以確保每個決策都能帶來正向收益,實現復利效應,實現持續循環的可持續增長:

消除產品設計中不同意見的無休止的爭論,根據實驗的效果,科學決策,確定最佳方案

讓大膽創新快速試錯成為可能,快速準確地檢驗新策略上線后的效果

快速定位問題的真正原因,避免低效而又昂貴的錯誤迭代

降低新產品或新功能發布的風險,為產品持續迭代提供保障

2、什么是AB實驗:隨機對照實驗

AB實驗又稱隨機對照實驗(randomized controlled trial,RCT)。隨機對照實驗最初來源于來自生物醫學的領域。

1747年5月20日,詹姆斯·林德做了人類歷史上第一個隨機對照實驗。林德將船上患了壞血癥的海員分為多組,每組喂食不同的食物,從而嘗試驗證哪種食物可以治療敗血癥。雖然由于時代的局限性,林德當時沒能成功指出橘子中含有的維生素C可以治療敗血癥,但是由于這是歷史上第一次用隨機對照實驗檢驗藥物療效的嘗試,林德仍然青史留名。林德的實驗標志著檢驗藥物有效性的方法從蒙昧走向科學。

在現代生物醫學領域的雙盲測試中,病人被隨機分成多組,在不知情的情況下分別給予安慰劑和測試用藥,經過一段時間的實驗后,比較這兩組病人的表現是否具有顯著的差異,從而確定測試用藥是否有效。隨機對照試驗的基本方法是,將研究對象隨機分組,對不同組實施不同的干預,在這種嚴格的條件下對照效果的不同。在研究對象數量足夠的情況下,這種方法可以抵消已知和未知的混雜因素對各組的影響。

在互聯網產品的迭代優化中,我們通常使用小流量AB實驗,也即在線上流量中取出一小部分(較低風險),完全隨機地分給原策略A和新策略B(排除干擾),再結合一定的統計方法,得到對于兩種策略相對效果的準確估計(量化結果)。這一套基于小樣本的實驗方法同時滿足了低風險,抗干擾和量化結果的要求,因此不論在互聯網產品研發還是科學研究中,都被廣泛使用。

3、AB實驗是互聯網公司的標配

隨著互聯網產業的發展,AB實驗借著互聯網科技公司的發展的大潮,不斷發揚壯大。從遠在太平洋彼岸的蘋果、愛彼迎、亞馬遜、臉書、谷歌、領英、微軟、優步等硅谷弄潮兒,到國內的BAT巨頭、以及字節跳動等科技公司,都在高頻使用AB實驗協助決策。早在2000年左右,谷歌工程師首先將AB實驗應用在互聯網產品的迭代測試中。

在這之后,AB實驗漸漸普及開來,逐步成為數據驅動增長的經典手段,助力了大量互聯網產品的迭代優化。今天,谷歌微軟這些科技公司每年進行著數以萬計的實驗,覆蓋了億級的用戶量,實驗的內容涵蓋了絕大多數產品特征的迭代優化,從產品命名到交互設計,從改變字體、彈窗效果、界面大小,到推薦算法、廣告優化、用戶增長等等。

2012年,一位微軟必應搜索引擎的員工,創建了AB實驗來驗證不同展示方式的廣告標題的效果。沒有想到的是,這一小小的AB實驗卻帶來了萬分驚艷的效果。在數小時內,實驗組廣告收入增加了12%,同時沒有給用戶體驗的相關指標帶來任何負面影響。這個實驗因為效果實在是太好而令人難以相信,所以后來微軟將這一實驗重復了很多次,結果卻驚人的一致,都是巨幅的收入提升。具體的實驗內容十分細微,僅僅是將標題下的第一行正文添加到標題行,形成一個更長的標題行。這一簡單方案一開始并不被大家看好,因此這個需求的優先級較低,被擱置了長達6個月之久。這一微小的改動當時僅僅在北美就為微軟創造了超過1億美元的年收入,可想而知AB實驗帶來的潛在收益會有多大。事實上,微軟也是世界上最早采用A/B實驗評估每一個重大feature的科技公司之一,從bing的搜索排序到MSN的交互設計,數據驅動的決策無處不在,每年為微軟規避大量風險并創造可觀回報。

谷歌早在2000年就嘗試通過AB實驗來優化搜索結果頁的結果條數。雖然當時的第一個實驗由于頁面加載過慢導致實驗沒有達到預期結果,但是AB實驗的基礎設施和通過實驗評估迭代產品功能的理念就此生根發芽,為后續更加復雜的AB實驗打下了基礎。在首次運行AB實驗11年之后,谷歌最多已經同時運行多達7000個不同的AB實驗。2016年,谷歌對搜索結果頁的鏈接顏色進行了實驗。谷歌對進入到搜索結果頁的用戶進行隨機分流,一部分用戶看到的鏈接是藍色,另有一部分用戶看到的鏈接是黑色。谷歌甚至會對鏈接的不同深淺的藍色做進一步的實驗,在整整測試了41種藍色之后,找到了顏色最佳的那一抹藍。最終在實驗中優勝的藍色每年多為谷歌帶來兩億美元的收入。

字節跳動有著非常濃厚的AB實驗文化,在字節跳動流行著這么一句話:AB 實驗,是一種信仰,萬物皆可試驗。截至2022年8月,字節跳動累計已有150W+ 次實驗,日新增實驗 2000+,同時運行實驗 3W+,服務 500+ 業務線。

A/B實驗廣泛應用于字節跳動方方面面,從產品命名到交互設計,從改變字體、彈窗效果、界面大小,到推薦算法、廣告優化、用戶增長。字節跳動幾乎把AB實驗應用到了每一個業務和每一項決策中。字節跳動的明星產品抖音,它的名字,就是AB實驗的產物。字節跳動做短視頻App的時候,將產品原型起成不同的名字、使用不同的Logo,封裝成不同的應用包,在應用商店做AB實驗。在最后的實驗結果中,雖然“抖音”這個名字在測試結果中只排名第二,但大家覺得,這個名字更符合用用戶認知,更能體現它的形態,所以還是選了它。

三、大型在線對照實驗,現代AB實驗系統綜述

Instead of saying 'I have an idea', what if you said 'I have a new hypothesis , let's go test it, see if it's valid, ask how quickly can we validate it.' And if it's not valid, move on to the next one. —— Satya Nadella CEO, Microsoft

與其說'我有一個想法',不如說'我有一個新的假設,讓我們去測試一下,看看它是否有效,問問我們能多快驗證它。如果它無效,繼續下一個?!猄atya Nadella 微軟首席執行官

在互聯網的應用場景下,AB實驗主要被用于大規模的在線測試,因此也被稱為在線對照實驗(Online Controlled Experiment,OCE)或者在線AB實驗。在線AB實驗中,部分用戶被隨機選出參與實驗,并在打散后均勻分入不同的策略組。同時還會有日志系統根據實驗配置情況標記不同的用戶,并且記錄用戶的行為,然后大數據分析系統基于帶有實驗標記的日志數據計算各類實驗指標結果形成可供決策者參考的實驗報告。于是產品運營人員就可以通過這些指標去分析不同的策略對實驗用戶是否產生了作用,產生了什么樣的作用,是否符合實驗假設,最終科學指導產品的迭代方向。

1、AB實驗的基本原理

為了驗證一個新策略的效果,準備原策略A和新策略B兩種方案。隨后在總體用戶中取出一小部分,將這部分用戶完全隨機地分在兩個組中,使兩組用戶在統計角度無差別。將原策略A和新策略B分別展示給不同的用戶組,一段時間后,結合統計方法分析數據,得到兩種策略生效后指標的變化結果,并以此判斷新策略B是否符合預期。上述過程即A/B實驗,亦被稱為“對照實驗”或“小流量隨機實驗”。


圖片

從不同角度來看,AB實驗可以有幾種不同的分類。按照常見的分類方式,AB實驗可以分為以下幾類:

從實驗產品的形態來看,AB實驗可以分為:手機App客戶端、桌面客戶端、手機Web頁面,桌面Web網頁等。

從實驗分流服務的調用方式來看,AB實驗可以分為:客戶端SDK分流、服務的HTTP接口分流等。

從實驗分流的實驗對象來看,AB實驗可以分為:頁面類型、元素類型,用戶類型、會話類型等。

2、AB實驗的隨機分流

開設A/B實驗,顧名思義,我們至少需要一個A組和一個B組,那么究竟是什么決定了哪些用戶被實驗命中,以及哪些用戶進入A組/B組呢?就是靠A/B實驗分流服務。分流服務需要幫助實驗者,從總體流量中抽取部分流量,并將抽取的流量隨機地分配進A組與B組之中,盡量減少抽樣誤差。

在對實驗對象進行隨機分流時,我們需要特別關注以下幾個問題:

  • 實驗對象如何被隨機分為實驗組和對照組
  • 實驗量增加后,流量不夠用的問題如何解決
  • 不同層之間的正交性是如何實現并保證的

下面會著重討論這些問題。

① 哈希算法

隨機分流的隨機性是通過哈希算法來實現的。哈希函數在對用戶進行分組的時候,由于只用到了用戶標識,而且能把有規律的id集合散列的很均,所以在其他屬性(比如機型、地域、年紀、性別等)上能分得很均勻。哈希函數還有一個特性:如果輸入值是固定的,那么哈希函數的輸出值也是固定的。因此,哈希算法可以保證用戶不會跳組,即不會出現張三上午在版本A,下午在版本B。

AB實驗分流系統中常見的散列算法有MD5、SHA、Murmur等,其中比較推薦的是Murmur。Murmur算法的計算性能更好,抗碰撞性更強,均勻性、相關性也是最好的,因此在工程實踐中運用最多。

② 實驗層

實驗層技術是為了讓多個實驗能夠并行不相互干擾,且都獲得足夠的流量而研發的流量分層技術。

假如現在有4個實驗要進行,每一個實驗要取用30%的流量才能夠得出可信的實驗結果。此時為了同時運行這4個實驗就需要4*30%=120%的流量,這意味著100%的流量不夠同時分配給這4個實驗。那么此時我們只能選擇給實驗排序,讓幾個實驗先后完成,但是這樣會造成實驗效率低下。

實驗層技術就可以完美解決這個問題:我們把總體流量“復制”無數遍,形成無數個流量層,讓總體流量可以被無數次復用,從而提高實驗效率。各層之間的流量是正交的,可以簡單理解為:在流量層選擇正確的前提下,流量經過科學的分配,可以保證各實驗的結果不會受到其他層實驗的干擾。

③ 流量正交

流量正交指的是每個獨立實驗為一層,一份流量穿越每層實驗時,都會隨機打散再重組,保證每層流量數量相同。

舉個例子。假設我現在有2個實驗。實驗A(實驗組標記為A1,對照組標記為A2)分布于實驗層1,取用該層100%的流量;實驗B(實驗組標記為B1,對照組標記為B2)分布于實驗層2,也取用該層100%的流量。(要注意,實驗層1和實驗層2實際上是同一批用戶,實驗層2只是復用了實驗層1的流量)

如果把A1組的流量分成2半,一份放進B1組,一份放進B2組;再把A2組的流量也分成2半,一份放進B1組,一份放進B2組。那么兩個實驗對于流量的調用就會如下圖所示。此時實驗A和實驗B之間,就形成了流量“正交”。

我們可以發現,因為A1組的一半流量在B1中,另一半流量在B2中,因此即使A1的策略會對實驗B產生影響,那么這種影響也均勻的分布在了實驗B的兩個組之中;

在這種情況下,如果B1組的指標上漲了,那么就可以排除B1是受A1影響才形成上漲。這就是流量正交存在的意義。


圖片

3、AB實驗的指標

在互聯網行業中,指標是指反映某種事物或現象,描述在一定時間和條件下的規模、程度、比例、結構等概念,通常由指標名稱和指標數值組成。指標,可以分為簡單計數型指標和復合型指標。

簡單計數型指標是指可通過重復加1這一數學行為而獲得數值的指標,如UV(Unique Visit , 獨立訪客數)、PV(Page View,頁面瀏覽量)。

復合型指標是由簡單計數型指標經四則運算后得到的,如跳出率、購買轉化率。

AB實驗的指標,根據對實驗影響的重要程度,有以下兩類需要重點關注:

① 核心指標

核心指標,用來決策實驗功能是否符合預期的「直接效果指標」 也叫「成功指標」。只可以設置一個指標為某個實驗的核心指標,可在實驗報告里面查看實驗數據。

比如開設「按鈕文案」的優化實驗,那么「按鈕點擊率」就是該實驗的核心指標。

一般常見的核心指標,如下:

  • 轉化率、uv/au類,如留存率;
  • 人均次數類,如pv/au、pv/uv、sum/au、sum/uv;
  • 平均值類,如sum/pv;

② 圍欄指標

圍欄指標,又稱必看指標,指的是必須守護的業務線指標,實驗功能可能對其無直接的因果關聯、無法直接帶來提升,但一般而言不能對其有顯著負向影響。

4、AB實驗的統計學原理

① 假設檢驗

A/B實驗的核心統計學理論是(雙樣本)假設檢驗。假設檢驗,即首先做出假設,然后運用數據來檢驗假設是否成立。需要注意的是 ,我們在檢驗假設時,邏輯上采用了反證法。通過A/B實驗,我們實際上要驗證的是一對相互對立的假設:原假設和備擇假設。

原假設(null hypothesis):是實驗者想要收集證據予以反對的假設。A/B實驗中的原假設就是指“新策略沒有效果”。

備擇假設(alternative hypothesis):是實驗者想要收集證據予以支持的假設,與原假設互斥。A/B實驗中的備擇假設就是指“新策略有效果”。

利用反證法來檢驗假設,意味著我們要利用現有的數據,通過一系列方法證明原假設是錯誤的(偽),并借此證明備擇假設是正確的(真)。這一套方法在統計學上被稱作原假設顯著性檢驗 null hypothesis significance testing (NHST)。

舉個例子:我們要針對某頁面的購買按鈕做一個實驗。我認為:將購買按鈕的顏色從藍色改為紅色,可以提高購買率3%。在這個實驗中,我們想通過統計學檢驗的“原假設”就是“購買按鈕改成紅色不能提升購買率”;“備擇假設”就是“購買按鈕改成紅色能夠提升購買率”。這是一對互斥的假設。也就是說,實際上我們要證明的就是“改成紅色不能提升購買率”是錯誤的。

② 第一類錯誤和顯著性水平(α)

第一類錯誤,指原假設正確(真),但是我們假設檢驗的結論卻顯示原假設錯誤。這一過程中我們拒絕了正確的原假設,所以第一類錯誤是“棄真”。

第一類錯誤在實際操作中表現為:實驗結論顯示我的新策略有用,但實際上我的新策略沒有用。

在統計學中,我們用顯著性水平(α)來描述實驗者犯第一類錯誤的概率。

當某個實驗組的指標是顯著的,說明這個實驗結果大概率是可信的。這個概率是95%,也就是說,系統有95%的信心確認這個實驗結果是準確的。

顯著性水平存在的意義是什么?

一個按鈕從藍色改成紅色,一個窗口從左邊移到右邊,到底用戶體驗會變好還是變差呢?我們并不確定,因此我們試圖使用A/B實驗的辦法,幫助我們轉化這種“不確定”——觀察小流量實驗中新舊策略的表現,從而確定新舊策略的優劣。

但是,這樣就能完全消除不確定性了嗎?答案是不能,因為存在抽樣誤差。

舉個例子,假設瑞士人均收入為中國的十倍,那么隨機抽三個瑞士人和三個中國人,能保證樣本里這三個瑞士人的平均收入是三個中國人的十倍嗎?萬一這三個中國人是馬云,王健林和一個小學生呢?

反過來想,假設在1%的流量下,組A(按鈕呈紅色)比組B(按鈕呈現藍色)購買率高,將流量擴大至100%,能保證策略A的表現仍舊比策略B出色嗎?顯然,我們還是不確定。

抽樣誤差帶來的不確定性,使得我們在做小流量實驗時,永遠沒法保證結論是完全正確的。幸運的是,對于抽樣的不確定性,在統計學中,我們有一套方法來量化這種不確定性到底有多大,這便是顯著性水平(α)存在的意義。

③ 第二類錯誤( β )和統計功效(statistics power)

第二類錯誤,指原假設錯誤(偽),但是我們假設檢驗的結論卻顯示“原假設正確(真)、備擇假設是錯誤的”,這一過程中我們接受了錯誤的原假設,所以第二類錯誤是“取偽”。

第二類錯誤在實際操作中表現為:我的新策略其實有效,但實驗沒能檢測出來。

在統計學中,統計功效 = 1 - 第二類錯誤的概率,統計功效在現實中表現為:我的新策略是有效的,我有多大概率在實驗中檢測出來。

④ 統計顯著性/置信水平/置信度/置信系數

置信水平(也稱置信度、置信系數、統計顯著性),指實驗組與對照組之間存在真正性能差異的概率,實驗組和對照組之間衡量目標(即配置的指標)的差異不是因為隨機而引起的概率。置信水平使我們能夠理解結果什么時候是正確的,對于大多數企業而言,一般來說,置信水平高于95%都可以理解為實驗結果是正確的。因此,默認情況下,「A/B 測試」產品將置信水平參數值設置為95%。

在A/B實驗中,由于我們只能抽取流量做小樣本實驗。樣本流量的分布與總體流量不會完全一致,這就導致沒有一個實驗結果可以100%準確——即使數據漲了,也可能僅僅由抽樣誤差造成,跟我們采取的策略無關。在統計學中,置信度的存在就是為了描述實驗結果的可信度。

在實驗的過程中,我們所抽取的樣本流量實際上與總體流量會存在些許的差異,這些差異就決定了我們通過實驗得出的結論或多或少會存在一些“誤差”。

舉個例子,實驗中,我通過改變落地頁的顏色讓購買率提升了3%,但是因為樣本流量并不能完全代表總體流量,有可能“我改變顏色這一策略其實沒用,購買率提升3%是抽樣結果導致的”。

那么發生這種“我的策略其實沒用”事件的概率有多大呢?在統計學中,我們會用“顯著性水平(α)”來描述發生這一事件的概率是多少。而置信度=1-α。

在「A/B 測試」產品上,根據業界標準,顯著性水平α取0.05。在A/B實驗中,如果發生“我的策略其實沒用”這一事件的概率小于0.05,我們即稱實驗結論已經“統計顯著/可置信”。這意味著你采取的新策略大概率(A/B實驗中意味著大于95%)是有效的。相反,如果這一事件的概率大于0.05,則稱實驗結論“不顯著/不可置信”。

⑤ 中心極限定理

顯著性水平的理論依據便是中心極限定理。我們可以量化抽樣誤差的根基在于中心極限定理的存在。

什么是中心極限定理?

由于存在抽樣誤差,我們每次實驗所得到的指標結果,都可能與我們期望得到的真正結果有誤差。假設我們從總體中抽取樣本,計算其指標的均值,每一次計算,樣本均值都會受抽樣誤差影響。假如我們做無數多次實驗,那么理論上,這無數多個樣本均值中,總應該有一個是“真的”,不受抽樣誤差影響的,這個值在統計學里被稱為“真值”。

中心極限定理定告訴我們,如果我們從總體流量里不斷抽取樣本,做無數次小流量實驗,這無數次抽樣所觀測到的均值,近似呈現正態分布(就是下圖這樣的分布)。這個分布以真值為中心,均值越接近真值,出現的概率就越大;反之均值越偏離真值,出現的概率就越小。

PS:此處為了便于理解,放棄了闡述統計學概念,僅從A/B實驗場景下出發,解釋中心極限定理。


圖片

為什么樣本均值越接近真值,出現的概率越大?

舉個例子,如果從全中國人這個總體中,抽取很多很多次樣本,計算很多很多次平均收入。

可以預見,我們會因為樣本不同而得到很多個不同的平均收入值。這些數值確實有可能因為偶然抽到頂級富豪而偏高,或因為抽到極貧困的人口而偏低。但是,上述兩種情況畢竟是少數(均值越偏離真值,出現的概率小)。隨著抽樣次數增多,我們會發現,平均收入落在大多數普通人收入范圍內的次數,會顯著增多(均值接近真值,出現的概率大)。并且,有了中心極限定理的幫助,我們可以知道每個均值出現的概率是多少。

5、AB實驗的應用場景

產品優化迭代的各方面都可以使用AB實驗,其中有以下幾類典型應用場景:

① 產品優化

產品優化的最終目的在于提升每一個用戶的用戶體驗,理想的用戶體驗是用戶感到高興、滿足、驕傲甚至是愛上這款產品。不過,一千個人眼中有一千個哈姆雷特。每個人對于美的喜好都不相同,有的時候甚至是完全不一樣的。尤其是在面對來自不同背景不同文化的用戶的時候,產品運營和設計人員更難以準確揣摩用戶的喜好。汝之砒霜彼之蜜糖,只有通過AB實驗才能夠科學衡量不同設計方面的實際效果。

② 算法迭代

互聯網時代發展到今天,算法已經滲透到了互聯網產品中的每一個角落,從短視頻信息流,電商購物,打車出行,到個性化音樂視頻推薦,每一項功能背后可能都蘊含著復雜的算法。以推薦系統中的推薦算法為例,特別是廣泛應用的深度學習模型,參數的量級可能是上千萬的,有著很強的黑盒屬性,完全依靠人工優化已經不再現實。優化一個特征、一個模型、一路算法、一個參數之后,用戶體驗如何,是不是向著期望的方向迭代,都無法簡單通過經驗來判斷。算法模型參數復雜,影響因子眾多,一個簡單的策略優化對用戶體驗的影響是難以預料的。如果不用AB實驗,我們很難評估算法模型的實際效能??梢哉f,AB實驗是智能時代算法迭代的最佳搭檔。

③ 私域運營

客戶運營場景下的許多活動,例如用戶社交裂變、紅包活動、短信拉活都是可以使用AB實驗的典型場景。使用大額紅包等運營策略,一般都可以在短時間內大幅提升產品的各項核心數據,但是誰也沒法說準是否能夠有效提升長期roi,很多情況下成本過高的運營活動可能在整個用戶生命周期都無法回本,長期以往對于產品的長遠發展無異于飲鴆止渴。如果沒有AB實驗的科學量化和數據說話,很難避免短期利益對于長期利益的損害。

④ 公域營銷

公域下的廣告營銷也是一個典型的可以使用AB實驗的場景?!拔矣幸话氲膹V告費都被浪費了,但就是不知道是哪一半。” 零售大亨約翰·沃納梅克這句經典名言被稱為廣告界的哥特巴赫猜想,道出了廣告營銷的難點。應該如何科學的衡量廣告的效果一直既是業界的重點、熱點也是難點?;贏B實驗,我們可以針對性別、年齡、職業、地域等不同的廣告人群定向,或者不同的廣告預算出價、風格各異的廣告素材,乃至線上線下不同的廣告投放渠道等進行科學的對照實驗,發掘出最優的投放策略,有望為廣大廣告主節省下巨額的營銷資金。

四、展望未來。所有企業都是數據驅動的企業,AB測試不可或缺

動蕩時代最大的危險不是動蕩本身,而是仍然用過去的邏輯做事?!说谩さ卖斂?/p>

我們知道數據驅動這個概念。

如今,越來越多的企業正在積極擁抱數據驅動,希望通過數據技術來幫助業務做好科學決策

展望未來,在數字化轉型的大背景下,所有企業都將會變成數據驅動的企業,AB測試也將會成為數據驅動下的一種“標配”,驅動企業科學增長。

一個社會的發明創新力是生產率的主要驅動因素。創新和商業精神是經濟繁榮的命脈。

AB測試讓大膽創新快速試錯成為可能,能夠激發創新,提升收益。改良、發明、發現和從失敗中吸取教訓的動力使人們不斷學習,發現新的、更好的方法,創造有價值的東西。通過科學的AB測試,我們可以確保每個決策都能帶來正向收益,實現復利效應,實現正向循環的可持續增長。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2018-02-01 16:25:55

2022-06-09 09:48:46

AI預測醫療

2023-11-06 10:34:19

數據科學數據驅動

2023-10-09 08:22:18

驅動科學數據分析因素

2024-10-29 20:54:53

2025-06-27 07:00:00

智能體人工智能AI

2019-08-05 11:01:24

2018-03-26 09:11:09

數據機器學習崗位

2022-11-23 10:31:54

2019-04-15 11:00:51

人工智能AI

2014-07-30 10:25:47

大數據華為

2021-05-10 11:33:11

數字化

2015-06-11 10:27:29

數據科學家

2015-06-25 13:36:56

好代碼科學定義

2023-09-22 11:32:31

數字化轉型數字經濟

2019-06-10 16:08:06

數據科學家數據驅動原則

2020-05-27 11:16:49

數據科學機器學習Python

2015-11-16 14:40:15

數據科學
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲 欧美 激情 另类 校园 | 在线a视频网站 | 欧美色a v| 欧美一区二区三区四区视频 | 欧美九九 | 久久久精品亚洲 | 亚洲一区中文字幕在线观看 | 特黄色一级毛片 | 精品美女 | 欧美久久久久久 | 日韩免费| 久久国产麻豆 | 亚洲一区二区在线视频 | 在线观看亚洲 | 国产一区二区三区在线视频 | 欧美久久天堂 | 国产一区二区三区在线免费 | 国产99热在线 | 91精品国产乱码久久久久久久久 | 午夜国产一级片 | 7777精品伊人久久精品影视 | 亚洲一区二区综合 | 欧美一级艳情片免费观看 | 成人精品免费视频 | 中文字幕四虎 | 国产第一页在线播放 | 亚洲日韩欧美一区二区在线 | 在线观看www高清视频 | 天天人人精品 | av免费网站在线观看 | 久久久无码精品亚洲日韩按摩 | 国产精品成人一区 | 亚洲一区不卡在线 | 国产欧美日韩一区二区三区 | 欧美影院 | 九九伦理片 | a级黄色毛片免费播放视频 国产精品视频在线观看 | 成人在线免费观看视频 | 激情 婷婷| 一区二区激情 | 成人在线视频免费播放 |