成也CTR,敗也CTR,點擊率怎么就成了算法工程師的夢魘?
大家好,我是梁唐。
今天和大家聊聊搜索、廣告、推薦算法當中很重要的一個指標,也就是大名鼎鼎的點擊率。
點擊率這個指標相信很多同學都有所耳聞,它的含義也很簡單,顧名思義就是點擊的概率,英文叫做CTR。如果我們用公式來表達的話就是click / impression,這里的click也就是發生的總點擊數,分母的impression也就是曝光的數量。兩者的商就是點擊率。這些大家都很好理解,但問題是為什么點擊率它這么重要呢?這個問題能回答上來的就不多了。
為什么點擊率是核心指標
搜索、廣告和推薦在幾乎所有互聯網公司當中都是最重要的三個業務,也是三個流量大頭。
大家回想一下自己使用某寶的體驗就可以了,逛得最多的是不是就是搜索和首頁的推薦?廣告嚴格來說不算是一個場景,它和搜索以及推薦深度結合。無論是搜索區域還是推薦區域,都有廣告的存在。并且廣告也是當今互聯網公司最主要的收入來源,沒有之一。
對于這些場景來說,有一個非常嚴肅和關鍵的問題:就是我們如何量化展示的結果好壞呢?
我們作為使用者感受當然非常簡單,我輸入了一個搜索詞,你返回的結果不相關那么自然就是壞結果。但問題是該怎么使用嚴謹的數學表達式來反應呢?也就是如何量化返回的效果呢?
像是搜索場景可能還好一點,比較在意相似度。但對于推薦、廣告場景則不是很合適了,因為推薦場景并沒有一個強信息的搜索詞,所以也就沒有什么相似不相似之說了。而即使是搜索場景,相似度也并不非常適合,因為相似并不代表優質。比如說我搜索手機,出來的結果都是山寨機或者是沒聽說過的雜牌子,單純從相似度來說,這些結果都相似,但顯然效果不能算好。
而以點擊率作為核心指標是一種相對來說比較合適也比較高明的做法,點擊率高,說明了用戶點擊的意愿高,某種程度上也就反應了展出的效果。
這也是為什么點擊率會成為各大場景的核心指標的原因。
點擊率與廣告
不僅如此,點擊率的預測對于廣告領域尤其重要,它是廣告系統最核心的指標,沒有之一。
當前電商領域的廣告一般有三種模式,一種是基于曝光的,一種是基于點擊的,最后一種是基于成交的。這三種模式在生活當中也很常見,我舉幾個例子,大家一看就明白了。
一
比如說我們看的電視廣告、電線桿上貼的小廣告或者是報紙廣告,這些都屬于第一種。因為我們沒有太好的手段追蹤廣告的效果,像是電視廣告,電視節目的冠名廣告等等。因為我們看完就完了,也不像是電商廣告一樣還可以點擊商品瀏覽詳情。
曝光模式在電商場景當中也一樣存在,比如某寶的首頁推薦,以及雙十一等活動的展品推薦都屬于這類。商家支付一定的費用參與活動,一次性買斷,平臺不負責任何投放效果。
這類廣告往往有一些共性,比如廣告服務提供方比較強勢,以及廣告的展位非常出眾,含金量很高,競爭很激烈。除此之外則是一些主打長期價值的廣告,比如可口可樂、零食、汽車等商品。這些商品往往不會因為廣告起到立竿見影的效果,而是通過對消費者施加長期的影響力來取得商業回報。
二
第二種模式是基于點擊的廣告,也是最常見的廣告。它的特點是需要用戶點擊,也就是用戶有打開廣告的意愿。也是目前互聯網行業最主流的廣告,比如電商平臺中的大部分廣告,視頻媒體中的廣告以及搜索引擎中的廣告都屬于這一種。
這種廣告的服務商都可以簡單理解成流量販子,靠著販賣流量盈利。要想將手上的流量利益最大化,那么自然就要展出最有價值的廣告。廣告的價值有兩個部分組成,一個部分是廣告主給與的開價,這個是已知的。另外一個就是產生點擊的期望,也就是點擊率。所以最終某一個廣告的收益期望為廣告主的開價price乘上廣告的點擊率CTR。
但這里有一個小問題,廣告的點擊率是一個后驗值,也就是說我們只有先展示了才能知道它的點擊率,是無法提前獲取的。為了解決這個問題,所以引入了機器學習,使用智能算法來預測點擊率。我們假設模型預測的點擊率是pCTR,再拿它乘上價格price,就得到了這個廣告的收益期望。
這樣廣告的收益期望就成了一個具體的值,有了這個值我們就可以在展示的時候進行排序,將期望最大的廣告展示在前面,期望小的廣告展示在后,從而達到利益最大化的目的。
三
最后一種是基于成交的廣告,這種廣告一般規模不大,有些類似于各大導購網站。像是什么禮物說、什么值得買這類網站的模式都是這一種。這些網站通過將流量引導到商家進行成交,從中獲得抽成,也是最傳統的廣告模式了。
在這三種模式當中,在互聯網行業當中應用最廣泛的是第二種,而這一種廣告機制的核心就在于點擊率的預測。點擊率預測得越準確,那么排序之后得到的收益就越高,公司的盈利也就越好。既然事關盈利,那么它占據重要地位也就不足為奇了。
點擊率有哪些問題
聊了這么多,相信大家對于點擊率這個指標的用處以及重要性也有一定的認知了。但世上沒有完美的事物,算法模型的指標也是一樣,如果單單使用點擊率作為模型的訓練目標也會有許多問題。
我下面也舉幾個例子和大家盤點盤點。
低俗與標題黨
一個是普通的標題配上普通的圖片,一個是各種震驚、驚悚的標題黨配上熱辣的美女圖片,哪一個點擊率高相信不用我多說大家都能體會。
畢竟人類是視覺動物,看到美女圖片,很少有直男能忍住不點,這些是我們的本能。但這樣就帶來了一個問題,點擊率高的內容未必質量就好,反而恰恰相反往往質量很差?,F在各大內容平臺中標題黨以及封面圖黨的內容大行其道就是這個原因,長此以往,必然會引發用戶審美疲勞對平臺喪失信心,也就必然會導致用戶的流式。
關于這點有一個經典的例子,我在百度和搜狗當中搜索“透視”這兩個字,出來的結果大相徑庭。
這是百度的結果:
這是搜狗的結果:
不管是什么樣的網站,如果只是一味地追求點擊率,到最后往往平臺上充斥的都是標題黨、眼球黨等各種不良內容。真正優質的核心用戶往往早就流式干凈了,那么離倒閉也就不遠了。
蹺蹺板效應
第二個問題是蹺蹺板效應,也就是說點擊率提升了,可能會導致其他的指標降低。
這個也很好理解,比如我在購物網站里搜索商品,搜出來的全都是美女封面,可能點擊率會猛漲一波,因為吸引眼球嘛。但是搜出來的結果并不是我想要的,那么訂單數以及成交額顯然就會大幅度降低。
高點擊率與高成交本身就是兩個特質,算法加強了對于點擊率的刻畫,勢必會犧牲一些其他的特質。像是一些視頻網站可能更加明顯,比如點擊率雖然增加了,但是可能觀看的時長減少了,用戶每天花的時間也更少了。雖然用戶打開了更多的視頻,但是也喪失了更多的耐心,顯然對于平臺長久的發展也是有害的。
對于推薦場景也是如此,如果給用戶推薦的東西點擊率明顯提升了,也許用戶一下就找到了想要的東西,提前達成了購物的目標。那么用戶閑逛的時間會減少,瀏覽的商品數也會減少,自然產生的成交也會減少,對于平臺同樣是不利的。
應對方法
那么針對點擊率的這些問題,我們有什么特別好的應對方法嗎?
很遺憾,并沒有。
因為點擊率太有用了,不用它是不可能的,整個算法體系都會亂套。而且它也的確很能反映問題,作為核心指標肯定是沒問題的。
但是如果過度依賴點擊率,的確又會產生上述說的這些問題。非常頭疼,但業界的確也沒有什么特別好的方法。更多地還是依賴工程師發揮主觀能動性,基于人的理解來進行調整,而沒有什么通用的策略。
目前比較主流的辦法是讓模型同時學習多個目標,不止在一棵樹上吊死,想辦法在提升點擊率的同時也能優化一下其他的目標。也有的團隊是先不管其他指標,先盯著點擊率優化,等優化到頭了,再反過來優化其他指標。
這些方法不能說沒用,只能說有些頭疼醫頭腳疼醫腳,不能根治。其實這也是正常的,本身算法場景以及算法優化的目標就是一個非常復雜的問題。我們想要用簡單的指標去定義、覆蓋一個復雜的場景本身就是不現實的,而目前的模型也只能識別和學習簡單的指標,一旦復雜了,也就超出范圍了。
所以目前來看,這個問題還找不到根治的辦法,還是只能靠人力來解決。而對于這些問題的思考和理解,也是一個高階算法工程師的必備知識,遠比模型的原理以及調參的方法重要得多。
好了,關于點擊率就聊到這里,祝大家周末愉快。
本文轉載自微信公眾號「Coder梁」,可以通過以下二維碼關注。轉載本文請聯系Coder梁公眾號。