屠龍少年變成惡龍?聊聊推薦系統與信息繭房
大家好,今天和大家聊聊推薦系統中的信息繭房。
說到信息繭房大家都很有危機感,之前在知乎當中還有人提問,如何對抗推薦系統,避免陷入信息繭房當中。那么究竟什么是信息繭房,它又是怎么出現的呢?我們的未來真的會被推薦系統操控接觸不到外界的新事物嗎?
在回答這些問題之前,我們先來信息繭房出現的原因。
馬太效應與信息繭房
圣經馬太福音當中有一句著名的話“凡有的還要加倍給他叫他多余,沒有的,連他所有的也要奪回來”。類似的道理,在道德經當中也有出現。道德經當中說,“天之道損有余而補不足,人之道則不然,損不足而奉有余。”
這里面的道理雖然復雜,但是直觀上并不難理解。越是富有的人擁有的資源越多,那么賺錢的能力也就越強,自然就會變得更加富有。越是貧窮的,賺錢的手段越少,那么自然越貧窮。在推薦系統領域也是一樣的,越多人瀏覽的商品說明人氣高,人氣高的商品往往銷量、評價以及各方面數據也就越好。這些指標越好的商品越容易被推薦系統選中,從而獲得更多的曝光,從而陷入一個正向循環。而那些人氣低的商品則對應地陷入負向循環,人氣越來越低,直到最后銷聲匿跡。
這樣會導致一個什么后果呢?會導致推薦系統運轉到后來,推薦出來的都是高人氣的商品,我們翻來翻去看到的商品或者是內容都是類似的。
舉個簡單的例子,有一段時間里B站推送了很多小姐姐,點開看基本都是一個美女封面。道理也很簡單,美女養眼,吸引人,那么推來推去都是這類的視頻。
這個問題并不是沒有解決方案,比較好的解決方案就是個性化,也就是所謂的千人千面。說白了,就是把我們的喜好考慮進去,根據我們之前的行為推送和我們喜好比較相關的內容。現在幾乎主流的推薦系統都是這么做的,淘寶、抖音莫不如此。比如我現在打開B站基本上都能說得出來每一個視頻的推薦原因。
個性化的效果非常好,有了個性化之后,推薦內容的點擊率大大提升,要比純內容的點擊率高上接近一倍。你想,對于公司而言,只需要招一批人,加上采購一批機器,就可以讓整個公司的訂單量接近翻番,這么好的事情,是不會有人不干的。
個性化雖然效果好,但是也不是全無問題,它最大的問題就是所謂的信息繭房。信息繭房的意思和馬太效應差不多,意思是個性化到最后,我們看到的都是我們感興趣的內容。我們登陸互聯網,并沒有拓展我們的眼界,恰恰相反,反而阻礙了我們了解更大的世界。就好像被一個看不見摸不著的信息繭包裹在了其中,不知不覺成了井底之蛙。
奇怪的悖論
上面這一大段的推論都沒有任何問題,也非常符合我們的認知以及實際系統的運轉規律。但是這其中有一個點非常非常奇怪,奇怪得好似一個悖論。
這個點就是推薦系統的使命與現狀,你們知道為什么要有推薦系統嗎?按照我們現在的理解,好像推薦系統就是為了構造信息繭房,通過大數據限制人們思想而產生的。其實恰恰相反,推薦系統的產生的使命其實就是為了反對信息繭房,反對信息閉塞。
這里面的道理也非常容易想明白,因為用戶的時間是有限的,而平臺的內容對于每一個用戶來說幾乎是無限的。比如現在的淘寶可能有上億甚至數十億商品,對于單個的用戶來說,甚至可以說是他一輩子什么也不干一直瀏覽商品也不可能把這些商品全部都瀏覽一遍。對于用戶來說,他們能夠看到的商品永遠只是非常小的一部分。
我們再把眼光放大一點,不僅是對于單個用戶如此,對于全體用戶也是一樣的。整個平臺用戶有過瀏覽的商品其實也只是一小部分,有統計說這個數字可能在10%以下。這種情況的一個后果是會導致老的商品由于先發優勢壟斷市場,而后發的商品沒有一點點機會。就好像古時候閉塞的社會一樣,平民的孩子永遠不可能成為精英,這是一樣的道理。
正是為了解決這個問題,人們才造出了推薦系統。希望能夠有一個系統能夠高效地找出一些優質的但是冷門的商品,給予這樣的商品機會,讓喜歡它的用戶能夠看到它,這樣可以盡可能地減少新老商品之間的流量差異。可以理解成把頭部商品的流量切出一部分來給到其他優質的商品,讓更多的商品得到曝光。
我們做自媒體的人常常會比較各個平臺發展的難度,現在公認B站和頭條都是新手比較友好的平臺。這里的新手友好,其實就體現在平臺對于剛起步的作者的流量扶持。一個馬太效應越嚴重的平臺,從零做起的難度就越大。而反之,說明推薦系統的效果越好,即使是數據不那么出色的內容也可以找到合適的用戶推薦。
想到這里就會發現,其實這也不是什么悖論。推薦系統的使命是反抗壟斷,但最終還是會產生馬太效應。這并非推薦系統不給力,而是馬太效應實在是太過強大。推薦系統并不足以抵消它的影響,所能做的就只有從海量的內容當中,盡可能篩選出優質的內容給予更多的機會。
對抗信息繭房
對于我們用戶而言,我們上網很多時候是為了獲取更多的信息,看到我們之前沒看到的世界,而不是僅僅看那些我們喜歡看的。目前的狀況就是各個平臺的個性化做得越來越好,我們以后都會處于這樣的信息繭房當中,這種情況下,我們應該怎么辦呢?
很遺憾的是,關于這個問題個人和行業都沒有什么很好的辦法。
對于行業來說,目前還沒有比個性化更好的推薦方案。因為對于大多數平臺來說內容是否優質都是相對的,這就導致了幾乎不論什么樣的內容都有一個特定的小眾的適應人群。而公司和平臺追求點擊率或者是業績,那么自然不會采用那些效果不好的推薦方案。
以個人來說,我們明明喜歡看各種動漫以及各樣的小姐姐,那么推薦系統投其所好給我們推薦的自然也是相關的內容。總不可能為了打破所謂的信息繭房我們非逼著自己去看我們不愛看的東西吧?即使我們真的這樣做了,所謂地欺騙了系統,之后給我們推薦其他的內容了,難道就不是另外的一種信息繭房嗎?而且還是我們不愛看的繭房。
從我個人角度出發,我覺得這不是一個大問題。原因有兩點,第一點是推薦系統其實并不只會投其所好,我們也都知道即使我們愛看小姐姐,如果看到滿屏的小姐姐還是會心生抵觸的。所以現在的推薦系統除了會考慮點擊率之外,推薦內容的一個多樣性和豐富性也是一個重要指標。另外一點是,對于我們個人而言,互聯網只是我們獲取信息的工具,并不承擔拓展我們世界觀和眼界的重任。我們想要做到這點,需要我們自己去努力成為一個眼界開闊,愛好廣泛的人。一個思想封閉的人,即使給他推送很多有內涵有價值的內容,他可能還是只會點開自己關注的那一畝三分地。
現在有一些地方過度強調“信息繭房”這個概念,把這些平臺描述成了一個黑暗的操縱人心者,這些其實都是行外人的過度臆想和猜測。平臺和公司追求的是業績和利益,并沒有操縱人心這樣無聊且不賺錢的黑暗訴求,所以這樣的觀點是站不住腳的,大家也不必擔心,一笑置之便是。
本文轉載自微信公眾號「TechFlow」,可以通過以下二維碼關注。轉載本文請聯系TechFlow公眾號。