北大新研究用數(shù)學模型揭網(wǎng)紅崛起奧秘!登上Nature子刊
社交網(wǎng)絡對我們生活的影響越來越廣:在信息傳播、新技術應用、輿論營造和形成中都發(fā)揮著關鍵作用。2020 年,推特用戶每天發(fā)送 5 億條推文,超過 8000 萬張圖片通過Instagram發(fā)布。
這些基于 UGC 的定向在線平臺在很大程度上影響了社會,社交網(wǎng)絡用戶所能接觸到的信息和受眾,遠遠超出現(xiàn)實生活中的朋友。在這個過程中,一些用戶迅速獲得人氣,成為所謂的「網(wǎng)紅」。
這些追隨者眾多的「網(wǎng)紅」的社會影響力不可小覷。,已經(jīng)深刻影響了消費者和公司在市場中的行為,2017 年,超過 70% 的美國企業(yè)聘請 Instagram 網(wǎng)紅來推廣產(chǎn)品。
網(wǎng)紅是如何產(chǎn)生的?背后的機制究竟是什么?這些問題引發(fā)了越來越多學者的關注。

論文鏈接:
https://www.nature.com/articles/s41467-021-27089-8.pdf
近日,由北京大學、瑞士蘇黎世聯(lián)邦理工大學領導的研究團隊就從數(shù)學模型角度,對社交網(wǎng)絡上的「顯著影響者」,即「網(wǎng)紅」的產(chǎn)生和被用戶關注的機制進行了分析。
這篇文章發(fā)表在近日出版的《自然·通信》上。
與 21 世紀頭十年蓬勃發(fā)展的 Facebook 和 LinkedIn 相比,當今最流行的平臺,例如 Twitter、Instagram 或 TikTok,表現(xiàn)出一些其他明顯的特征。
最明顯的區(qū)別之一是,這些新的在線社交平臺屬于定向網(wǎng)絡,也就是說,不需要雙方同意,也可以按照算法推薦建立關系。
新網(wǎng)紅是如何產(chǎn)生的?
從直觀上,質(zhì)量更好的 UGC 更有可能吸引用戶,情感價值更高,更容易成為「網(wǎng)紅」。但研究表明,除了少數(shù)模型之外,其他領域的「網(wǎng)紅」產(chǎn)生規(guī)模效應的研究更加集中社會經(jīng)濟方面,忽略了 UGC 的影響。
之前闡釋網(wǎng)紅誕生機制的模型,基于「優(yōu)先依戀」模型。不過這種「富人會越來越富」的理論,并不能證明新的 Instagram網(wǎng)紅崛起的原因,很多網(wǎng)紅在成功之前都是沒什么名氣的。
「內(nèi)容為王」:生成內(nèi)容質(zhì)量更高
文章提出了一種簡單但可預測的網(wǎng)絡形成機制,結(jié)合了功利原則和 UGC 質(zhì)量。研究假設用戶有共同的興趣,并將他們與定義其 UGC 質(zhì)量的屬性相關聯(lián)。
為了定義基于 UGC 的形成過程,研究人員收集了Twitter 數(shù)據(jù)集,分析連接的時間序列,發(fā)現(xiàn)有證據(jù)表明,網(wǎng)紅的形成過程源于個人對更好質(zhì)量的 UGC 的不斷搜索,并與關注者的興趣出現(xiàn)了「對齊」,即網(wǎng)紅與粉絲的興趣同質(zhì)性。
關注者的數(shù)量可以被視為網(wǎng)紅UGC質(zhì)量的agent。按照UGC質(zhì)量降序給agent進行編號。agent1被視作UGC質(zhì)量最高,agent2質(zhì)量次之,以此類推。
對于agent i,計算出新連接比之前連接的中位數(shù)排名更高(在排名中)的可能性。

研究結(jié)果與假設吻合,按照被關注可能性評估,關注者始終在追尋UGC質(zhì)量更好的網(wǎng)紅。

研究數(shù)據(jù)與純隨機結(jié)果(淺藍色)的比較,二者在統(tǒng)計學上差異顯著。
齊夫定律

齊夫定律(Zipf's law)是由哈佛大學的語言學家喬治·金斯利·齊夫于1949年發(fā)表的實驗定律。它可以表述為:在自然語言的語料庫里,一個單詞出現(xiàn)的頻率與它在頻率表里的排名成反比。
所以,頻率最高的單詞出現(xiàn)的頻率大約是出現(xiàn)頻率第二位的單詞的2倍,而出現(xiàn)頻率第二位的單詞則是出現(xiàn)頻率第四位的單詞的2倍。
實驗證明,本研究中的模型也遵循這一縮放定律。

網(wǎng)紅粉絲的「重疊」
分析兩個網(wǎng)紅被同一個第三個用戶關注的概率也是一個有趣的問題。換句話說,目標是研究不同agent的粉絲集合之間的相似性。這個相似性揭示了粉絲的共同興趣的存在。
為了驗證模型,研究人員在Twitch上收集了三個數(shù)據(jù)集,這是一個流行的在線游戲平臺,并成功驗證了模型的正確性。
這表明,本文中的模型盡管形式簡單,但已經(jīng)得出了幾個現(xiàn)實世界中影響「網(wǎng)紅」崛起的屬性。

如上圖所示,agent的粉絲在前 15 個節(jié)點之間的重疊結(jié)果和驗證數(shù)據(jù)集對照。a圖平均數(shù)值結(jié)果是從模擬中獲得的,當達到平衡時,有 10^5 個代理。b圖來自與國際象棋類別相關的 Twitch 數(shù)據(jù)集結(jié)果。
未來方向
許多當今最流行的在線社交網(wǎng)絡都在很大程度上基于 UGC。此文分析了基于 UGC 的在線社交網(wǎng)絡的幾個宏觀特征。
此外,由于簡單,該模型可以向不同方向擴展,例如通過考慮不同的更新規(guī)則和社會學激勵加以豐富。另一種可能是引入多維質(zhì)量屬性,來應對多種興趣的可能性。
該模型還可以適應不斷增長的網(wǎng)絡形成模型,用戶可以在不同時間加入,研究一些網(wǎng)紅的崛起和。在理想情況下,這些研究可以與不同平臺的實證分析相結(jié)合,比如在新一代中占主導地位的 Instagram 或 TikTok等。
未來,關于推薦系統(tǒng)在社交媒體平臺上的作用,及其對用戶行為的影響的初步結(jié)果,可能進一步擴展。用戶行為與平臺機制之間的相互作用,屬于一個廣泛、未探索的研究方向,可能會進一步闡明數(shù)字化大趨勢對我們社會的影響。