成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

gSASRec : 利用負采樣降低序列推薦中的過度自信問題

譯文 精選
開發(fā) 前端
推薦系統(tǒng)能夠給亞馬遜和 TikTok 每年帶來 30% - 40% 的流量或者銷售額增量,因此毫無疑問,推薦系統(tǒng)是互聯(lián)網(wǎng)和科技公司的搖錢樹。

編譯 | 汪昊

審校 | 重樓

推薦系統(tǒng)能夠給亞馬遜和 TikTok 每年帶來 30% - 40% 的流量或者銷售額增量,因此毫無疑問,推薦系統(tǒng)是互聯(lián)網(wǎng)和科技公司的搖錢樹。許多懵懂青年在上大學或者剛工作的時候,非常向往從事互聯(lián)網(wǎng)推薦行業(yè)。一方面,趨之若鶩的人才極大地推動了領(lǐng)域的發(fā)展;另一方面,該領(lǐng)域的發(fā)展給相關(guān)人才帶來了豐厚的回報。

在剛剛過去的2023 年的推薦系統(tǒng)領(lǐng)域權(quán)威會議 RecSys 2023 上,一篇題為 gSASRec: Reducing Overconfidence in Sequential Recommendation Trained with Negative Sampling 的論文(下載地址:https://arxiv.org/pdf/2308.07192.pdf)獲得了最佳論文獎。

作者首先回顧了過度自信問題的由來:在負采樣的過程中,推薦系統(tǒng)中的正樣本的比例通常會增加。這一現(xiàn)象,就是所謂的過度自信問題。過度自信問題會帶來如下隱患:1. 推薦系統(tǒng)偏重區(qū)分特別好和特別差的推薦,而差別不那么大的推薦結(jié)果得不到重視;2. 在某些情況下會導致嚴重的數(shù)值錯誤。我們在實際中發(fā)現(xiàn),SASRec 算法會出現(xiàn)過度自信問題。并且常見的解決方案很難在深度學習的場景下適用。

基于 Transformer 的推薦算法通常在序列推薦的場景下表現(xiàn)更優(yōu)。在這一領(lǐng)域,BERT4rec 和 SASRec 是兩款經(jīng)典算法。

兩個最常用的序列推薦的損失函數(shù)是 BCE (Binary Cross Entropy) 和 Softmax Loss。BCE 的損失函數(shù)定義如下:

其中:

Softmax Loss 的定義如下:

其中:

Softmax Loss 不適合負采樣場景下的推薦系統(tǒng)。因此有學者提出了 Sampled Softmax Loss :

過度自信是指預(yù)測中物品出現(xiàn)的概率高于其先驗分布。下圖對比了幾種算法的過度自信程度:

通過觀察,可以發(fā)現(xiàn) SASRec 算法有嚴重的過度自信問題。

因為高頻率的物品會導致 BCE 數(shù)值計算發(fā)生錯誤,因此作者定義了新的gBCE (generalized BCE)指標:

作者證明了一列 gBCE 防止過度自信的定理,此處因為篇幅原因,不再羅列相關(guān)的定理。感興趣的讀者可以自行查閱原始論文。作者基于新的損失函數(shù)設(shè)計了推薦系統(tǒng),被命名為 gSASRec 算法。作者隨后進行了對照實驗,該算法取得了優(yōu)異的效果:

這篇論文的核心在于證明了利用新的損失函數(shù),可以得到緩解過度自信問題的若干定理,因此可以保證我們在使用新的損失函數(shù)設(shè)計算法之后,取得了遠遠優(yōu)于先前推薦的效果。

這篇論文看似簡單,但是作者在數(shù)學理論基礎(chǔ)推導方面下足了功夫,是難得一見的好文章。值得讀者認真收藏,細細品味。

作者介紹

汪昊,前 Funplus 人工智能實驗室負責人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司擔任技術(shù)和技術(shù)高管職務(wù)。在互聯(lián)網(wǎng)公司和金融科技、游戲等公司任職 13 年,對于人工智能、計算機圖形學區(qū)塊鏈和數(shù)字博物館等領(lǐng)域有著深刻的見解和豐富的經(jīng)驗。在國際學術(shù)會議和期刊發(fā)表論文39 篇,獲得IEEE SMI 2008 最佳論文獎、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024最佳論文報告獎。

責任編輯:華軒 來源: 51CTO
相關(guān)推薦

2024-02-20 09:00:00

2009-06-26 08:35:48

Linux庫文件操作系統(tǒng)

2020-04-10 20:24:49

物聯(lián)網(wǎng)RFID智能運輸

2022-09-21 10:04:22

網(wǎng)絡(luò)攻擊首席財務(wù)官網(wǎng)絡(luò)安全

2017-05-30 16:16:38

TensorFlow候選采樣深度學習

2024-09-12 08:00:00

2009-06-29 09:24:19

Linux

2011-03-23 14:42:47

CPU過度消耗

2017-10-25 08:19:21

云存儲云鎖定風險

2023-09-20 11:42:52

2023-07-11 14:12:06

2016-11-29 12:01:39

數(shù)據(jù)驅(qū)動大數(shù)據(jù)

2018-12-18 09:20:44

欺騙技術(shù)物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)

2010-05-26 17:53:38

IPv4 to IPv

2021-05-20 08:51:33

設(shè)計驅(qū)動數(shù)據(jù)庫

2021-10-13 08:00:00

數(shù)據(jù)算法人工智能

2018-01-09 15:20:52

物聯(lián)網(wǎng)數(shù)據(jù)采樣率智能

2015-11-09 11:23:09

FacebookFOOMs

2012-05-30 11:29:14

Hadoop大數(shù)據(jù)

2022-04-19 20:51:20

軟件開發(fā)耦合代碼
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 在线91 | 日本欧美在线 | 精品综合久久久 | 精品视频一区二区在线观看 | 日韩不卡三区 | 99久久精品国产一区二区三区 | 成人精品久久 | 亚洲国产一区在线 | 日韩视频专区 | 精品国产乱码久久久久久老虎 | 成人免费区一区二区三区 | 3p视频在线观看 | 久久久久久综合 | 午夜婷婷激情 | 国产日韩精品一区 | 国产精品九九视频 | 欧美视频成人 | 中文字幕在线电影观看 | 亚洲国产精品suv | 国产日韩欧美91 | 国产一区二区在线免费视频 | 亚洲欧美在线视频 | 精品一区视频 | 久久综合一区二区三区 | 国产大毛片 | 久草综合在线 | 精品无码久久久久久国产 | 国产成人精品区一区二区不卡 | 中文字幕欧美日韩 | 一级毛片视频 | 精品久久久久久亚洲精品 | 91视频国产区 | 免费观看成人av | 国产日韩欧美在线播放 | 羞羞的视频在线 | 美女久久 | 亚洲a视| 成人一区二区视频 | 粉嫩av久久一区二区三区 | 欧美a级成人淫片免费看 | 美女毛片免费看 |