成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

天衍實驗室推薦系統(tǒng)糾偏方法論文入選NeurIPS-2020

系統(tǒng)
在我們?yōu)g覽各大網(wǎng)站和APP時,受推薦系統(tǒng)影響,大量相似產(chǎn)品反復出現(xiàn)的情況屢見不鮮,這不僅會產(chǎn)生視覺疲勞,而且很難讓我們做出理性的判斷和購買決策。究其原因,主要是目前主流的推薦系統(tǒng)采用的都是大數(shù)據(jù)模型篩查方式,會產(chǎn)生較大的路徑依賴。

 在我們?yōu)g覽各大網(wǎng)站和APP時,受推薦系統(tǒng)影響,大量相似產(chǎn)品反復出現(xiàn)的情況屢見不鮮,這不僅會產(chǎn)生視覺疲勞,而且很難讓我們做出理性的判斷和購買決策。究其原因,主要是目前主流的推薦系統(tǒng)采用的都是大數(shù)據(jù)模型篩查方式,會產(chǎn)生較大的路徑依賴。

對此,騰訊天衍實驗室近期另辟蹊徑推出推薦系統(tǒng)糾偏方法,與傳統(tǒng)方法相比,該方法無需執(zhí)行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統(tǒng)的路徑依賴。目前,騰訊已經(jīng)就研究成果發(fā)表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,且成功入選NeurIPS-2020。

傳統(tǒng)推薦系統(tǒng)易導致路徑依賴 致使推薦質(zhì)量下降

作為現(xiàn)代互聯(lián)網(wǎng)領域的重點研究方向,推薦系統(tǒng)具有相當高的商業(yè)價值。推薦系統(tǒng)模型需要在大量的候選項目中(通常為廣告、商品、短視頻等)尋找到用戶所喜愛的,從而提高曝光率或者點擊廣告收入。

傳統(tǒng)推薦系統(tǒng)研究一般著眼于設計更好的特征交叉方法以提高CTR預估的準確性,從而給出更好的排序結(jié)果,提高廣告收入。通常,用戶看到的物品是推薦系統(tǒng)挑選出來的,它們在系統(tǒng)中產(chǎn)生了存儲記錄,推薦模型在該記錄上進行離線更新。然而已有的研究顯示,這種推薦方式會產(chǎn)生路徑依賴,即模型會在得到曝光的項目上嚴重高估其對每個用戶的偏好程度,而會在未得到曝光的項目中低估其對每個用戶的偏好程度。長此以往,推薦結(jié)果的多樣性將會急劇降低,從而危害推薦的質(zhì)量和用戶留存度。

如下圖所示,橙色表示來源于MNAR數(shù)據(jù)的用戶評分分布,藍色表示MAR的評分。可以看到,MNAR上用戶的評分要大大偏高,多集中在5分,而MAR的數(shù)據(jù)較為平均的分布在1到5分之間。隨著時間推進,MNAR的評分分布會越來越集中,加大和MAR評分的差距。

 

圖 1 隨機缺失數(shù)據(jù)和非隨機缺失數(shù)據(jù)上用戶反饋的偏差

為了解決這個問題,傳統(tǒng)方法多基于inverse propensity score (IPS) 來對在MNAR數(shù)據(jù)上進行模型訓練的目標函數(shù)進行加權(quán)糾偏。這類方法需要相當數(shù)量的隨機試驗 (Randomized Controlled Trials, RCTs),即隨機地將項目推薦給用戶以獲得反饋,從而得到一個無偏的點擊率的估計。而另外,IPS方法需要收集一定數(shù)量的RCTs,即對用戶展示相當數(shù)量的隨機項目來收集反饋,從經(jīng)濟效益上來說,會造成大量的收入上的損失。而且,這種施加權(quán)重的方法也使得訓練的方差增大,有時候反而會對結(jié)果造成副影響。

借鑒信息理論構(gòu)建模型 推薦系統(tǒng)糾偏方法呈現(xiàn)創(chuàng)新優(yōu)勢

騰訊天衍實驗室借鑒了信息論中的理論來構(gòu)建模型。模型的原始輸入會先經(jīng)過一個編碼器 (Encoder) 得到表示 (Representation),隨后經(jīng)過解碼器 (Decoder) 將表示解碼成為最終的預測結(jié)果。此后,目標函數(shù)分為兩部分:輸入和表示之間的互信息,表示和輸入目標之間的互信息。在優(yōu)化這個目標函數(shù)時,騰訊天衍實驗室團隊采用了盡可能攜帶更多的目標信息和壓縮輸入信息的方法。

 

圖 2 信息瓶頸的流程和定義形式

首先把原始的輸入 (在此處是user-item對) 分為事實域 (factual) 和反事實域 (counterfactual) 。當在counterfactual中發(fā)現(xiàn)無法得到用戶對項目的反饋,無法對模型進行監(jiān)督學習時,選擇將該問題用信息瓶頸建模,由此得到一個無需反饋也可以在counterfactual上進行學習的目標函數(shù)。

 

圖 3 基于信息瓶頸理論的反事實學習框架流程圖

factual和counterfactual的事件分別是和,相對應的表示為和。在此基礎上將原有的互信息項拆分,并引入一個超參數(shù),可以得到一個新的考慮counterfactual的信息瓶頸:

 

這一新的瓶頸將原有的項拆分成了兩個域的對比項加上factual的信息項。源于上式中的互信息項無法直接優(yōu)化,在將其經(jīng)過進一步拆解變?yōu)榭蓛?yōu)化的形式后,最終的目標函數(shù)形式為:

 

這一目標函數(shù)具有很廣泛的適用范圍,領域內(nèi)絕大部分的模型均可以適用該目標函數(shù)來進行模型糾偏而無需對現(xiàn)有模型結(jié)構(gòu)進行修改,比如MF模型等。

為驗證其應用潛力,騰訊天衍實驗室使用領域內(nèi)的benchmark Yahoo R3! 和 Coat 公開數(shù)據(jù)集進行測試,使用MNAR的數(shù)據(jù)作為訓練數(shù)據(jù),使用MAR作為測試數(shù)據(jù),從而能有效反映不同方法對于推薦模型的糾偏效果,最終實驗結(jié)果如下表所示。

表格 1 實驗結(jié)果(AUC和MSE指標)

 

表格 2 實驗結(jié)果 (nDCG指標)

 

在模型的魯棒性測試中,該方法表現(xiàn)出較強的穩(wěn)健性。對超參數(shù)變化敏感性不強,非常適用于實際場景的部署。相比于傳統(tǒng)推薦系統(tǒng),這種基于信息理論的推薦系統(tǒng)糾偏方法呈現(xiàn)出幾大創(chuàng)新點:其一,基于信息論和反事實理論學習方法,無需執(zhí)行線上隨機流量試驗,節(jié)省了大量訓練成本;其二,模型參數(shù)魯棒性較好,適合工業(yè)場景實際部署;其三,目標函數(shù)具有很廣泛的適用范圍,領域內(nèi)絕大部分的模型均可以適用該目標函數(shù)來進行模型糾偏,而無需對現(xiàn)有模型結(jié)構(gòu)進行修改,兼容性較強。

商業(yè)應用無處不在 推薦系統(tǒng)糾偏方法重拾內(nèi)容多樣性

放眼當下,推薦系統(tǒng)的商業(yè)應用無處不在,不少主流APP都應用到了推薦系統(tǒng)。例如,旅游出行類中,攜程、去哪兒等會推薦機票、酒店等;外賣平臺類中,餓了么、美團等會推薦飯店;電商購物類中,京東、淘寶、亞馬遜等會推薦“可能喜歡”的物品;新聞資訊類中,今日頭條、騰訊新聞等會推送用戶感興趣的新聞....幾乎所有APP或網(wǎng)站都在應用推薦系統(tǒng)。

騰訊天衍實驗室作為騰訊布局醫(yī)療領域背后的技術提供者,主要專注于醫(yī)療健康領域的AI算法研究及落地,并且不斷研究與拓展AI醫(yī)療技術發(fā)展的邊界。目前,騰訊天衍實驗室主要將算法能力輸出到微信支付九宮格的騰訊健康小程序、QQ瀏覽器、微信搜一搜等。例如在疫情期間,天衍實驗室運用AI大數(shù)據(jù)技術,通過騰訊健康疫情問答推薦版塊,為用戶帶來關于疫情的多方面的內(nèi)容和咨詢服務,而不僅僅關注用戶個人和集體偏好,基于信息理論模型,快速進行模型訓練對推薦系統(tǒng)進行糾偏,極大的節(jié)省了時間和經(jīng)濟成本。

同時,在騰訊覓影的AI導輔診平臺上,日常的醫(yī)療資訊推薦上也應用了該方法為用戶推薦相關內(nèi)容,大大提升了推薦內(nèi)容的多樣性和公平性,同時也增強了用戶體驗。比如對于患有糖尿病的患者,其日常關注的內(nèi)容可能都與糖尿病相關,如果不對推薦系統(tǒng)進行糾偏,系統(tǒng)會越來越傾向于推薦糖尿病相關內(nèi)容給到用戶,而經(jīng)過系統(tǒng)糾偏之后,還會給患者推薦一些運動、睡眠等其他健康知識,幫助用戶更加全面的了解自身健康。可以見得,推薦系統(tǒng)糾偏方法具有非常廣泛的應用價值,未來,騰訊天衍實驗室還將繼續(xù)擴大其應用范圍,以期為用戶提供更優(yōu)質(zhì)的服務。

責任編輯:武曉燕 來源: 51CTO
相關推薦

2021-05-24 17:02:40

數(shù)字化

2024-01-09 07:34:22

因果糾偏推薦系統(tǒng)推薦模型

2020-12-25 16:30:17

機器學習/隱私保護

2021-08-04 09:48:05

數(shù)字化

2013-04-07 09:38:00

HPC硬件HPC高性能計算

2021-06-09 19:16:33

AI

2021-10-11 20:19:16

AI

2015-02-06 09:23:52

賽可達實驗室網(wǎng)絡安全

2011-05-25 17:51:40

2015-03-30 16:30:50

浪潮

2020-07-01 14:49:50

百度

2009-09-21 11:45:36

CCIE實驗室考試

2014-11-27 10:52:17

vlan路由

2016-03-03 20:40:11

NGFW華為

2019-01-31 09:00:00

開源實驗室管理系統(tǒng)

2010-08-23 14:01:25

互聯(lián)網(wǎng)

2023-08-09 15:11:26

FedoraLinux實驗室
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99久久精品国产一区二区三区 | 四虎影视一区二区 | 久久综合国产 | 犬夜叉在线观看 | 欧美精品国产一区二区 | 中文字幕一区二区三区四区不卡 | 一级片在线观看 | 一区二区三区免费 | 国产中文区二幕区2012 | 欧美在线一区二区三区 | 在线观看成年人视频 | 一区二区免费在线 | 久草热播 | 欧美黄色录像 | 男女污污动态图 | 中文字幕一区二区三区乱码图片 | 99久久日韩精品免费热麻豆美女 | 欧美一级黄色免费 | 国产毛片久久久久久久久春天 | 日韩在线免费视频 | 成人免费淫片aa视频免费 | 国产av毛片 | 久久久久国产一区二区三区 | 中文字幕在线看第二 | 五月婷婷视频 | 涩涩操| 亚洲精品在线观看视频 | 欧洲国产精品视频 | 欧美三级电影在线播放 | 乱码av午夜噜噜噜噜动漫 | 国产精品自拍啪啪 | 欧美日韩在线一区 | 中文av在线播放 | 色啪网 | 中文字幕在线视频网站 | 夜夜爽99久久国产综合精品女不卡 | 极品粉嫩国产48尤物在线播放 | 国产精品国产三级国产aⅴ浪潮 | 天天插天天射天天干 | 欧美日韩在线一区二区三区 | 在线伊人|