成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

兩階段超長周期用戶行為序列建模方法總結(jié)

發(fā)布于 2024-8-6 10:18
瀏覽
0收藏

今天這篇文章介紹的主題是推薦系統(tǒng)中,基于兩階段的超長周期用戶興趣建模系列工作。主要介紹業(yè)內(nèi)比較有代表性的由快手發(fā)表的3篇工作,從2020年最開始的SIM首次提出的兩階段行為序列建模方法,到2022年KDD上發(fā)表的TWIN對兩階段一致性的優(yōu)化,再到2024年CIM上提出的在TWIN基礎(chǔ)上引入層次聚類進(jìn)一步釋放長周期建模能力。

1.背景

在推薦系統(tǒng)的排序模型中,用戶行為序列建模部分的迭代一直是最核心的收益來源。用戶行為序列建模迭代,又可以從空間和時間兩個維度進(jìn)行優(yōu)化。在空間上,通過引入不同類型的行為序列、完善行為序列表征、建立不同用戶行為序列關(guān)系提升信息豐富度;在時間上,通過引入更長周期的歷史序列完整刻畫用戶長周期興趣。

在時間上的優(yōu)化,一個核心難點(diǎn)如何解決性能問題。隨著引入序列的增長,模型的計(jì)算時間會隨之增長,很難在線上應(yīng)用。為了解決這個問題,快手提出了一系列基于兩階段的超長周期行為序列建模方法,其核心思路是將長周期行為序列拆分成兩個階段,第一階段使用計(jì)算復(fù)雜度較低的方法快速從全周期序列檢索出可能對預(yù)測有幫助的部分,縮短序列長度,第二階段再使用諸如attention等復(fù)雜模型進(jìn)一步進(jìn)行序列建模。

2.SIM:兩階段建模

行為序列建模的核心是從歷史序列中找到和目標(biāo)item關(guān)系最密切的部分,作為模型的輸入。一般采用attention的方法,但是其在長周期序列引入中一方面計(jì)算復(fù)雜度高,一方面模型擬合也比較困難。SIM提出了一種兩階段的長周期建模方法,由General Search Unit和Exact Search Unit兩個部分組成。General Search Unit用于從長歷史行為序列中選出和當(dāng)前候選商品最相關(guān)的幾個子序列,Exact Search Unit用于更精細(xì)的匹配,可以采用類似DIEN等的方法。

對于General Search Unit有hard search和soft search兩種。Hard search比較簡單,直接選擇和候選商品相同類目的歷史行為;Soft search采用向量檢索的方式計(jì)算歷史行為和候選商品的匹配分,其中商品向量采用一個輔助CTR任務(wù)來學(xué)習(xí)長期數(shù)據(jù)和候選廣告之間的相關(guān)性得到。

兩階段超長周期用戶行為序列建模方法總結(jié)-AI.x社區(qū)

3.TWIN:提升兩階段一致性

上述兩階段建模的方法中,GSU階段和ESU階段存在不一致問題,即GSU篩選的打分和ESU篩選的打分并不是相同的計(jì)算邏輯,導(dǎo)致GSU篩選出的TopK不是全局最優(yōu)解,可能在ESU中認(rèn)為最優(yōu)的結(jié)果在GSU中被過濾掉了。下圖也展示了這種不一致性。可以看出,GSU和ESU的差異還是比較大的,如果能解決二者的一致性問題,能帶來比較大的收益。

兩階段超長周期用戶行為序列建模方法總結(jié)-AI.x社區(qū)

為了解決這個問題,TWIN在GSU部分進(jìn)行了改造,讓GSU也進(jìn)行輕量級的attention計(jì)算提升和ESU的一致性。在GSU部分,將特征分為內(nèi)部特征和交叉特征。內(nèi)部特征指的是item本身的特征,例如商品id、視頻作者等,這部分特征不隨著用戶交互變化,因此可以直接緩存起來,線上不用每次都計(jì)算。對于交叉特征部分,每一維特征都使用一個全連接層映射成1維。通過這種方式,將attention計(jì)算的時間復(fù)雜度從??(?? × (?? + ??) × ????????)降低到??(?? × ??),其中L為序列長度,H為內(nèi)在特征維度,C為交叉特征維度,H一般占據(jù)特征的主要部分。

計(jì)算attention的公式如下,query和key使用內(nèi)在特征,交叉特征維度為1,因此這里作為bias加入到attention score的計(jì)算中。

兩階段超長周期用戶行為序列建模方法總結(jié)-AI.x社區(qū)

4.TWINV2:聚類釋放長周期潛力

用戶歷史序列雖然很長,但是存在很多重復(fù)的信息或者相似的信息,這些重復(fù)或近似的item反應(yīng)了用戶相似的興趣。TWINV2在TWIN的基礎(chǔ)上,進(jìn)一步通過聚類對歷史行為序列進(jìn)行重組,縮短歷史序列,提升長周期建模潛力。

首先,將歷史看過的視頻根據(jù)其觀看長度 / 視頻長度的比例分成不同的組,每個組代表用戶的一種感興趣程度。每個組內(nèi),使用層次聚類+Kmeans聚類,對item進(jìn)行聚類。每個聚類的特征由其類內(nèi)item的特征組合而成。對于數(shù)值特征,使用這個類簇的均值計(jì)算該特征;對于ID特征,使用距離這個聚類中心最近的item的ID作為該聚類簇的特征。在得到歷史序列的聚類結(jié)果,以及每個聚類的表征之后,使用和Twin類似的ESU+GSU兩階段方法進(jìn)行用戶興趣建模。

? 兩階段超長周期用戶行為序列建模方法總結(jié)-AI.x社區(qū) 圖片 ?

本文轉(zhuǎn)載自 ??圓圓的算法筆記??,作者: Fareise

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 亚洲成av| 一级在线观看 | www久久久 | 伊人精品久久久久77777 | 日韩国产精品一区二区三区 | 亚洲久久一区 | 日韩欧美不卡 | 亚洲欧美第一视频 | 亚洲精品一区二区二区 | 精品一区二区视频 | 亚洲国产成人精品女人久久久 | 日韩精品一二三 | 日韩av视屏 | 亚洲综合大片69999 | 一级a爱片性色毛片免费 | 国产精品久久av | 日韩免费1区二区电影 | 久久久性 | 亚洲一区精品在线 | www97影院 | 91精品久久久久久久久久入口 | 污片在线观看 | 9999国产精品欧美久久久久久 | 国产96色在线 | 国产精品一区二区三区四区 | 99国产视频| 精品视频在线观看 | 久久国产精品久久 | 免费一级片 | 欧美精品网站 | 天堂一区二区三区 | 久久久久久久久99 | 国产不卡一区 | av夜夜操| 国产精品视频观看 | 免费激情 | 日韩一区二区三区在线看 | 伊人导航| 精品国产乱码久久久久久图片 | 91视频三区 | 国产中文一区二区三区 |