成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Gbdt 不能多目標建模?試試 Mtgbm!

開發 架構
多目標學習在推薦系統領域近年一直大放異彩,大家耳熟能詳的ESSM和MMoE等神經網絡模型都是多目標的典型代表方法,他們的基本思想都是考慮了不同任務之間的區別和聯系,提高各個任務的學習質量和效果。

前面文章為什么GBDT可以超越深度學習,我們提到,GBDT在特定的表格數據場景上有獨特的優勢。而在過往的研究中,多目標一直是NN的主場。

我們能否把GBDT和多目標結合起來發光發熱?

答案是,可以!MTGBM給你解決GBDT多目標建模的最后一公里。

多目標學習背景

多目標學習在推薦系統領域近年一直大放異彩,大家耳熟能詳的ESSM和MMoE等神經網絡模型都是多目標的典型代表方法,他們的基本思想都是考慮了不同任務之間的區別和聯系,提高各個任務的學習質量和效果。

除了NN之外,GBDT(Gradient boosted decision trees)模型在推薦系統、廣告系統及金融風控領域被廣泛使用,但一些業界知名的GBDT實現(微軟的LightGBM,XGBoost以及CatBoost)中沒有多目標學習的功能。而在現實場景中引入多任務學習往往能帶來穩定的效果提升及提供更加優秀的魯棒性。

舉幾個簡單的例子:在預測商品點擊率時,不僅僅使用模型學習歷史點擊率,還可以學習點贊收藏分享等數據,更好的學習到用戶的愛好信息,完成預測任務。

在預測欺詐分類時,如果不僅僅預測是否為欺詐,同時預測細分欺詐手法的多個二分類任務,不僅僅會增加模型表達能力,同時還可以在是否欺詐上更加精確,提高模型對目標的理解力。

MTGBM介紹

點擊閱讀原文直達GitHub.

論文地址:https://arxiv.org/pdf/2201.06239.pdf

開源實現:https://github.com/antmachineintelligence/mtgbmcode

這里我要說一下作者了,經常玩比賽的可能知道Bird這個ID,他是MTGBM的一作,并且在螞蟻金服的風控業務實踐和競賽場景中,落地MTGBM都取得了顯著的收益。

這篇文章創造性地提出了一種多任務學習的GBDT算法,并高效地實現了該算法,目前通過該算法能實現的功能有:多標簽-性能提升、歷史模型知識蒸餾,多任務-遷移學習等,在大量公開數據集上測試后,主目標均比XGB,LightGBM,Catboost有較大提升。

該算法基于LigntGBM實現,你可以像以前使用LightGBM一樣使用它,幾乎沒有學習成本。

原理及細節

目前業內使用單目標學習較多,如LightGBM和XGBoost,缺點是模型容易過擬合,魯棒性不足;而目前可用的多目標的GBDT,但是都是僅僅適用于互斥的多分類,并不能應用于多個獨立的任務。而且多個分類之間獨立學習,并沒有提取公共的部分,導致模型提升有限。另外有使用神經網絡深度學習完成多目標學習,但由于特征比較多且值域非常大神經網絡在這些場景表現很差。

一般來說,多目標學習需要共享中間層的參數,從而達到多目標學習的過程。而在樹模型中由于沒有中間參數可以共享,我們決定使用共享樹結構的方式進行多目標學習。新的樹結構被稱為同構異值樹,為不同的目標提供相同的分裂結構和不同的輸出值。

傳統的單目標GBDT計算每個樹的過程

  • 計算之前所有樹預測結果與當前目標的殘差與梯度
  • 通過每個樣本的梯度,在每個樹節點進行分裂的時候,使用某個合適的特征某個位置將樣本劃為兩部分,令損失增益L(梯度)最小。
  • 對每個葉子節點,使用落在他們上的數據梯度的均值進行更新。
  • 在到達指定深度或樣本不可再分后結束分裂。
  • 得到一顆樹。

多目標MGBM算法訓練過程

  • 計算之前所有樹預測結果與多個目標的殘差與梯度
  • 通過每個樣本的多個目標梯度進行融合,使得每個樣本擁有一個融合梯度,在每個樹節點進行分裂的時候,使用某個合適的特征某個位置將樣本劃為兩部分,令損失增益L(融合梯度)最小。
  • 對每個葉子節點,產生等同于學習目標數目的輸出,使用落在他們相應的目標的數據梯度的均值進行更新。
  • 在到達指定深度或樣本不可再分后結束分裂。
  • 得到一顆樹。
  • 最后預測不同目標時,只需要使用相同樹的不同目標值即可。

實驗結果

MTGBM在兩個實際表數據場景的數據集上做了對比實驗,分別是China Foreign Currency Volume 和 Kaggle上的IEEE-CIS Fraud Detection

更多細節的實驗結果,多任務的組合以及多fold的實驗

可以看出MTGBM在實際表數據場景的數據集上,比NN和多個GBDT實現,LGB/XGB/CTB都取得了更好和穩定的提升。


責任編輯:武曉燕 來源: 包包算法筆記
相關推薦

2022-01-12 14:40:49

推薦系統模型

2011-11-25 17:24:20

跨平臺開發移動開發

2024-08-20 08:34:17

2013-05-09 11:47:44

2010-03-18 11:26:46

無線傳感器網絡多目標跟

2019-05-22 14:28:08

AI人工智能深度學習

2020-08-23 18:10:16

機器狗人工智能系統

2021-12-01 09:55:58

谷歌圖像AI

2018-01-25 09:42:56

蘇寧刷臉跟蹤

2023-12-01 08:28:29

推薦系統跨域多目標建模

2021-09-27 09:48:52

神經網絡AI目標檢測

2016-09-30 16:12:47

GBDT算法決策樹

2022-07-08 08:55:56

Go函數模型

2023-10-12 09:47:00

4D雷達

2025-03-19 09:10:00

2020-10-10 06:53:18

數據建模數據庫

2010-06-07 18:17:54

UML建模

2018-08-31 08:03:00

深度學習GBDT算法CatBoost

2009-06-04 10:09:50

敏捷建模建模

2024-12-12 11:58:29

模型YOLO跨層
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩视频观看 | 玖玖操| 国产成人精品网站 | 91一区二区在线观看 | 一级黄a | 国产精品亚洲一区二区三区在线 | 国产成人精品一区二区三 | 中文字幕在线免费 | 亚洲视频免费播放 | 日韩在线观看一区 | 91精品国模一区二区三区 | 国产精品美女www | 超碰免费在线 | 九九亚洲 | 精品国产乱码久久久久久牛牛 | 日韩欧美成人精品 | 中文字幕黄色大片 | 视频在线观看一区 | 涩色视频在线观看 | 亚洲成人网在线观看 | 一区二区三区精品在线 | 91影视| 久久久精品 | 99精品一区二区三区 | 男人的天堂视频网站 | 国产日韩一区二区三免费高清 | 亚洲精品一区二三区不卡 | 日韩av在线免费 | 日韩精品一区二区三区免费视频 | 欧美第一页 | 国产欧美日韩一区二区三区在线观看 | 一本一道久久a久久精品蜜桃 | 夜夜爽99久久国产综合精品女不卡 | 久久不卡| a毛片视频网站 | 亚洲精品国产电影 | 久久精品国产一区二区 | 亚洲成人网在线 | 在线播放日韩 | 久久久久国产一区二区三区 | 国产观看|