成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用梯度下降求解整數規劃,中科大等提出無監督訓練整數規劃求解器新范式 | ICLR 2025 Spotlight

人工智能 新聞
與現有主流的監督學習方法對比,DiffILO不僅顯著加快訓練速度,還能生成更高質量的可行解。

無監督學習訓練整數規劃求解器的新范式來了。

中國科學技術大學王杰教授團隊(MIRA Lab)提出了一種全新的整數規劃求解方法——DiffILO(Differentiable Integer Linear Programming Optimization),相關論文已被人工智能頂級國際會議ICLR 2025接收為Spotlight。

結果顯示:與現有主流的監督學習方法對比,DiffILO不僅顯著加快訓練速度,還能生成更高質量的可行解。

圖片

引言:用機器學習解ILP,為何如此困難?

整數線性規劃(ILP) 是組合優化中最基礎也是最關鍵的一類問題,廣泛應用于工業調度、物流運輸、網絡規劃、芯片布圖等現實場景。然而 ILP 的求解非常困難 —— 變量離散、可行域復雜、搜索空間指數爆炸,本質上屬于 NP 難問題。

近年來,機器學習逐漸被引入這一過程,嘗試通過數據驅動的方式加速求解器。但當前主流做法大多依賴監督學習:先用傳統求解器(如Gurobi)生成一批解作為標簽,然后訓練模型去“模仿”這些解。這種做法存在兩大瓶頸:

  • 高昂的訓練成本:每個樣本都需調用求解器生成標簽;
  • 訓練目標與測試目標不一致:只優化預測誤差,無法保障最終解的可行性與質量。

有沒有可能完全擺脫標簽依賴,直接讓模型“自己”學會求解ILP問題?

答案是:可以!該論文提出了DiffILO方法,可以用梯度下降來“解整數規劃”!

圖片

核心方法:DiffILO是如何做到的?

DiffILO,全稱 Differentiable Integer Linear Programming Optimization,是一種無監督、端到端、可微分的ILP求解新范式。它的核心創新是將離散、帶約束的整數規劃問題,轉化為連續、可微、無約束的問題,并借助深度學習模型來直接預測高質量解。

方法流程如下圖所示:

圖片

方法大致可以分為三個步驟:

Step 1:從離散到連續——概率建模與約束期望化

ILP問題的形式通常如下:

圖片


DiffILO的第一步是將每個0-1變量圖片視為伯努利分布下的隨機變量,即圖片

其中圖片是需要優化的概率值。

傳統ILP的“硬約束”圖片 被轉化為“期望約束違背為零”:

圖片

這種期望建模方式有兩個好處:

  • 仍能保留原問題的最優解結構;
  • 易于被懲罰函數進一步轉化為無約束形式。

Step 2:從約束到目標——懲罰函數與可微重參數化

該方法使用懲罰函數法將上述期望約束合入目標函數:

圖片

但由于該函數的采樣項并不可微,DiffILO采用了Gumbel-Softmax + 重參數技巧,將離散采樣近似為一個連續可導的函數:

  • 使用 圖片,實現對伯努利的可微近似;
  • 使用圖片保留組合結構;
  • 梯度通過圖片回傳,值通過圖片保留,兼顧
    “可微”和“離散”的雙重需求。

最終得到一個幾乎處處可導的目標函數圖片,可以直接用梯度下降

進行優化。

Step 3:從圖中學——GNN建模與端到端訓練

每個ILP實例本質上可以被表示為一個二分圖:左邊是變量,右邊是約束,邊代表變量出現在對應約束中。

使用一個圖神經網絡(GNN)來編碼這個結構,輸入為圖G,輸出為概率向量圖片,再接入一個MLP進行最終預測。

訓練過程完全無監督,目標是最小化上述可微目標函數圖片。還引入了三種訓練技巧來增強穩定性:

  • 樣本歸一化:對目標函數做歸一處理,適應不同實例規模;
  • 余弦退火:自適應學習率調度;
  • 懲罰系數調控:動態調整μ,平衡解質量與可行性。

實驗結果

作者在多個標準 ILP 數據集(如 Set Covering、Independent Set、Combinatorial Auction)上進行了系統評估。結果顯示:與現有主流的監督學習方法對比,DiffILO不僅顯著加快訓練速度,還能生成更高質量的可行解,并且在與Gurobi、SCIP結合使用時,顯著提升求解器的整體性能。

作者介紹

本論文作者耿子介是中國科學技術大學MIRA實驗室2022級博士生,師從王杰教授。此前,他于2022年畢業于少年班學院,取得數學與應用數學專業學士學位。他的主要研究方向包括機器學習在運籌優化與芯片設計等領域的應用、大語言模型等。他在NeurIPS、ICML、ICLR等人工智能頂級會議上發表論文十余篇,其中五篇論文入選Oral/Spotlight。他曾獲2024年度國家獎學金;曾兩次獲得丘成桐大學生數學競賽優勝獎;曾在微軟亞洲研究院實習,獲得“明日之星”稱號;曾多次擔任頂會審稿人,獲評NeurIPS 2023 Top審稿人;參與創辦南京真則網絡科技有限公司。

論文地址:
openreview.net/pdf?id=FPfCUJTsCn

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-03-17 07:59:57

AI數字化

2021-12-06 09:53:09

自然語言神經網絡人工智能

2025-03-21 10:08:37

2025-04-08 09:00:00

AI模型數據

2022-03-16 09:33:13

模型算法智能

2025-04-15 09:22:00

AI訓練模型

2024-12-09 10:15:00

AI技術

2024-11-04 13:30:00

模型AI

2023-05-23 08:00:00

數據集ImageNet算法

2025-06-10 09:07:00

2023-08-21 13:49:00

圖像技術

2024-09-02 08:22:00

模型數據集

2025-02-25 10:04:10

2025-03-17 09:15:00

模型訓練AI

2023-10-30 15:06:00

模型數據

2025-03-18 09:33:13

2025-04-09 09:25:00

視頻模型AI

2023-12-04 13:23:00

數據訓練

2013-06-19 11:32:32

計算性能ISCHPC

2024-04-07 09:00:00

數據模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久在草 | 91精品国产综合久久久久久蜜臀 | 国产不卡在线观看 | 久久精品国产一区 | 久久精品天堂 | 久久久久国产精品一区三寸 | 国产999精品久久久久久 | 久久麻豆精品 | 久久伊| 久久综合九色综合欧美狠狠 | 国产精品视频一区二区三区, | 羞羞视频在线观看免费观看 | 中文字幕人成乱码在线观看 | 国产成人99久久亚洲综合精品 | 久久精品国产免费看久久精品 | 在线观看亚洲欧美 | 欧美啪啪网站 | 日本不卡一区二区三区在线观看 | 日韩欧美一区二区在线播放 | 亚洲一区二区视频在线播放 | 欧美一级在线免费观看 | 欧美国产日韩一区二区三区 | 高清av一区 | 欧美成ee人免费视频 | 中文字幕在线二区 | 国产精品久久一区 | 国产麻豆乱码精品一区二区三区 | 成人高潮片免费视频欧美 | 天堂久久一区 | 狠狠干天天干 | chengrenzaixian | 精品视频免费 | 成人性视频免费网站 | 精国产品一区二区三区 | 日韩免费一级 | 亚洲福利在线视频 | 久久亚洲精品国产精品紫薇 | 天天操夜夜爽 | 国产成人精品在线播放 | 国产一级一片免费播放 | 亚洲一区二区三区免费视频 |