數學優化和機器學習結合使用的四種方法簡介
數學優化與機器學習
數學優化(或數學規劃)是一個強大的決策工具。通過制定目標并指定約束條件和變量,數學優化可以幫助在當前現實環境下做出最佳決策。它已經在航空、物流、電力和金融等許多不同行業證明了其價值。
機器學習是人工智能的一個分支領域。計算機可以識別數據中的模式并學習預測未來,可以進行聚類、檢測異常或生成新的音樂或圖像。機器學習的三種類型(有監督、無監督和強化學習)可以應用于所有行業,比如醫療保健,甚至是藝術。機器學習模型都是關于概率的,并預測將發生事情的概率
兩種方法各有優缺點。當數據變化太多時,機器學習模型就變得毫無用處,模型需要重新訓練或從頭開始重建。數學優化需要良好的數學描述,它不能像機器學習那樣處理非結構化數據。此外,如果問題變得太大,您可能需要一個商業解決程序來解決問題,這可能是相當昂貴的。
有些問題更適合機器學習,而另一些問題則更適合數學優化。當您希望發現數據中的模式、查找相似的數據樣本或預測天氣時,應該使用機器學習。如果您想創建一個時間表,找到設施的最佳位置或最小化問題的成本,數學優化是更好的選擇。
如何結合數學優化和機器學習呢?
將數學優化和機器學習結合起來是很有用的。它們有不同的優點和缺點,有些問題太復雜,不能只使用兩者中的一種。它們可以相互補充。這里有四種方法和實際例子,告訴你如何將它們結合起來。
1. 使用機器學習預測作為優化模型中的約束
首先,您使用機器學習進行預測,這些預測被用作優化問題的輸入。您可以使用機器學習模型的輸出設置約束。
示例:使用機器學習預測觀看人數,使用它們作為輸入來創建一個優化的最佳計劃
假設你是一家平臺的數據科學家,你向其他公司出售廣告空間。廣告商購買播放時間,平臺根據經驗猜測有多少人會看到廣告商的廣告。作為數據科學家,您希望以最好的方式使用廣告空間。首先,使用機器學習根據歷史數據預測觀看數據。然后,創建一個使用觀看數據為輸入的優化模型。你通過觀看數據來優化計劃。通過這樣做,你可以使平臺的利潤最大化。
2. 使用優化決策作為機器學習模型中的訓練特征
與方法 1 相比,這是相反的方式:首先優化模型做出決策,決策被用作機器學習模型中的特征。實際上,這種方法不太常見,因為大多數決策 (MO) 都遵循預測 (ML)。這種方式可能在特定項目中很有用。
示例:在機器學習模型中使用運輸決策
數學優化在物流中有著廣泛的應用。如果您使用優化來決定需要從生產工廠運送到市場的供應量,它可以節省大量時間、金錢和資源。在獲得這些結果之后,您可以將它們用于機器學習問題中,例如預測特定日期每個工廠需要多少員工。
3.利用機器學習輸出來確定數學優化模型的范圍
除了在優化問題中直接使用機器學習輸出外,您還可以選擇將它們獨立地結合起來。您可以在同一個項目中使用它們,但不是在同一個過程中。您可以使用機器學習輸出來簡化數學優化問題:您可以使用機器學習確定優化模型的范圍。這里的一個額外好處是優化模型可以在更短的時間內求解。
示例:使用預測性維護和聚類來確定路由問題的范圍
在這個例子中,我們來看一家修理電源箱的公司。他們的修理工數量有限,希望以最好的方式使用這些修理工。首先,您可以使用預測性維護(機器學習)來決定哪些電源箱具有最高的故障風險。然后,使用聚類(機器學習)對高風險電源箱進行聚類。聚類是因為您希望一組電源箱彼此靠近。您可以選擇與可用的修理工數量相等的聚類數量。最后,通過數學優化,您可以創建每個聚類的電源箱之間的最佳路線,每個修理工都有一條路線。
4. 利用優化來解決機器學習問題
你可以使用優化來為機器學習問題找到一個最優的參數集。機器學習和數學優化在這里是緊密結合在一起的,因為在機器學習問題中使用了優化。下面的例子表明,混合整數規劃(MIP)已經證明了它在解決一個經典研究問題中的價值。
例:求解線性回歸中的最佳子集選擇問題
在構建回歸模型時,去除不相關的特征會使模型更容易解釋,并且也不容易過度擬合數據。很難找到特征的最優子集,稱為最佳子集選擇問題。在過去的幾十年里,混合整數規劃(數學優化)在速度上有了顯著的提高,這使得在現有問題上測試它很有用。
最后
希望本文能啟發您嘗試數學優化和機器學習的有趣結合!它們適用于不同類型的問題,并且可以相互補充。除了明顯的方法(使用一個的輸出作為另一個的輸入)之外,還有其他方法可以將它們組合起來。你可以將它們松散地結合起來,就像第三種方法一樣,使用機器學習來確定優化問題的范圍。或者您可以將它們緊密集成以解決研究問題,如最后一個示例所示。