微軟推出ML.NET 3.0版本,擴展了深度學習功能
11月29日消息,據外媒報道,微軟日前發布了ML.NET?3.0,這是該公司開源、跨平臺機器學習框架的最新版本,可以將機器學習模型集成到.NET應用程序中。
ML.NET?3.0在對象檢測、命名實體識別和問題回答方面包含了新的深度學習功能。通過與TorchSharp和ONNX模型的集成和互操作性,支持這些深度學習場景。3.0版本還更新了與LightGBM梯度增強框架的集成。
ML.NET?3.0還改進了對數據處理場景的支持,對DataFrame和新的IDataView互操作性特性進行了增強和BUG修復。數據的加載、檢查、轉換和可視化功能變得更加強大。
微軟在5月份宣布了ML.NET模型構建器中的對象檢測。這些功能是建立在ML.NET?3.0中引入的TorchSharp驅動的對象檢測API之上的。目標檢測API利用了微軟研究院的一些最新技術,并由TorchSharp構建的基于Transformer的神經網絡架構提供支持。目標檢測包含在Microsoft?ML.TorchSharp?3.0.0包中。
ML.NET?3.0還提供了自然語言處理領域,包括問答和命名實體識別。這些場景可以通過在ML.NET?2.0中引入的現有TorchSharp?RoBERTa文本分類功能的基礎上進行構建來解鎖。ML.NET?3.0獲得了新的自動機器學習(AutoML)功能,包括AutoML?Sweeper,現在支持句子相似度、問題回答和對象檢測。
ML.NET?3.0對DataFrame進行了更新,包括擴展了數據加載場景,現在可以從SQL數據庫導入和導出數據。這是通過ADO完成的。NET,它支持SQL兼容的數據庫。同樣在DataFrame中,列克隆和二進制比較場景的算術性能得到了改進。在執行算術運算時改進了空值處理,在轉換數據時需要更少的步驟。對調試器進行了改進,以改善具有長名稱的列的可讀輸出。張量原語包括一組新的API來支持張量操作。
微軟目前正在制定.NET?9和ML.NET?4.0的計劃。與此同時,該公司表示,用戶可以期待Model?Builder和ML.NET?CLI進行更新,以使用ML.NET?3.0版本。計劃還要求擴展深度學習場景和集成,并對DataFrame進行增強。最后,微軟表示將繼續擴展System.Numerics.Tensors中的API,并將其集成到ML.NET中。