成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

如何確認深度學習模型的loss已經收斂好了？

發布于 2025-3-6 10:16

瀏覽

0收藏

簡單來說，如果你沒有足夠的機器資源和時間，那么就跑到你預期的epoch，只需要保證驗證集預期的準確率或其他指標滿足要求即可。

局部極小值和鞍點

如果你想追求極致的loss下降，那么你需要了解兩個知識點——局部極小值和鞍點。

如何確認深度學習模型的loss已經收斂好了？-AI.x社區

一般我們的loss降不了，是因為該位置的參數對損失的微分為零，導致梯度下降不再更新參數了，那么此時loss也就不會繼續下降。

那么提到梯度為零的時候，我們一般想象到的是局部極小值。其實也沒錯，因為出現局部極小值，那么梯度=0。但有些情況，是有可能既不是局部極大值 or 局部極小值，但梯度還是=0，這個情況我們成為鞍點（因為落點的形狀像馬鞍，稱鞍點）。

那鞍點的情況是梯度雖然為零，但還不是極小值的情況，那證明還有下降空間，只要我們逃離鞍點，就可以繼續讓loss下降。

如何確認深度學習模型的loss已經收斂好了？-AI.x社區

確定是鞍點還是局部極小值

如何確認深度學習模型的loss已經收斂好了？-AI.x社區

如何確認深度學習模型的loss已經收斂好了？-AI.x社區

如何確認深度學習模型的loss已經收斂好了？-AI.x社區

參考資料: 李宏毅-《機器學習》(??https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.php??)

本文轉載自??沐白AI筆記??，作者：楊沐白

標簽

贊

收藏

回復

舉報

回復

相關推薦

深度學習領域的一些關鍵概念

parson2000 ? 2749瀏覽 ? 0回復
機器學習之特征工程深度解析

51CTO內容精選 ? 2903瀏覽 ? 0回復
機器學習有哪些類型？監督學習、無監督學習、強化學習、深度學習等等！

parson2000 ? 3972瀏覽 ? 0回復
機器學習有哪些類型？監督學習、無監督學習、強化學習、深度學習等等

parson2000 ? 4664瀏覽 ? 0回復
什么監督學習，無監督學習與深度學習？它們之間有什么區別和聯系？

AI探索時代 ? 1.1w瀏覽 ? 0回復
汽車長翅膀：GPU 是如何加速深度學習模型的訓練和推理過程的？

Baihai_IDP ? 3073瀏覽 ? 0回復
如何拯救LoRA初始化？LoRA-GA：性能顯著提升+收斂速度更快！

angel ? 2979瀏覽 ? 0回復
深度學習中生成模型的工作原理：解析用于數據增強的生成模型

51CTO內容精選 ? 3967瀏覽 ? 0回復
TensorFlow 2.17：深度學習框架的新高度

sword_hero ? 2666瀏覽 ? 0回復
深度學習模型之——生成對抗網絡模型(GANs)

AI探索時代 ? 2521瀏覽 ? 0回復
不依賴CUDA的大模型推理已經實現

夜行神魚 ? 2754瀏覽 ? 0回復
醫療圖像分割中的深度學習方法

51CTO內容精選 ? 2088瀏覽 ? 0回復
基于關系型深度學習的自助機器學習

51CTO內容精選 ? 2333瀏覽 ? 0回復
提高深度學習模型效率的三種模型壓縮方法

51CTO內容精選 ? 2855瀏覽 ? 0回復
【深度探索】FlashAttention-3：深度學習注意力機制的再進化

sword_hero ? 2917瀏覽 ? 0回復
SFT loss計算的那些坑，完美避開！！！

丁師兄大模型 ? 3022瀏覽 ? 0回復
深度學習的Batchsize必須是2的n次方嗎？

石映飛云 ? 3464瀏覽 ? 0回復
Questel：2024深度學習與大模型全球專利全景報告

歐米伽未來研究所 ? 3128瀏覽 ? 0回復
深度學習的‘黃金法則’：為什么選擇ReLU？

人工智能訓練營 ? 3138瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

一文講透深入理解邏輯回歸 2025-06-17 06:35:55發布
如何有效降低機器學習模型過擬合？ 2025-06-04 07:02:18發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： NLP：生動理解TF-IDF算法

下一篇：低代碼AI開發平臺深度對比：Dify、FastGPT與Coze

社區精華內容

目錄

主站蜘蛛池模板：在线免费观看黄a | 蜜桃av人人夜夜澡人人爽 | 爱综合 | 国产视频一区二区 | 久久国产视频播放 | 一区二区在线不卡 | 视频二区在线观看 | 亚洲精品一区二区三区中文字幕 | 一区二区三区在线观看视频 | 欧美男人天堂 | 国产精品小视频在线观看 | 欧美视频成人 | 国产欧美一区二区三区在线播放 | 国产精品视频入口 | 操射视频| 欧美精品在欧美一区二区 | 色橹橹欧美在线观看视频高清 | 成人一级视频在线观看 | 国产在线精品一区二区 | 国内精品视频一区二区三区 | 欧美日韩综合视频 | 午夜一区二区三区在线观看 | 精品在线播放 | 久久久久国产一区二区 | 国产精品免费一区二区三区四区 | 亚洲有码转帖 | 精品一级毛片 | 天天人人精品 | 久久999 | 欧美一区二区三区在线观看视频 | 日韩一区二区在线播放 | 欧美激情综合 | 99热欧美 | 99久久中文字幕三级久久日本 | 2019天天干天天操 | 亚洲成人观看 | 亚洲精品一区二区 | 午夜在线影院 | 99re在线视频精品 | 欧美日韩在线成人 | 日韩精品国产精品 |