神經網絡的通用訓練流程原創

AI探索時代

發布于 2024-7-12 07:55

瀏覽

0收藏

“ 神經網絡模型核心有三步，模型搭建，數據處理，模型訓練評估”

今天總結一下神經網絡模型的通用訓練步驟和流程，以及其作用。

神經網絡的通用訓練流程 -AI.x社區

模型通用訓練流程

從功能上來說，所有基于神經網絡搭建的模型都要經過以下三個步驟：

模型搭建
數據處理
模型訓練及評估

模型搭建需要經過以下幾個步驟：

模型定義

根據任務需求，可以設計不同的網絡層，比如嵌入層，卷積層等。一般的神經網絡模型都由多層網絡層組成。

網絡層實現了對輸入信號的處理，比如卷積層是怎么卷積的，活動的神經元是哪些。本質上是一個函數，有一個輸入就有一個輸出。

神經網絡的通用訓練流程 -AI.x社區

前向傳播算法

前向傳播算法是神經網絡模型的核心模塊，用來對傳入的神經信號進行處理。比如一個輸入，需要經過那幾個網絡層計算，最后的輸出結果是什么等。

損失函數

損失函數是用來計算模式執行結果是否正確的判官，損失函數結果越小，說明網絡模型訓練效果越好。

優化器

優化器的作用就是，根據損失函數計算的結果，通過反向傳播算法使用優化器對模型的參數(權重)進行調整優化，以達到最小損失。比如，梯度下降算法。

神經網絡的通用訓練流程 -AI.x社區

梯度下降

數據處理

數據處理屬于模型訓練的準備階段，其主要作用就是整理出一份能滿足某種訓練需求，并且能夠讓神經網絡模型處理的數據。

數據一般會分為訓練數據集和測試數據集。

主要步驟分為：

數據清洗
數據統一格式

比如，在NLP(自然語言處理)中，數據需要經過清洗，刪除一些無效數據，亂碼等；清洗之后需要進行分詞處理，構建詞匯表等。

而在CV(計算機視覺)中同樣需要對圖片和視頻進行清洗和裁剪，以及格式統一。

而根據不同的需求可以進行適當的調整，但主要必須經過這兩步處理，主要表現形式為Dataset數據集。

神經網絡的通用訓練流程 -AI.x社區

模型訓練及評估

模型訓練的本質就是通過訓練數據，及損失函數和優化器不斷調整模型參數的過程。

數據加載

準備訓練的數據需要經過加載才能傳入到神經網絡中，而加載的過程也需要解決幾個問題：

能夠加載的數據格式文本，圖片，視頻等，數據結構，結構化數據與非結構化數據，以及數據的加載來源，是本地加載，還是從網絡中加載等；還有大規模訓練數據的拆分等。

最重要的是，要把數據轉換成神經網絡能夠識別的形式——張量(tensor)/向量(vector)

分批次處理

分批處理是因為大模型的訓練數據量比較大，需要分批次加載，每次加載部分數據，否則會導致系統崩潰。

模型訓練

模型的訓練就是把訓練數據輸入到模型中，并且使用損失函數根據輸出計算損失差，最后使用優化器優化網絡模型參數的過程。

模型根據數據量會進行多次訓練。

神經網絡的通用訓練流程 -AI.x社區

模型保存與加載

訓練過程中或訓練好的模型，需要被保存下來后續使用；而使用模型需要先加載模型。

而模型的保存與加載有多種形式，比如模型和參數是一塊保存還是分開保存，保存的模型和參數的格式是什么樣的，是否需要分布式保存等；加載模型的方式是什么樣的，以及從哪里加載模型。

模型評估?

模型評估的作用就是使用測試數據集，對訓練好的模型進行測試，測試其訓練成果。如果未通過測試，則說明模型訓練有問題，需要進行調整。

而模型評估的方式方法，以及評估標準是需要考慮的問題。

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/nIHZsKEt6WrShURgXFdF6A??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

大模型

神經網絡

已于2024-7-12 07:58:49修改

贊

回復

舉報

回復

相關推薦

在神經網絡中實現反向傳播

mb61e52f0ac174a ? 2614瀏覽 ? 0回復
ICLR 2024 Oral｜用巧妙的「傳送」技巧，讓神經網絡的訓練更加高效

輕薄滴假象 ? 2528瀏覽 ? 0回復
你知道神經網絡是怎么運作的嗎？神經網絡內部原理解析

AI探索時代 ? 2706瀏覽 ? 0回復
神經網絡與2024諾貝爾物理獎

魯班模錘1 ? 2409瀏覽 ? 0回復
優雅談大模型：神經網絡與矩陣

魯班模錘1 ? 2493瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了！

人工智能訓練營 ? 2027瀏覽 ? 0回復
什么是神經網絡？神經網絡開發框架——PyTorch和架構Transformer的區別和聯系

AI探索時代 ? 2987瀏覽 ? 0回復
神經網絡是怎么學習的？

AI探索時代 ? 2016瀏覽 ? 0回復
怎么學習設計和訓練一個大模型——也就是神經網絡？

AI探索時代 ? 1972瀏覽 ? 0回復
關于神經網絡的輸入格式——數據集的處理，關于神經網絡模型的結構說明

AI探索時代 ? 2339瀏覽 ? 0回復
關于神經網絡的一些思考與感受

AI探索時代 ? 1926瀏覽 ? 0回復
多尺度深度卷積神經網絡的多尺度特征輸出分析

步驚云_32 ? 2036瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了反向傳播詳解

人工智能訓練營 ? 2276瀏覽 ? 0回復
從一個簡單的神經網絡模型開始

AI探索時代 ? 1935瀏覽 ? 0回復
再談什么是神經網絡，透過現象看本質

AI探索時代 ? 1893瀏覽 ? 0回復
怎么實現一個神經網絡？神經網絡的組成結構

AI探索時代 ? 2036瀏覽 ? 0回復
不同神經網絡之間的區別，僅僅只是網絡結構的不同，明白了這個你才能知道應該怎么學習神經網絡

AI探索時代 ? 2093瀏覽 ? 0回復
神經網絡的每一層都是干嘛的？這才是神經網絡結構的核心

AI探索時代 ? 2011瀏覽 ? 0回復
什么是神經網絡-循環神經網絡RNN各層詳解及實例展示

人工智能訓練營 ? 2451瀏覽 ? 0回復

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

神經網絡的通用訓練流程原創

模型通用訓練流程

目錄

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

神經網絡的通用訓練流程 原創

模型通用訓練流程

目錄

神經網絡的通用訓練流程原創