成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

神經網絡是怎么學習的？原創

發布于 2025-1-13 10:40

瀏覽

0收藏

“ 神經網絡的本質就是一個數學函數，也就是y=f(x)中的f ”

今天這篇文章主要是用來記錄一個問題，神經網絡是怎么學習的？

這個問題是在昨天寫神經網絡的開發框架——PyTorch和神經網絡架構——Transformer架構時突然發現的一個問題。

神經網絡的學習過程

在學習大模型或者說神經網絡的過程中，我們知道一件事就是，神經網絡在設計完成之后，需要經過大量的數據進行訓練；具體流程就是要把訓練數據輸入到模型中，然后模型經過一系列的處理，如損失計算，參數調整(反向傳播算法)，一步一步的把模型參數調整到最優解。

神經網絡是怎么學習的？-AI.x社區

但是從PyTorch框架來看，所謂的模型訓練就是在不斷的進行數學運算，包括矩陣運算，求導等等；而從Transformer架構來看，模型訓練就是經過架構中的編碼器和解碼器，通過數學計算的方式提取數據的特征，最終獲得結果。

這里就產生了一個問題，那就是為什么數據經過一系列數學運算之后，就可以學習到數據的特征；雖然說模型是通過矩陣運算，把數據轉化為向量之后，通過計算向量之間的數學關系來表示數據的特征；比如說，歐式距離，平方差等。

在多維的向量空間中，具有語義或關聯性的數據在多維空間中就會呈現一定的數學關系；但神經網絡是怎么知道它們之間的數據關系的？

神經網絡是怎么學習的？-AI.x社區

在無監督學習中，數據之間的關系是模型根據自身的數學規則去計算訓練數據的潛在關系；而在監督學習中，模型是通過損失函數計算訓練數據與目標結果的數學關系——損失差；之后在經過調優函數進行反向傳播，動態調整模型參數的過程。

所以，從表現來看神經網絡之所以能學習到數據特征，主要原因并不在于數學計算，而在于怎么進行這個數學計算，比如第一步該怎么算，第二步該怎么算；最終計算出一個結果。

因此，神經網絡模型就類似于一個數學領域中的函數，也就是y=f(x)，核心就在于這個f——數學關系。

而神經網絡這個函數f(x)和普通函數的區別就在于，普通函數是一個具備一定關系的數學公式，其參數和關系是固定的；而神經網絡這個函數的參數和關系卻是可以動態調整的。

怪不得很多人說，神經網絡的本質就是一個數學問題，更嚴格的說法應該是數學領域中的向量問題；而具體表現為矩陣運算。

訓練數據被轉換為向量之后，神經網絡模型就對這個向量進行七顛八倒的變換。

神經網絡是怎么學習的？-AI.x社區

總的來說，神經網絡的載體是向量，方法是矩陣運算，核心是數學關系——也就是進行怎樣的數學計算，其數學原理是什么？也就是說y=f(x)的這個f到底是什么？

看來是時候需要研究一下Transformer的論文——《Attention is All You Need》了。

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/EjKb72CJOQ8lwPWVfAoVwg??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

神經網絡的通用訓練流程

AI探索時代 ? 2918瀏覽 ? 0回復
你知道神經網絡是怎么運作的嗎？神經網絡內部原理解析

AI探索時代 ? 2697瀏覽 ? 0回復
Ilya Sutskever：基于神經網絡的序列到序列學習，十年回顧

chengganfei ? 3497瀏覽 ? 0回復
什么是神經網絡—終于把梯度下降搞明白了！

人工智能訓練營 ? 2314瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了！

人工智能訓練營 ? 2021瀏覽 ? 0回復
什么是神經網絡？神經網絡開發框架——PyTorch和架構Transformer的區別和聯系

AI探索時代 ? 2982瀏覽 ? 0回復
怎么學習設計和訓練一個大模型——也就是神經網絡？

AI探索時代 ? 1972瀏覽 ? 0回復
關于神經網絡的輸入格式——數據集的處理，關于神經網絡模型的結構說明

AI探索時代 ? 2339瀏覽 ? 0回復
關于神經網絡的一些思考與感受

AI探索時代 ? 1926瀏覽 ? 0回復
神經網絡理論與技術學習以及工具

AI探索時代 ? 1989瀏覽 ? 0回復
什么是神經網絡-終于把神經網絡參數更新搞明白了反向傳播詳解

人工智能訓練營 ? 2276瀏覽 ? 0回復
從一個簡單的神經網絡模型開始

AI探索時代 ? 1935瀏覽 ? 0回復
再談什么是神經網絡，透過現象看本質

AI探索時代 ? 1893瀏覽 ? 0回復
怎么實現一個神經網絡？神經網絡的組成結構

AI探索時代 ? 2026瀏覽 ? 0回復
不同神經網絡之間的區別，僅僅只是網絡結構的不同，明白了這個你才能知道應該怎么學習神經網絡

AI探索時代 ? 2086瀏覽 ? 0回復
神經網絡的每一層都是干嘛的？這才是神經網絡結構的核心

AI探索時代 ? 2000瀏覽 ? 0回復
什么是神經網絡-循環神經網絡RNN各層詳解及實例展示

人工智能訓練營 ? 2440瀏覽 ? 0回復
高效學習神經網絡技術——以具體的任務類型為切入點

AI探索時代 ? 1549瀏覽 ? 0回復
什么是神經網絡：反向傳播如何更新網絡參數

人工智能訓練營 ? 1017瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：什么是神經網絡？神經網絡開發框架——PyTorch和架構Transformer的區別和聯系

下一篇：怎么學習設計和訓練一個大模型——也就是神經網絡？

社區精華內容

目錄

主站蜘蛛池模板：午夜免费福利电影 | 动漫www.被爆羞羞av44 | 国产一区二区三区高清 | 日本一区二区高清视频 | 亚洲午夜精品一区二区三区他趣 | 颜色网站在线观看 | 午夜三区| 日韩欧美国产精品一区 | 国产精品久久久久久久久 | 精精国产xxxx视频在线播放 | 午夜寂寞影院在线观看 | 91大神新作在线观看 | 91久久久久久久久久久久久 | 成人av播放 | 91视频免费观看 | 亚洲欧美激情精品一区二区 | 麻豆一区一区三区四区 | 美女黄网站视频免费 | 波多野结衣亚洲 | 欧美又大粗又爽又黄大片视频 | 91porn成人精品 | 欧洲一区二区三区 | 欧美日韩国产三级 | 国产免费一区二区 | 中文字幕第49页 | 夜夜操天天操 | 在线观看www高清视频 | 国产精品久久久久久久久久尿 | 成人福利影院 | 黑人巨大精品欧美一区二区免费 | 久草中文在线 | 久久综合影院 | 免费黄色网址视频 | 国产精品美女在线观看 | 91精品在线看 | 欧美一区二区三区 | www.久久| 自拍偷拍亚洲欧美 | 国产精品久久一区二区三区 | 精品国产第一区二区三区 | 日韩中文一区二区三区 |

<font id="16611"><meter id="16611"><span id="16611"></span></meter></font>

<mark id="16611"><ins id="16611"></ins></mark>

<span id="16611"><samp id="16611"></samp></span>

<blockquote id="16611"></blockquote>