成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化

發(fā)布于 2025-6-23 07:28

瀏覽

0收藏

這兩天重讀了一篇很有趣的論文，《Effect of the initial configuration of weights on the training and function of artificial neural networks》（ https://arxiv.org/pdf/2012.02550 ）。它非常直白的展示了人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中的初始權(quán)重配置對(duì)網(wǎng)絡(luò)功能和性能的影響。

通俗來(lái)講，神經(jīng)網(wǎng)絡(luò)就像是一臺(tái)復(fù)雜的機(jī)器，它內(nèi)部有很多“開(kāi)關(guān)”（也就是權(quán)重），這些開(kāi)關(guān)從一開(kāi)始就有隨機(jī)的初始設(shè)置。在訓(xùn)練過(guò)程中，這些開(kāi)關(guān)的設(shè)置會(huì)一點(diǎn)一點(diǎn)調(diào)整，目標(biāo)是讓網(wǎng)絡(luò)最終能夠給出盡量準(zhǔn)確的輸出。

作者通過(guò)分析發(fā)現(xiàn)，在使用常見(jiàn)的訓(xùn)練方法（SGD/AdamW等）時(shí)，網(wǎng)絡(luò)的最終狀態(tài)通常不會(huì)離初始設(shè)置太遠(yuǎn)。這就好比網(wǎng)絡(luò)的學(xué)習(xí)是在“微調(diào)”初始狀態(tài)，而不是完全重置或重新安排所有開(kāi)關(guān)。

訓(xùn)練算法通常不需要走到離初始設(shè)置太遠(yuǎn)的地方，在初始設(shè)置的周?chē)湍苷业嚼硐氲慕狻?/p>

受論文思路的啟發(fā)，我做了一個(gè)實(shí)驗(yàn)，來(lái)觀察上述現(xiàn)象。( 詳細(xì)完整的代碼在 https://github.com/zhangfaen/effect-of-the-initial-configuration-of-weights )。

我們定義一個(gè)簡(jiǎn)單的多層神經(jīng)網(wǎng)絡(luò)。

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

其中nn.Linear(128, 128)這個(gè)參數(shù)矩陣，是隨機(jī)初始化的。我們制作一個(gè)分辨率圖片是128*128的圖片，圖片中我們故意放了一個(gè)水?。ā爸小保┳帧?/p>

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

圖1

然后，我們把這個(gè)圖片疊加到nn.Linear(128, 128)這個(gè)參數(shù)矩陣中。

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

我們把這個(gè)參數(shù)矩陣當(dāng)一個(gè)圖片看的話，會(huì)是這個(gè)樣子：

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

圖2

然后，我們用著名的手寫(xiě)字符識(shí)別數(shù)據(jù)集來(lái)訓(xùn)練這個(gè)模型。

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

訓(xùn)練完成后，我們?cè)儆脠D片的方式看一下nn.Linear(128, 128)這個(gè)參數(shù)矩陣，如圖3。

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

圖3

可以看到，模型從最初的8.92%準(zhǔn)確率（就是隨機(jī)猜的準(zhǔn)確率），到95.77%的準(zhǔn)確率，nn.Linear(128, 128)這個(gè)參數(shù)矩陣居然沒(méi)有什么大的變化（看圖2 和圖3）。

下面的圖中第1行，10個(gè)“中”字，表示訓(xùn)練過(guò)程10個(gè)epoch中，這個(gè)nn.Linear(128, 128)這個(gè)參數(shù)矩陣的整體數(shù)值如何在變（其實(shí)沒(méi)怎么變）

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

所以，一個(gè)深度神經(jīng)網(wǎng)絡(luò)模型，初始參數(shù)配置不管怎樣，從“白癡”訓(xùn)練到“專家”水平，其實(shí)其內(nèi)部參數(shù)并沒(méi)有太大的變化。是不是有點(diǎn) “朽木皆可雕也” 或者 “開(kāi)局一把牌，怎么都能打”的意思？

再感受一下論文中的圖和一個(gè)論述，啟發(fā)且有趣

開(kāi)局一把牌，怎么都能打 | 神經(jīng)網(wǎng)絡(luò)從“白癡”訓(xùn)練到“專家”水平，其參數(shù)并沒(méi)有太大的變化-AI.x社區(qū)

本文轉(zhuǎn)載自??后向傳播??，作者：張發(fā)恩

標(biāo)簽

神經(jīng)網(wǎng)絡(luò)

已于2025-6-23 10:35:52修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

ICLR 2024 Oral｜用巧妙的「?jìng)魉汀辜记?，?em>神經(jīng)網(wǎng)絡(luò)的訓(xùn)練更加高效

輕薄滴假象 ? 2540瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)的通用訓(xùn)練流程

AI探索時(shí)代 ? 2929瀏覽 ? 0回復(fù)
你知道神經(jīng)網(wǎng)絡(luò)是怎么運(yùn)作的嗎？神經(jīng)網(wǎng)絡(luò)內(nèi)部原理解析

AI探索時(shí)代 ? 2753瀏覽 ? 0回復(fù)
手把手從零構(gòu)建神經(jīng)網(wǎng)絡(luò)

Syrupup ? 2360瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)—終于把梯度下降搞明白了！

人工智能訓(xùn)練營(yíng) ? 2325瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了！

人工智能訓(xùn)練營(yíng) ? 2039瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)框架——PyTorch和架構(gòu)Transformer的區(qū)別和聯(lián)系

AI探索時(shí)代 ? 2992瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)是怎么學(xué)習(xí)的？

AI探索時(shí)代 ? 2021瀏覽 ? 0回復(fù)
怎么學(xué)習(xí)設(shè)計(jì)和訓(xùn)練一個(gè)大模型——也就是神經(jīng)網(wǎng)絡(luò)？

AI探索時(shí)代 ? 1984瀏覽 ? 0回復(fù)
關(guān)于神經(jīng)網(wǎng)絡(luò)的輸入格式——數(shù)據(jù)集的處理，關(guān)于神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)說(shuō)明

AI探索時(shí)代 ? 2341瀏覽 ? 0回復(fù)
關(guān)于神經(jīng)網(wǎng)絡(luò)的一些思考與感受

AI探索時(shí)代 ? 1937瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了反向傳播詳解

人工智能訓(xùn)練營(yíng) ? 2286瀏覽 ? 0回復(fù)
從一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)模型開(kāi)始

AI探索時(shí)代 ? 1943瀏覽 ? 0回復(fù)
再談什么是神經(jīng)網(wǎng)絡(luò)，透過(guò)現(xiàn)象看本質(zhì)

AI探索時(shí)代 ? 1910瀏覽 ? 0回復(fù)
怎么實(shí)現(xiàn)一個(gè)神經(jīng)網(wǎng)絡(luò)？神經(jīng)網(wǎng)絡(luò)的組成結(jié)構(gòu)

AI探索時(shí)代 ? 2085瀏覽 ? 0回復(fù)
不同神經(jīng)網(wǎng)絡(luò)之間的區(qū)別，僅僅只是網(wǎng)絡(luò)結(jié)構(gòu)的不同，明白了這個(gè)你才能知道應(yīng)該怎么學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

AI探索時(shí)代 ? 2142瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)的每一層都是干嘛的？這才是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的核心

AI探索時(shí)代 ? 2053瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-循環(huán)神經(jīng)網(wǎng)絡(luò)RNN各層詳解及實(shí)例展示

人工智能訓(xùn)練營(yíng) ? 2514瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)：反向傳播如何更新網(wǎng)絡(luò)參數(shù)

人工智能訓(xùn)練營(yíng) ? 1026瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

聊聊背后的技術(shù) | AI+生物 | 突破進(jìn)展，世界上首次開(kāi)發(fā)出“為一人定制”的CRISPR基因編輯體內(nèi)治療藥物 2025-06-10 06:59:33發(fā)布
好馬配好鞍，好模配指南 | Claude 4發(fā)布了，業(yè)界反響很好，其行為指南“系統(tǒng)提示詞”也被全文公開(kāi) 2025-05-28 06:22:20發(fā)布

熱門(mén)推薦

AI Agents開(kāi)源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開(kāi)源，與o3 相當(dāng)，實(shí)測(cè)來(lái)了 0回復(fù)

上一篇：聊聊背后的技術(shù) | AI+生物 | 突破進(jìn)展，世界上首次開(kāi)發(fā)出“為一人定制”的CRISPR基因編輯體內(nèi)治療藥物

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：日韩av在线一区 | 欧美a级成人淫片免费看 | 欧美精产国品一二三区 | 黑人粗黑大躁护士 | 黄色一级大片在线免费看产 | 欧美极品在线视频 | 四虎影院免费在线 | 91免费观看在线 | 久久不射电影网 | 国产欧美日韩精品一区 | 亚洲精品www | 综合久久综合久久 | 成人欧美一区二区三区黑人孕妇 | 精品国产精品国产偷麻豆 | 中文字幕免费在线 | 久久久久国产一区二区三区四区 | 欧美日韩一区在线观看 | 国产欧美日韩一区 | 九九九久久国产免费 | 亚洲精品视频一区 | 久久69精品久久久久久久电影好 | 午夜影院在线播放 | 日本三级电影在线免费观看 | 鸡毛片 | 一区二区三区四区在线视频 | 成人超碰在线 | 狠狠色香婷婷久久亚洲精品 | 亚洲一区二区三区在线播放 | 中文日本在线 | 日韩欧美中文 | 视频第一区 | 久草青青 | 国产小网站 | 视频二区在线观看 | 精品久久久久久久人人人人传媒 | 国产乱码精品一区二区三区忘忧草 | 97色在线观看免费视频 | 日本精品一区二区三区在线观看视频 | 欧美一级久久 | 国产精品日韩欧美一区二区三区 | 密室大逃脱第六季大神版在线观看 |