成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<mark id="whvkf"><form id="whvkf"></form></mark>

<button id="whvkf"><form id="whvkf"></form></button><button id="whvkf"></button>

<cite id="whvkf"></cite><ol id="whvkf"><dl id="whvkf"></dl></ol>

<code id="whvkf"><wbr id="whvkf"><td id="whvkf"></td></wbr></code>

<cite id="whvkf"></cite>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

DeepSeek 爆了，普通人如何3小時完全從0訓練自己的大模型原創

發布于 2025-2-11 10:24

瀏覽

0收藏

這個春節，DeepSeek 實在太火了，無須贅述。

今天要向大家推薦一個極具實用價值的開源項目——MiniMind。這個項目使得我們只需利用普通電腦，就能在短短3小時內打造出一個精簡版的 DeepSeek！

為了避免誤解，特別說明一下，“最快3小時”是基于你的硬件配置優于我本人的情況下。具體的硬件規格要求將在下文中詳細說明。

1、為什么這個項目這么特別？

市場上的大語言模型（LLM）通常擁有上百億參數，其訓練成本相當高昂。對于想要學習和研究的人來說，這樣的硬件要求往往成為一道難以逾越的障礙。然而，MiniMind 憑借其巧妙的設計，大幅縮減了模型參數，使得個人開發者也有能力自行訓練 AI 大模型！

MiniMind 的最小版本僅有 26MB（大約是 GPT-3的1/7000），這意味著即便是普通的游戲顯卡也能輕松駕馭。該項目提供了全面的訓練步驟：

第一、基礎語言能力訓練（預訓練階段）

第二、對話能力訓練（指令微調階段）

第三、快速適應新任務（LoRA 微調技術）

第四、優化回答質量（DPO 偏好對齊方法）

2、實際使用場景

場景一、定制化 AI 助手打造

您能夠培養出專注于特定領域的 AI 助手，例如：

客服機器人：基于企業產品知識庫進行訓練。
教育輔導機器人：專注于特定學科的習題解答和講解。
行業專家助手：為特定行業提供專業的咨詢服務。?

場景二、技術探索與學術研究

深入理解大型語言模型的工作機制。
實際操作不同的訓練技術。
探索模型的優化策略和改進方法。?

場景三、產品概念驗證

快速實現 AI 產品想法的原型開發。
在不同應用場景中測試產品的性能。
收集用戶反饋，以促進產品的持續迭代和優化。

3、技術架構亮點剖析

第一、精簡架構設計

基于 Transformer 的解碼器單結構（Decoder-Only）。
利用 RMSNorm 進行預標準化，以增強模型表現。
引入旋轉位置編碼技術，有效處理長篇文本。?

第二、創新性地推出專家混合模型版本（MoE）。

提供4個26MB的混合專家模型，以實現能力的提升。
在保持低計算資源消耗的同時，實現專家間的有效分工。?

第三、靈活多樣的部署選擇

支持在單卡或多卡上進行訓練。?
與主流深度學習框架無縫兼容。?
提供便捷的網頁交互界面。

4、定制自己的大模型上手有多簡單？

第一、克隆項目代碼

git clone https://github.com/jingyaogong/minimind.git
cd minimind

第二、環境安裝

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple


# 測試torch是否可用cuda
import torch
print(torch.cuda.is_available())

如果不可用，請自行去 torch_stable 下載 whl 文件安裝。參考鏈接如下：

??https://blog.csdn.net/weixin_45456738/article/details/141029610??

第三、環境配置

CPU: Intel(R) Core(TM) i9-10980XE CPU @ 3.00GHz
內存：128 GB
顯卡：NVIDIA GeForce RTX 3090(24GB) * 2
環境：python 3.9 + Torch 2.1.2 + DDP單機多卡訓練

Ubuntu == 20.04
Python == 3.9
Pytorch == 2.1.2
CUDA == 12.2
requirements.txt（本項目環境依賴）

第四、自己的訓練數據集

下載數據集放到??./dataset??目錄下
??python data_process.py?? 命令處理數據集，例如 pretrain 數據提前進行 token-encoder、sft 數據集抽離 qa 到 csv 文件
在??./model/LMConfig.py?? 中調整 model 的參數配置

這里僅需調整 dim 和 n_layers 和 use_moe 參數，分別是??(512+8)???或??(768+16)???，對應于??minimind-v1-small???和??minimind-v1??

??python 1-pretrain.py??? 執行預訓練，得到??pretrain_*.pth?? 作為預訓練的輸出權重
??python 3-full_sft.py??? 執行指令微調，得到??full_sft_*.pth?? 作為指令微調的輸出權重
??python 4-lora_sft.py?? 執行 lora 微調（非必須）
??python 5-dpo_train.py?? 執行 DPO 人類偏好強化學習對齊（非必須）

5、總結

MiniMind 項目正在快速發展，目前已支持：

文本對話：流暢的中英文交互
視覺理解：可以理解和描述圖像
知識更新：持續優化訓練數據
性能提升：不斷改進模型結構

MiniMind 降低了 AI 開發的門檻，讓更多人能夠參與到大語言模型的探索中來。無論你是：

想入門 AI 的開發者
需要定制化 AI 助手的企業
對語言模型感興趣的研究者

這個項目都能幫你快速起步，并在實踐中不斷成長。項目完全開源，想要了解更多 MiniMind 項目信息的讀者可以查看項目 Github 地址：

??https://github.c??om/jingyaogong/minimind

本文轉載自公眾號玄姐聊AGI 作者：玄姐

原文鏈接：??https://mp.weixin.qq.com/s/xbo5bEC6DgwJr0OhSFiOsA??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

已于2025-2-11 10:25:30修改

贊

收藏

回復

舉報

回復

相關推薦

OpenAI曾轉錄100萬小時視頻數據，訓練GPT-4

Aceryt ? 2473瀏覽 ? 0回復
0樣本視頻編輯模型，普通人秒變鋼鐵俠

Aceryt ? 2534瀏覽 ? 0回復
訓練大模型時，顯存都哪去了？

魚蟲子 ? 3273瀏覽 ? 0回復
DeepSeek的V3，爆火了

51CTO技術棧 ? 6869瀏覽 ? 0回復
Reyes：一個從0到1開始訓練的多模態大模型（技術報告）

大模型自然語言處理 ? 2396瀏覽 ? 0回復
機器學習|從0開始大模型之位置編碼

周末程序猿 ? 1984瀏覽 ? 0回復
機器學習|從0開始大模型之模型DPO訓練

周末程序猿 ? 2355瀏覽 ? 0回復
Unsloth：僅需7GB顯存就能訓練自己的DeepSeek-R1！

PyTorch研習社 ? 3881瀏覽 ? 0回復
機器學習 | 從0開發大模型之DeepSeek的GRPO

周末程序猿 ? 2401瀏覽 ? 0回復
DeepSeek爆火：普通人跨越AI提效終局的10倍進化指南

ermulong ? 2137瀏覽 ? 0回復
機器學習 | 從0開發大模型-譯llama3-from-scratch

周末程序猿 ? 2108瀏覽 ? 0回復
機器學習|從0開發大模型之復現DeepSeek的aha moment

周末程序猿 ? 2149瀏覽 ? 0回復
DeepSeek級AI？訓練自己的推理模型僅需七個步驟

51CTO內容精選 ? 2220瀏覽 ? 0回復
Manus：這個堪比 DeepSeek 的核彈，如何讓普通人也能指揮“數字員工”？

wsp_ping ? 2056瀏覽 ? 0回復
從0到1：AI如何“復制”明星，唱響奇妙旋律

InfonityAI智推星 ? 2691瀏覽 ? 0回復
我測試了智譜新發布的AI智能體：不僅會思考還會自己干活，用它15分鐘=人工2小時（附安裝教程）

Bx玩AI ? 1827瀏覽 ? 0回復
Deepseek新論文！如何讓AI自己學會更公平地打分？

石映飛云 ? 2001瀏覽 ? 0回復
RL訓練太慢？UC伯克利重磅開源FastTD3：并行+大批次+分布Critic，人形機器人3小時搞定

zhangyannni ? 1215瀏覽 ? 0回復
一場不喊“咔”的電影革命：三次AI進化讓每個普通人都能當「數字導演」

十一月雨_55 ? 2620瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

AI 智能體架構設計三階段演進和三大關鍵技術對比剖析 3天前發布
AI 大模型應用落地到底選用單智能體架構還是多智能體架構？ 7天前發布

熱門推薦

一文搞定 AI 智能體架構設計的九大核心技術 0回復

性能提升90%，Anthropic 首次公開多智能體架構構建全流程 0回復

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

上一篇：使用 DeepSeek 必備的十個技巧，建議收藏！

下一篇：帶你一文讀懂爆火的 DeepSeek-R1 新模型技術，為何震動了全球 AI 圈

社區精華內容

目錄

主站蜘蛛池模板：精品一区二区在线看 | 天天射夜夜操 | 久久无毛 | 日韩国产一区二区三区 | av午夜电影| 亚洲一卡二卡 | 国产精品二区三区在线观看 | 亚洲视频在线观看 | 欧美日韩一二三区 | 亚洲一区综合 | 久久亚洲一区 | 久草资源在线视频 | 久在线观看| 国产不卡一区 | 成人在线观看黄 | 国产精品久久久久久久 | 久久精品16 | 成人一区二区在线 | 特黄色一级毛片 | 欧美性区 | 日韩欧美精品在线 | 99久久亚洲| 亚洲毛片在线 | av网站免费 | 免费av一区二区三区 | 欧美在线成人影院 | 天天曰夜夜 | 久久成人国产精品 | 亚洲综合区 | 二区中文字幕 | 免费看国产片在线观看 | 亚州精品天堂中文字幕 | 免费在线观看成人 | 日韩欧美三区 | 欧美精品一区二区三区在线 | 国产丝袜一区二区三区免费视频 | 情侣黄网站免费看 | 999视频| 二区亚洲 | 精品国产一区二区三区观看不卡 | 国产欧美一区二区三区在线看 |

<button id="myeuo"><bdo id="myeuo"></bdo></button>

<u id="myeuo"></u>

<span id="myeuo"><samp id="myeuo"></samp></span>

<abbr id="myeuo"></abbr>

<button id="myeuo"></button>