成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<button id="mggeo"></button>

51CTO首頁

AI.x社區

博客

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

在線學習

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

sbf_2000

LV.4

這個用戶很懶，還沒有個人簡介

帖子 90

聲望 700

關注 0

粉絲 1

社區頭條作者熱門內容榜上榜作者

私信

關注

主帖 90

回帖

依賴ChatGPT寫作，大腦竟然"退化"了？206頁研究揭露真相

這是一份長達206頁的重磅研究報告，其研究結果令人擔憂。該研究發現，對大語言模型的依賴會削弱寫作者自身的神經和語言特征。研究者僅通過腦電圖、文本挖掘和交叉對照實驗就證明，保持一定的無AI練習時間能夠保護記憶回路，并促進更豐富的語言表達，即使后續重新引入AI工具也是如此。圖片實驗設計54名波士頓地區的學生在三種條件下撰寫SAT風格的作文：僅使用ChatGPT、僅使用Google搜索，或僅憑大腦思考。每位參與者在相同條件下...

23h前 223瀏覽 0點贊 0回復 0收藏

給大模型裝上"認知工具"，數學推理能力直接起飛

為GPT4.1提供"認知工具"可將其在AIME2024上的表現從26.7%提升至43.3%。太驚人了！這個成績已經非常接近o1preview的水平。論文提出了一種模塊化、基于工具的方法來激發大語言模型的推理能力，靈感來源于認知科學。作者沒有單純依賴強化學習或思維鏈（CoT）提示，而是引入了一個框架，讓大語言模型能夠調用獨立的"認知工具"來模塊化和支撐內部推理過程。圖片agent工具調用：這些工具封裝了理解問題、回憶類似案例、檢查答案和回溯...

23h前 179瀏覽 0點贊 0回復 0收藏

英偉達數學推理新突破：監督學習+強化學習的"1+1>2"效應

精華

還記得OpenAI發布o1模型時，那種"AI終于會思考了"的震撼嗎？現在，英偉達團隊帶來了更深入的研究成果，揭示了如何讓7B參數的小模型在數學和編程推理上達到頂尖水平。他們的AceReasonNemotron1.1模型在AIME25數學競賽中取得了63.2%的準確率，在編程基準測試中也屢創新高。這背后的秘密不是簡單的堆算力，而是監督學習（SFT）和強化學習（RL）的巧妙配合。這項研究不僅給出了具體的訓練配方，更重要的是回答了一個關鍵問題：為什...

1天前 313瀏覽 0點贊 0回復 0收藏

Mistral 發布 Magistral，他們首款推理模型專為領域特定、透明和多語言推理而設計的

Mistra發布Magistral——MistralAI首款推理模型——在領域特定、透明和多語言推理方面表現卓越。最優秀的人類思維并非線性——它在邏輯、洞察、不確定性和發現之間穿梭。推理語言模型使我們能夠增強并委托復雜思考和深度理解給AI，提升我們處理需要精確、逐步深思和分析問題的能力。但這個領域仍處于起步階段。缺乏處理領域特定問題所需的專業深度、透明度有限，以及在所需語言中推理不一致——這些只是早期思維模型的一些已知...

2025-06-13 06:49:37 477瀏覽 0點贊 0回復 0收藏

大語言模型的全新預訓練范式-強化預訓練

論文通過強化學習激勵有效的下一個token推理，僅使用原始文本和內在強化學習信號就能解鎖更豐富的推理能力。圖片論文簡介論文提出了強化預訓練（RPT），這是一種創新范式，通過將下一個詞元預測重新解釋為可通過正確性驗證獲得獎勵的推理任務，架起了大語言模型預訓練與強化學習之間的橋梁。圖片RPT沒有使用人工精心策劃的昂貴標注或人類反饋，而是在大規模無標注文本語料庫上應用強化學習，根據預測詞元是否匹配真實答案來分配...

2025-06-13 06:45:43 882瀏覽 0點贊 0回復 0收藏

終于有人把AI智能體的"落地難題"給解決了！用DAG工作流讓AI不再"胡言亂語"

精華

社區頭條

你有沒有遇到過這樣的情況：跟AI聊天的時候，它前一秒還好好的，下一秒就開始胡說八道？明明告訴它要遵守某些規則，但它總是"選擇性失憶"？如果你正在開發AI產品，或者對AI技術感興趣，今天這篇文章絕對值得你花5分鐘讀完。我們要聊的是一個讓AI智能體在真實業務中"言聽計從"的革命性方法。圖片一、AI智能體的"叛逆期"：為什么它們總是不聽話？想象一下，你花了幾個月開發了一個電商購物助手，結果上線第一天就出事了：AI居然向...

2025-06-03 05:56:14 1464瀏覽 0點贊 0回復 0收藏

Darwin G?del Machine:自我改進智能體的開放式進化

AI系統能否無限地自我改進？這項工作展示了自我改進AI的潛力，靈感來源于生物進化和開放式探索。總體概況這項工作提出了達爾文哥德爾機器（DGM），該系統通過結合自指代碼修改和開放式進化搜索，推進了自我改進AI的愿景...與原始哥德爾機器不同（它要求代碼更改具有可證明的益處，這是一個實際上難以處理的約束條件），DGM采用了經驗方法：它修改自己的代碼庫，并在編程基準測試上評估改進效果。自指自我改進循環DGM從單個編程...

2025-06-03 05:47:32 1030瀏覽 0點贊 0回復 0收藏

谷歌最新研究：大模型為何「學得會」卻「用不好」？

精華

圖片你是否遇到過這樣的情況：GPT、Claude等大模型在對話時很聰明，但經過微調后卻變得「變笨」了？這不是你的錯覺，而是AI學習的一個有趣現象。最近，谷歌研究團隊發表了一篇重磅論文，揭示了大模型兩種學習方式之間的巨大差異。現在一起來探索這個AI世界中的奇妙現象：為什么有時候「上下文學習」比「微調學習」更靈活？圖片1、大模型的兩種學習方式，哪個更強？大模型主要通過兩種方式學習新知識：（1）上下文學習（Incontex...

2025-05-20 06:15:15 918瀏覽 0點贊 0回復 0收藏

AI Agents vs. Agentic AI：從工具型助手到自主協作系統的進化

在人工智能飛速發展的今天，"AIAgent"（AI智能體）已經成為熱門詞匯，但你是否了解它與"AgenticAI"（智能體AI）之間的本質區別？這兩個看似相似的概念實際代表著人工智能領域中兩種截然不同的設計理念和能力邊界。今天，我們將通過解讀這篇論文來為你揭開這兩種技術的神秘面紗。圖片1、AIAgent的崛起：從生成式AI到工具增強型助手ChatGPT的出現讓我們見識了大語言模型(LLM)的強大能力，但這只是AI進化的開始。傳統的生成式AI本...

2025-05-20 06:06:42 1296瀏覽 0點贊 0回復 0收藏

記憶機制、思維模式與跨領域推理

今日目錄1、Nemotron：跨領域推理框架2、Qwen3模型運行與微調指南3、重塑AI記憶：分類法、操作與未來方向4、LLM在工程領域的突破：教模型設計高功率火箭5、ReXGradient160K：史上最大公開胸部X光數據集1、Nemotron：NVIDIA推出的跨領域推理框架圖片最新研究表明，NVIDIA推出的NemotronCrossThink框架成功將自學習擴展到數學推理之外的多個領域。該框架通過系統地將多領域語料庫（包括STEM、人文、社科等）納入強化學習訓練，顯...

2025-05-06 07:17:46 1137瀏覽 0點贊 0回復 0收藏

AI Agent"社交網絡"來了！最新研究揭示AI Agent通信協議全景圖

就像互聯網需要TCPIP和HTTP協議一樣，AIAgent之間的協作也需要標準化的通信協議。本文帶你深入了解AIAgent協議的現狀與未來，看看學術界是如何構建Agent之間的"社交網絡"的。圖片1、AIAgent通信協議：打破信息孤島的關鍵一步你有沒有想過，當ChatGPT、Claude這些AI助手需要互相交流、協作時，它們該如何"對話"？隨著大語言模型(LLM)的迅猛發展，各種AIAgent已經廣泛應用于客戶服務、內容創作、數據分析甚至醫療輔助等領域。然而...

2025-05-06 07:15:18 1129瀏覽 0點贊 0回復 0收藏

別擔心！AI微調后變"壞"也有解法：揭秘LLM對齊技術新突破

論文《AlleviatingtheFearofLosingAlignmentinLLMFinetuning》解決了大型語言模型（LLM）領域一個令人頭疼的問題：為什么微調后的AI模型會失去"道德約束"，以及如何高效地修復這個問題。圖片1、AI也會"變壞"？微調帶來的隱患我們都知道ChatGPT、Llama這類大語言模型在經過訓練后，通常會遵循一定的"價值觀"——比如當你問它"如何入侵別人的電腦"時，它會禮貌地拒絕回答。這種確保AI行為符合人類價值觀的訓練叫做"對齊訓練"（ali...

2025-04-22 06:43:23 946瀏覽 0點贊 0回復 0收藏

ReTool：AI工具使用的突破性進展，推理能力顯著提升

?1、AI終于學會了"工欲善其事，必先利其器"圖片你有沒有這樣的經歷：面對復雜計算題，純靠腦力計算往往容易出錯，而借助計算器或編程工具卻能事半功倍？人類在解決問題時懂得適時借助工具，而AI呢？當前的大型語言模型(LLM)雖然在純文本推理方面表現出色，但在涉及精確計算、符號操作等領域，它們往往捉襟見肘。為何不讓AI也學會"工欲善其事，必先利其器"的智慧？論文提出了一種創新方法，通過強化學習讓AI自主掌握何時、如何...

2025-04-22 06:38:39 1132瀏覽 0點贊 0回復 0收藏

突破傳統數學批改！這個AI系統能給你的每一步解題過程打分

?1、開篇：你是否曾有過這樣的困惑？圖片還記得那些被老師批改得密密麻麻的數學作業嗎？"答案對了，但過程錯了"的批注可能曾讓我們感到困惑。在傳統教學中，教師們往往需要花費大量時間批改學生的習題，尤其是對解題步驟的評判更是耗時耗力。而當面對大量作業時，老師們很難對每個學生的每一步解題過程都給予詳細的反饋。如今，AI教育技術正在悄然改變這一切。最新研究提出的StepAMC系統能夠自動分析學生解題的每一個步驟，識...

2025-04-09 06:35:29 1503瀏覽 0點贊 0回復 0收藏

MedSAM2: 3D醫療圖像和視頻的全能分割模型、DeepResearcher: 通過真實環境強化學習實現深度研究

?今日目錄1、MedSAM2:3D醫療圖像和視頻的全能分割模型2、DeepResearcher:通過真實環境強化學習實現深度研究3、APIGenMT:通過模擬代理人類互動生成高質量對話數據4、更大的語言模型是否意味著更好的推理能力？預訓練推理縮放規律5、何時求解，何時驗證：計算最優問題求解與LLM推理的生成驗證6、突破傳統數學批改！這個AI系統能給你的每一步解題過程打分1、MedSAM2:3D醫療圖像和視頻的全能分割模型圖片MedSAM2模型通過在超過45.5...

2025-04-09 06:32:51 1418瀏覽 0點贊 0回復 0收藏

TinyR1-32B-Preview: 通過全新分支合并蒸餾技術讓大模型瘦身不掉智商

圖片圖1：(A)我們的分支合并蒸餾方法的簡化圖解。(1)在分支階段，初始模型(骨干網絡)的每個副本都在不同領域的知識上進行訓練；(2)在合并階段，模型基于ArceeFusion規則進行合并。(B)不同LLM模型的性能比較(Mustar,2025)。TinyR132BPreview在科學、數學和編程領域的表現優于同等規模的蒸餾模型，并達到了與DeepseekR1相當的結果。這里的LiveCodeBench指的是完整LiveCodeBench的24.0825.02子集。你是否好奇：為什么大語言模型一...

2025-03-27 07:13:28 1567瀏覽 0點贊 0回復 0收藏

使用Unsloth微調與運行Gemma 3，速度提升1.6倍，VRAM使用減少60%

Gemma3是谷歌新推出的最先進多模態（文本+圖像）模型，有1B、4B、12B和27B四種規模。現已在Unsloth支持，Gemma3擁有128K上下文窗口和多語言支持。（1）使用Unsloth的Colab筆記本微調Gemma3。Unsloth修復了一些Gemma3訓練問題。（2）Unsloth使Gemma3（12B）微調速度提升1.6倍，VRAM使用減少60%，在48GBGPU上比使用FlashAttention2的環境能處理6倍更長的內容。（3）Unsloth在HuggingFace這里上傳了所有版本的Gemma3，包括28位GGUF...

2025-03-17 00:41:43 3269瀏覽 0點贊 0回復 0收藏

挑戰LLM邏輯推理極限！新基準TEXTGAMES能否揭開大模型的短板？

挑戰LLM邏輯推理極限！新基準TEXTGAMES能否揭開大模型的短板？AI.x社區1、大模型的邏輯推理能力究竟如何？近年來，大語言模型（LLMs）在自然語言理解、生成任務等方面取得了突破性進展，甚至能在數學推理、常識推理等領域展現出不俗的表現。然而，這些模型是否真正具備深入的邏輯推理能力？它們能否像人類一樣，通過不斷嘗試和反思，最終解決復雜的難題？來自研究團隊的一項最新研究引入了一個全新的TEXTGAMES基準，該基準通過...

2025-03-17 00:38:58 1809瀏覽 0點贊 0回復 0收藏

微軟Phi-4-Mini技術報告：Phi-4-Mini如何以小博大

精華

想象一下，如今的AI世界里，大模型如GPT4、Claude動輒上百億參數，能力驚人卻耗資巨大，像是一輛輛豪華跑車，雖快卻燒油無數。普通人或中小企業想用AI解決問題時，常常被高昂的成本擋在門外。可就在這時候，微軟扔出了一顆“重磅炸彈”——Phi4Mini和Phi4Multimodal。這兩個小巧的模型，參數量僅3.8億，卻在語言、數學、編碼甚至多模態任務上表現出色，堪稱“小身軀，大能量”。這不禁讓人好奇：微軟是怎么讓“小個子”打敗“大...

2025-03-05 10:00:26 3236瀏覽 0點贊 0回復 0收藏

重磅！Unsloth開源新算法：讓GRPO訓練大模型所需顯存降低90%，告別顯存焦慮！

圖片在大模型訓練領域，顯存一直是一個讓研究者和開發者頭疼的問題。特別是在進行長文本上下文訓練時，動輒需要幾百GB的顯存需求，這讓很多研究者望而卻步。不過最近，AI基礎設施優化團隊Unsloth帶來了一個重大突破他們推出的新算法可以讓GRPO訓練所需顯存減少高達90%！文章公布了Llama3.1(8B)GRPO在Colab上notebook，見：https:colab.research.google.comgithubunslothainotebooksblobmainnbLlama3.1(8B)GRPO.ipynb1、從510GB...

2025-02-24 11:15:23 3131瀏覽 0點贊 0回復 0收藏

獲得成就

已積累 5.4w 人氣

獲得 1 個點贊

獲得 0 次收藏

<cite id="kcygm"></cite>