成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<abbr id="iuc8o"></abbr>
<bdo id="iuc8o"><th id="iuc8o"></th></bdo>

<abbr id="iuc8o"></abbr>

<strike id="iuc8o"><tbody id="iuc8o"></tbody></strike>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3

發布于 2024-5-11 09:42

瀏覽

0收藏

DeepMind新發布的AlphaFold 3是科技圈今天的絕對大熱門，成為了Hacker News等許多科技媒體的頭版頭條。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

Hacker News熱榜上緊隨其后的則是今年2月發布的論文「一致性大語言模型」。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

到底是什么樣的成果，竟然可以頂著AlphaFold 3的熱度出圈？

這篇論文不僅切中了大語言模型推理速度慢的痛點，而且實現了性能大幅度提升。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

CLLM在多個下游任務上都取得了2-3倍的加速，且推理過程沒有引入額外成本。在GSM8K和Spider兩個任務中，相比今年1月剛發布的Medusa 2都有了明顯提升。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

論文的兩位共同一作都是一年級博士生，分別是來自上海交通大學的寇思麒和來自加州大學圣地亞哥分校的胡嵐翔，他們的指導老師是交大的鄧志杰教授和UCSD的張昊教授，后者也是Vicuna/vLLM/Chatbot Arena等項目的作者。

目前這篇論文已經被ICML 2024會議接收，所用代碼已在GitHub上開源，可以在HuggingFace倉庫上看到模型多個版本的權重。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

??https://huggingface.co/cllm??

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

??https://github.com/hao-ai-lab/Consistency_LLM??

LLM苦推理速度久矣

以GPT和Llama家族為代表的大語言模型雖然可以出色地完成人類語言任務，但代價也是巨大的。

除了參數量大，推理速度慢、token吞吐量低也是經常被人詬病的問題，尤其是對于上下文信息較多的任務，因此大語言模型的部署和在現實中的應用十分受限。

Reddit上經常有開發者詢問減少LLM推理時間的方法，有人曾經發帖，在64G GPU內存、4塊英偉達T4芯片上用langchain部署7B的Llama 2模型后，需要10秒鐘回答較小的查詢，較大的查詢則需要3分鐘。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

為了提高推理速度和token吞吐量，研究者們想了很多方法，比如去年很流行的vLLM推理框架，就是通過改進注意力算法來提高語言模型的效率。

CLLM的思路則放在了解碼上，使用更適合并行的Jacobi算法替代傳統的自回歸方法。

Jacobi解碼算法

自回歸解碼算法在運行時，每次只能基于已知序列生成1個token，這種基于時間序列的算法對GPT之類的大模型非常不友好，要想實現并行化的推理，就必須修改模型架構或者添加額外的構件。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

這篇研究則提出，使用Jacobi解碼算法取代傳統的自回歸，每一次解碼可以同時生成序列后n個token。

Jacobi解碼源自用于求解非線性方程的Jacobi和Gauss-Seidel定點迭代，并被證明與使用貪婪解碼的自回歸生成相同。

給定一個初始序列時，首先生成n個隨機token作為起始點，之后將這n個token的優化問題看作n個非線性方程組，里面含有的n個變量可以基于Jacobi迭代并行求解。

每一次Jacobi迭代可以預測出一個或多個正確的token，進行多輪迭代直至收斂，就完成了n個token的預測，迭代的過程形成Jacobi軌跡。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

本篇文章所用Jacobi算法的靈感追溯至2021年的一篇論文，用求解非線性方程組加速神經網絡計算。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

論文地址：https://arxiv.org/pdf/2002.03629

以及張昊組的另一篇論文lookahead decoding：

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

論文地址：https://arxiv.org/pdf/2402.02057

一致性語言模型

使用Jacobi算法解碼時，大語言模型的推理過程可以被歸納為——一致地將雅可比軌跡 ?? 上的任何點 ?? 映射到固定點 ??? ，而這個訓練目標和一致性模型非常相似。

「一致性模型」最初由ICML 2023的一篇論文提出，作者是四位大名鼎鼎的OpenAI研究科學家：Ilya Sutskever、宋飏、Mark Chen以及DALLE3的作者之一Prafulla Dhariwal。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

論文地址：https://arxiv.org/pdf/2303.01469

因此，這項研究提出在目標語言模型的基礎上，聯合兩種損失函數來調整CLLM——一致性損失（consistency loss）保證同時預測多個token，自回歸損失防止CLLM偏離目標語言模型，保證生成質量的同時提升效率。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

實驗結果也比較理想，CLLM方法確實可以在接近目標模型生成效果的同時，大幅加快生成速度，從原有的約40 token/s提升至超過120 token/s。

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3-AI.x社區

除了推理性能的提升，這種解碼方法也在更抽象的層次上提升了LLM的能力。

由于不再是逐個生成token而是同時預測序列后面的n個token，CLLM似乎理解了一個重要的語言概念——詞語搭配。

它會更頻繁地生成固定的詞組和術語，比如「與...交談」，或者編程語言中「if...else...」這樣的常用語法結構，這似乎也更符合人類使用語言的習慣。

本文轉自新智元，作者：新智元

原文鏈接:??https://mp.weixin.qq.com/s/jOmh6g8X67WjXL0iLitD9Q??

標簽

贊

收藏

回復

舉報

回復

相關推薦

揭秘大語言模型的判斷一致性挑戰

zhangyannni ? 5561瀏覽 ? 0回復
生成一個好故事！StoryDiffusion:一致自注意力和語義運動預測器必不可少（南開&字節）

angel ? 3649瀏覽 ? 0回復
自我一致性提升大模型中的思維鏈推理能力

AIRoobt ? 5849瀏覽 ? 0回復
人工智能的一致性推理悖論

xuxiangda ? 3529瀏覽 ? 0回復
多智能體大模型協作中的角色不一致性：一致性、虛構性和模仿性

xuxiangda ? 3495瀏覽 ? 0回復
小紅書開源StoryMaker：個性化圖像生成模型，實現角色一致性與背景變化的完美結合

angel ? 7241瀏覽 ? 0回復
復旦&智象開源CAT-Diffusion，語義視覺雙一致

angel ? 2493瀏覽 ? 0回復
人工智能與人類情感的交匯點：一致性評估方法的探索

xuxiangda ? 6239瀏覽 ? 0回復
首次超越擴散模型和非自回歸Transformer模型！字節開源RAR：自回歸生成最新SOTA！

angel ? 2536瀏覽 ? 0回復
中科大重磅開源StableV2V：專注于「人機交互一致性」的視頻編輯方法

angel ? 2931瀏覽 ? 0回復
字節&上交&北大開源StoryTeller：生成一致性高的長視頻描述

angel ? 2780瀏覽 ? 0回復
即插即用，無縫集成各種模型，港科大&螞蟻等發布Edicho：圖像編輯一致性最新成果！

angel ? 2541瀏覽 ? 0回復
賈佳亞團隊新作MagicMirror：生成身份一致且高質量個性化視頻，效果驚艷！

angel ? 2858瀏覽 ? 0回復
艾倫圖靈研究所最新成果：多智能體博弈中的可糾正性和一致性

xuxiangda ? 3390瀏覽 ? 0回復
LMEDR對話模型：引入自然語言推理數據提升對話模型的連貫性和一致性

arnoldzhw ? 2215瀏覽 ? 0回復
多模態MLLM都是怎么實現的—如何保持text2video的連續一致性

熵減AI ? 1142瀏覽 ? 0回復
字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景

AIGCStudio ? 909瀏覽 ? 0回復
給 Cursor 也裝上 Memory Bank，節省包月請求，提高代碼一致性

凝固的雨_1 ? 1233瀏覽 ? 0回復
清華GenWorld：用“物理一致性”讓虛假視頻無處遁形！

zhangyannni ? 839瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

DeepSeek第五天開源猛料，3FS并行文件系統榨干SSD！6.6 TiB/s吞吐量堪比光速 2025-02-28 12:53:18發布
剛剛，DeepSeek開源DeepEP通信庫，千億MoE訓推顛覆級創新！FP8狂飆，帶飛GPU 2025-02-25 12:24:42發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： AI終結外語學習？未來人類只有母語一種語言

下一篇：開腦100天，馬斯克首位腦機接口患者出故障？癱瘓8年小哥術后并發癥惹質疑

社區精華內容

目錄

主站蜘蛛池模板：国产精品一区二区精品 | 天天爽网站| 欧美操操操 | 91福利影院| 久久精品国产一区二区三区不卡 | 91麻豆精品国产91久久久更新资源速度超快 | 黄色毛片在线看 | 欧美精品91爱爱 | 精品久久久久久久久久久 | 亚洲欧美视频在线观看 | 天天综合久久网 | 成人一区在线观看 | 免费欧美视频 | 欧美亚洲一区二区三区 | 中文字幕一区二区三区日韩精品 | 欧美激情精品久久久久久 | 91精品麻豆日日躁夜夜躁 | 免费高清av | 情侣酒店偷拍一区二区在线播放 | 久久综合激情 | 黄视频国产| 欧美性生活一区二区三区 | 国产成人一区二区 | 欧美三级三级三级爽爽爽 | 在线观看国产视频 | 日韩在线免费播放 | 成人精品国产一区二区4080 | 日韩精品一区二区三区免费视频 | 最新国产视频 | 男女羞羞视频大全 | 日韩av在线一区二区三区 | 午夜精品久久久久久久99黑人 | 亚洲天天干 | 国产欧美综合在线 | 亚洲精品免费在线 | 日韩视频一区二区三区 | 免费视频 1级 | 国产免费一区二区三区 | 欧美在线a | 欧美精品99 | 成人免费一区二区三区视频网站 |

<abbr id="mu8o0"></abbr>

<bdo id="mu8o0"><object id="mu8o0"></object></bdo>

<abbr id="mu8o0"><rt id="mu8o0"></rt></abbr>

<bdo id="mu8o0"><th id="mu8o0"></th></bdo>