成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Open LLM集中爆發的一周,卷瘋了!

發布于 2024-9-9 00:00
瀏覽
0收藏

開源大模型領域熱鬧非凡的一周,各種開源,PaperAgent進行了概括:端側、Code、RAG、Agent、Reflection(反思糾正)、MoE,你關注的都在這里了。

Reflection Llama-3.1-70B 開源

Reflection Llama-3.1 70B是世界上頂尖的Open LLM,通過反思微調技術(Reflection-Tuning)訓練,能夠檢測并糾正推理錯誤,具有很高的熱度,Hugging Face熱門排行Top1。

Agent中需要LLM具有很強的推理規劃能力,這種反思技術訓練的模型是否很契合Agent尼?有待進一步驗證

Open LLM集中爆發的一周,卷瘋了!-AI.x社區

  1. 該模型使用Glaive生成的合成數據進行訓練,Glaive是一個強大的模型訓練工具。
  2. 模型可以通過特定的代碼和管道進行采樣,使用與標準Llama3.1相同的聊天模板格式。
  3. 采樣時,模型會先在<thinking>標簽內輸出推理過程,然后使用<reflection>標簽修正錯誤,最后在<output>標簽內提供最終答案。
  4. 這種設計使得模型能夠區分內部思考和最終答案,提升用戶體驗。

從實驗對結果看,是擊敗GPT-4o、Claude 3.5 Sonnet,遙遙領先的,更強405B版本預計下周推出,非常期待


Open LLM集中爆發的一周,卷瘋了!-AI.x社區

https://hf-mirror.com/mattshumer/Reflection-Llama-3.1-70B

面壁小鋼炮MiniCPM 3.0開源

面壁智能開源新一代全面開掛的小鋼炮,4B規模達到ChatGPT級能力:

  • 長文本方向:無限長文本,榜單性能超Kimi,超長文本也不崩。
  • Function Calling方向:性能比肩GPT-4o ,端側最強,超越 GLM-4-9B-Chat、Qwen2-7B-Instruct。
  • RAG 方向:超強 RAG 外掛三件套,基于 MiniCPM 系列模型的MiniCPM-Embedding、MiniCPM-Reranker在中文、中英跨語言檢索測試中取得 SOTA 表現;針對 RAG 場景的 MiniCPM3-RAG-LoRA 在開放域問答等多項任務上超越 Llama3-8B、Baichuan2-13B 等模型。

Open LLM集中爆發的一周,卷瘋了!-AI.x社區

https://github.com/OpenBMB/MiniCPM
https://huggingface.co/openbmb/MiniCPM3-4B

零一萬物Yi-Coder系列模型開源

Yi-Coder 有兩種規模——15億和90億參數——提供基礎版和聊天版,旨在實現高效的推理和靈活的訓練。值得注意的是,Yi-Coder-9B 在 Yi-9B 的基礎上,額外增加了2.4萬億高質量的標記,這些標記精心挑選自 GitHub 上的代碼庫級別的代碼語料庫,以及從 CommonCrawl 篩選出的與代碼相關的數據。

Open LLM集中爆發的一周,卷瘋了!-AI.x社區

Yi-Coder 的關鍵特性包括:

  • 在52種主要編程語言上的2.4萬億高質量標記上繼續預訓練。
  • 長上下文建模:最大上下文窗口為128K標記,能夠實現項目級別的代碼理解和生成。
  • 小巧但強大:Yi-Coder-9B 在性能上超越了其他參數少于100億的模型,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至達到了與 DeepSeek-Coder 33B 相當的性能水平。

https://hf-mirror.com/01-ai/Yi-Coder-9B-Chat
https://hf-mirror.com/01-ai/Yi-Coder-1.5B-Chat
https://01-ai.github.io/blog.html?post=en/2024-09-05-A-Small-but-Mighty-LLM-for-Code.md

DeepSeek-V2.5版本發布

DeepSeek-V2.5 是一個升級版本,它結合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct。這個新模型整合了前兩個版本的通用和編碼能力。

Open LLM集中爆發的一周,卷瘋了!-AI.x社區


DeepSeek-V2.5 更好地符合人類的偏好,并在多個方面進行了優化,包括寫作和指令遵循:

Open LLM集中爆發的一周,卷瘋了!-AI.x社區

https://hf-mirror.com/deepseek-ai/DeepSeek-V2.5

首個完全開源MoE大模型:OLMoE

OLMoE-1B-7B 是一個具有10億活躍參數和70億總參數的專家混合(Mixture-of-Experts)大型語言模型(LLM),于2024年9月(0924)發布。它在成本相似(10億)的模型中提供了最先進的性能,并且與像 Llama2-13B 這樣的更大模型具有競爭力。OLMoE 是100%開源的

開放 MoE 和密集型語言模型(LMs)的性能、成本和開放程度

Open LLM集中爆發的一周,卷瘋了!-AI.x社區

checkpoints: https://huggingface.co/allenai/OLMoE-1B-7B-0924
paper: https://arxiv.org/pdf/2409.02060
code:https://github.com/allenai/OLMoE
data:https://huggingface.co/datasets/allenai/OLMoE-mix-0924
logs:https://wandb.ai/ai2-llm/olmoe/reports/OLMoE-1B-7B-0924--Vmlldzo4OTcyMjU3

本文轉載自?? PaperAgent??,作者: PaperAgent

已于2024-9-11 14:07:15修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: www.亚洲区 | 日韩欧美视频网站 | 亚洲电影在线播放 | 涩涩操| 五月综合久久 | 亚州中文字幕 | 国产成人精品999在线观看 | 日韩免费网站 | 五月婷婷色| 免费在线成人 | 亚洲视频免费一区 | 韩国理论电影在线 | 99re热精品视频 | 亚洲日本欧美日韩高观看 | 人和拘一级毛片c | 午夜天堂精品久久久久 | 亚洲激情av | 亚洲视频免费观看 | 亚洲免费一区 | 亚洲自拍一区在线观看 | 欧美日韩精品综合 | 国产精品二区三区 | 成人精品鲁一区一区二区 | 中文字幕精品一区二区三区精品 | 99精品国产一区二区三区 | 成人av鲁丝片一区二区小说 | 午夜精品久久久久久 | 可以免费观看的av | 午夜影晥 | 高清久久久 | 国产精品久久久久久久久久软件 | 久久三级av | 伊人成人免费视频 | 国产激情91久久精品导航 | 一级欧美黄色片 | 精品九九在线 | 久久久久国产一区二区三区四区 | 国产a区 | 久艹网站 | 91在线综合| 色久在线 |