135 個項目、七大趨勢、三大賽道:撕開大模型開源生態真相,你會怎么卷?
在微軟 Build、谷歌 I/O、 Code with Claude 三大開發者大會接連登場的一周里,微軟為 Windows 加裝模型上下文協議(MCP),Google Gemini 野心初顯「AI 操作系統」,Claude 4.0 高調搶灘編程主戰場。
就在這樣的節奏下,5 月 27 日,螞蟻集團的開源團隊「接棒」發布了一張《 2025 大模型開源開發生態全景圖》。
訪問地址:
https://antoss-landscape.my.canva.site
完整項目列表和相關數據:
https://docs.google.com/spreadsheets/d/1av9kitgnRGtsmDp6AbW96m2cCR4jXZFQmUVG2di8Bjw/edit?gid=0#gid=0
這是一張由開源社區數據驅動的技術演進路線圖——
135 個社區核心項目、19 個技術領域,全面覆蓋從智能體應用到模型基建,系統性梳理了開源力量在大模型浪潮下的集結與演化路徑。
其中,模型訓練框架、高效推理引擎、低代碼應用開發框架成為當前最具主導力的三條技術賽道。
135個項目中位于2025 年 OpenRank 排名Top 20的項目。這里用到了華東師范大學X-lab實驗室OpenRank影響力評價指標。
結合前一張圖,將 OpenRank 指標與 2024 年數據對比,三大主導技術賽道的同比上升幅度尤為明顯。
「不要抗拒趨勢。」發布現場,螞蟻開源技術委員會副主席王旭談及全景圖的意義。
比起盲目對標,在一個飛速發展的領域,搞清楚哪些關鍵領域仍未涉足、哪些路線已經成了技術冗余,對于企業而言更具現實意義。
對于開發者、投資人,尤其是打算「自己干」的人來說,也是一份值得參考的路線圖:哪些項目正拾級而上?哪些賽道開始日落西山?關鍵從來不是起點有多高,而是是否踩準了那條上升通道。
一張快速變化領域的「撕拉片」
這張全景圖,像是一張為大模型開源生態拍下的「撕拉片」。在高速運動的行業面前,「咔嚓」定格了 135 個項目的最大「公約數」——
一場直播中的「現實世界的黑客松 (A Real-world Hackathon )」 。
與追求長線的傳統開源文化不同,這些項目大多靠熱點驅動,短期速成、技術聲譽兌現快;反之,隨著熱點不斷迭代,嚴重依賴熱點的項目「埋」得也快。
例如,對應的閉源項目爆火后,Devika、OpenDevin、OpenManus 們在短周期內密集登場并獲得極高關注度。
SGLang、vLLM 則代表另一種高頻脈動的開發形態——方向明確,剩下的全靠「中美網友 24 小時輪肝」完成;幾乎每周都有新版本,生態在極高密度的「卷」中快速升級。
有些項目發展不錯,有些項目成功為背后工具鏈引流,還有的發展為商業項目,如 GPT Engineer 早期積累了?量?戶的明星開源項?,后續發展為閉源的商業化產品 Lovable。
一些項目爆發力極強,一度擁有上萬 star 的關注度,但也面臨高淘汰率和低維護意愿的挑戰,最后被「埋」。
除了 swarm 是 OpenAI 官?宣布不再維護外,其余項?的上?次代碼提交還停留在 2024 年,實質性開發早已停滯。
如果就此止步,只看到爆款和淘汰,就難以理解為什么這些浪花會出現。推動「黑客松現象」上演的還有更為深層的「地質」動力——
模型能力帶來的應用重塑、生態位之間的動態博弈。
以 AI 搜索為例,開源項目集體式微,并非「做得不夠好」,而是 GPT-4、Gemini 們已經將聯網檢索、答案生成「內嵌進模型」,直接抹平了原有的工具價值。
AI Search 開源項目們的 OpenRank 趨勢,猶如日落西山
相反,AI Coding 類開源項目則一派繁榮,OpenRank 走勢「嘴角上揚」幾乎成標配。
這一輪熱潮的背后,是 Claude 3.7 Sonnet 等大模型在代碼生成與代碼理解能力上的集體飛躍,直接重構了「人機協作」方式。
AI Coding開源項目 OpenRank 趨勢,幾乎個個「嘴角上揚」,蒸蒸日上。
與此同時,生態位之間也在激烈博弈中,變化最劇烈當屬 Agent Framework 領域——
Dify、n8n、RAGFlow 等低代碼平臺工具漲幅顯著,高達 72.22%;而與此同時,LangChain、LlamaIndex、AutoGen 等曾經紅極一時的SDK范式整體下滑了 35.90%,跌幅居首。
這可能意味著一個轉向——
從服務開發者「寫代碼拼接智能體」,轉向更注重用戶的「可視化、可定制、業務級可落地」的平臺產品。
低代碼平臺躍升至最頂端,而 SDK 范式則集體「下滑到底」。
看見未來:七大趨勢浮出水面
除了生態全景掃描,通過追蹤 GitHub 上 135 個核心項目近兩年的活躍度、技術走向與社區反饋,報告也歸納出七條值得所有開發者、創業者關注的趨勢:
前三個聚焦智能體應用層,后四個圍繞模型基礎設施層
最具體感的趨勢都集中在了智能體應用,而且兩個都與 Manus 爆火有關。
2025年,Agent 框架熱潮褪去。從 2024 年下半年開始,LangChain 等早期 SDK 型框架的熱度開始「下臺階」式回落,新框架鮮有涌現,開發者重心悄然轉移。而到了 2025 年,Dify、RAGFlow 等低代碼工作流平臺因契合企業需求迅速崛起(也是從中國開發者社區中生長出來的強勢項目)。
Agent框架OpenRank排名前十的變化
如何理解新框架在 2025 年褪潮?在發布現場的圓桌討論中,幾位智能體框架圈的核心研發者表示——
與其說褪去,不如說 Agent 框架來到下半場。
過去兩年,「上半場」的主旋律是開發者工具:大模型剛嶄露頭角,各類框架如 LangChain、AutoGen、LlamaIndex 等紛紛涌現,爭相為開發者搭建「腳手架」。隨著 Agent 流程逐漸標準化,開發者不再需要五花八門的新框架,
恰在此時,Manus 的「一鍵即用」體驗爆火,讓業界意識到端到端的極致體驗可以為很多用戶接受。在「下半場」,Agent 框架更注重應用場景落地,幫助普通用戶完成更復雜任務。當然,解決真實場景的任務時需要強化學習,還面臨不少挑戰(如獎勵設計)。
預測同時指出,2025 年低代碼平臺強勢崛起,表明 Agent 框架的競爭從比拼技術范式,走向比拼「誰能更快成為企業的生產力工具」。那些技術節奏穩、商業理解深的開源平臺,正乘勢成為「 AI 新基建」的領跑者,Dify 就是代表之一。
除了框架圈,Manus 更撬動了「大廠覺醒」,連夜啟動配套建設,尤其是標準協議層。
MCP 一出,標準協議層正式登場,大廠幾乎傾巢而出——
有了它,直接盤活沉淀多年的「互聯網家業」,現在一鍵接入,就能組成一個能辦事、能協作的 Agent,觸達生活的每一個角落。
緊接著,Google 在 2025 年開源 A2A( Agent2Agent ) 協議,解決 Agent 之間互操作的問題;CopilotKit 又推出的 AG-UI 協議 進一步打通了智能體后端與前端用戶。
不過,發布現場的圓桌討論中,開發者們也指出 Agent 間的協作與傳統工具調用很不同——
它往往是一個持續十幾分鐘乃至更長的「長程任務」,在執行過程中需要頻繁與提供方交互。因此,協議不僅要能傳遞信息,更要支持任務狀態的維護、過程控制和動態交互能力。
而目前的 MCP 協議沒有涵蓋這些能力,A2A 解決的還是「連得上」的問題,「協作」仍是未解之題。這一領域仍有廣闊優化空間,也為開源社區留下了巨大的創新機會。
預測也指出,未來需要原生為大模型場景設計的新協議,而在這場技術升級中,開源生態將成為關鍵陣地。
誰能率先定義這些新協議,并將其與工具鏈(如 SDK、框架)打通,誰就有機會建立自己的技術閉環,搶占「模型即服務( MaaS )」時代的生態制高點。可以預見,未來一到兩年,標準協議層將迎來激烈的生態博弈期。
再來看 AI Coding。寫代碼是大模型與生俱來的優勢,AI 編程項目確實紅火,幾乎個個「嘴角上揚」。
根據項目的智能化程度(輔助還是完全替代?)以及目標受眾群體(專業人士還是普通用戶?)的專業化程度,將這些 GitHub 上熱門的 AI Coding 類開源項目劃分為四個象限。
國內百度、阿里、騰訊、螞蟻、字節等陸續推出 AI 代碼助手,率先跑馬圈地。AI Coding 也成為開源生態中少數幾個不依賴獨占數據、也不被私有場景鎖死的活躍賽道。連 OpenAI 都愿意為此砸下 30 億美元,收購 AI 開發工具 Windsurf,可見這條賽道含金量之高。
如今,AI 代碼助手已深度介入整個軟件開發流程:從需求理解、系統設計,到前后端開發、測試調試,再到上線與運維。有意思的是,真正「帶它上路」的,是程序員自己。但要說全面替代程序員?還遠得很。
目前的 AI 編程助手,大致處于「智能輔助駕駛」階段,能在特定任務上獨立作業,比如自動生成前端頁面、小程序骨架、測試腳本、代碼檢查等。
技術演進的關鍵瓶頸,預測明確指出有兩個:一是上下文感知能力( Context-Awareness ),二是領域知識融合( Domain Knowledge Integration )。在未來 24 個月里,AI 助手的「接單能力」會不斷增強,但在人機共創的長期范式中,關鍵決策權,仍牢牢掌握在人類程序員手中。
與應用層的「生死時速」不同,一旦「下沉」到基礎設施,趨勢變化更像是靜水深流。
ChatGPT 和其他大語言模型的爆火,一度把「潑天的富貴」砸向了向量數據庫,一時間風頭無兩。但熱潮也很快退去,發展趨勢逐漸趨于平穩。最近兩年,它們既沒被「拍死」,也沒卷出新高度,更多是以「相敬如賓」的姿態各自發展。
有關「向量數據庫是不是偽需求」,一直爭議不斷。從當前的穩定趨勢來看,它可能確實是一項真需求。
向量數據庫的每月 Star 增量變化
預測指出,技術「厚不厚」不是重點,關鍵是有沒有持續迭代的范式空間。對向量數據庫來說,短期看是穩定期,但中長期是否能迎來「第二曲線」,還要看 AI 生態新場景的開拓速度。
發布現場的圓桌討論中,Zilliz 合伙人、技術總監欒小凡還提到一個很有意思的點——
向量數據庫不僅是模型應用階段的「召回引擎」,也正在成為訓練流程中的「數據發現器」。
如在自動駕駛場景中,如果模型在「紅燈前突然竄出一只狗」這類邊緣案例中表現不佳,就需要通過數據回溯找到類似樣本,進一步強化訓練。但這類數據往往來自非結構化源,如網頁爬蟲、文本、視頻等,難以通過傳統標簽化方式精準搜集。
此時,向量數據庫的價值就體現出來了——
它能幫助我們高效從海量異構數據中,按語義相似性快速定位相關樣本,從而實現更精準的「問題驅動式數據提取」,支持面向真實任務場景的精細化訓練。
談到大模型訓練和推理,我立刻想到「源神」DeepSeek 的一段話:
我們非常感謝開源生態系統,沒有它,我們不可能在通用人工智能 (AGI) 方面取得進展。我們的訓練框架依賴于 PyTorch,我們的推理引擎基于 vLLM,這兩者都對加速 DeepSeek 模型的訓練和部署起到了重要作用。
要說 PyTorch,人人都承認它的領先,但沒想到它居然領先到了「一統江湖」的地步。
而一旦進入推理環節,很多開發者都關心一個問題:性能被拉到一個新高度,怎么提高模型的推理速度?2023 年以來,出現了一大波面向于模型部署和高效推理的大模型服務工具,在性能和生態上彼此追趕,混戰一直持續到今天。
眼下,vLLM 與 SGLang 已是當之無愧的「推理頂流」,社區影響力持續擴張。
從 Top 10 的模型服務項目的排名變化上來看,仍有新的項目不斷冒出來,并吸引開發者參與到其中去。例如去年 7 月清華推出的 KTransformers 和今年 3 月 NVIDIA 推出的 Dynamo。
幾大模型服務項目的 OpenRank 曲線變化
2023 年 6 月,vLLM 首次發布,被視為大語言模型推理的分水嶺:在不改動模型結構的前提下,它顯著壓縮顯存占用、提升并發能力,是首個對 LLM 推理進行系統級重構的開源引擎。2025年,vLLM 發布 v1,完成核心架構升級后重回增長通道,依舊是主流部署場景中的首選框架,并具備更強的商業集成度。
SGLang 屬于后者居上—— 2024 年 1 月發布,定位更貼近真實 Agent 應用場景,不僅具備更強的 GPU 并發調度能力,還支持多步推理優化。2025 年一季度,其 OpenRank 增長達 31%,遠超同期 vLLM 的 17%。
SGLang 也被用于重寫 Grok 2 推理技術棧,極大改善了產品體驗,甚至獲得馬斯克的公開點贊。
有個細節,「一招鮮」也有高光時刻。
2025 年 2 月,清華大學 KVCache.AI 團隊推出的 KTransformers 破解千億級大模型本地部署難題,4090 單卡實現 DeepSeek-R1 滿血運行。
該項目 OpenRank 飆升 34 倍,吸引 736 名開發者參與協作,GitHub Star 數突破 1 萬。看來在大模型時代,哪怕是底層細節的優化,也可能帶來「超級紅利」
最后,在多模態數據治理技術的演化上,湖倉「四足鼎立」, 為大模型所依賴的非結構化海量數據提供更強的存儲與管理能力。元數據治理也開始擁抱非結構化數據和 AI 資產管理。
不過,Data Infra 發展了二十年,發展得非常完善,有自己的方法論。而多模態原生數據 Infra 才剛剛開始,用新的方式再做一遍時,Data Infra 遭遇過的痛點可能會再度出現。
數據湖表格式項目 OpenRank 曲線變化
元數據治理項目 OpenRank 曲線變化
「撕拉片」的方法論
為什么要做這份報告?王旭回答很直接——
螞蟻的開源團隊其實不叫「開源辦公室」,而是「開源技術增長」,一個立足架構層的技術中樞,希望通過對開源社區的長期觀察,為螞蟻內部的技術路徑提供決策支持。
相比 Gartner 這樣的傳統商業分析,開源社區數據能更早、更真實反映技術的風向變化。
為構建這張「撕拉片」,團隊以 PyTorch、LangChain、vLLM 等 AI 明星項目為起點,層層擴展其技術上下游,并邀請行業專家討論,一步步收斂出百余個活躍度與影響力兼具的核心項目。
真正支撐判斷的,是 OpenRank——由華東師范大學 X-lab 開發的開源影響力指標。這次入選門檻是:2025 年 1 至 4 月的 OpenRank 月均值 ≥ 10。太舊、太新的項目都可能被篩掉。為了觀察趨勢,團隊重點對比了項目和賽道的 OpenRank 均值變化。
發布會上,王旭還透露報告將在下半年推出更新版本。屆時,低代碼平臺是否還能保持狂飆?協議層會否冒出新變量?AI Coding 是否還有驚喜?......
這場黑客松直播,還在繼續。