又一個開源 AI Agent 殺到!II-Agent,號稱“全球最強”,擊敗 Genspark 和 Manus,跑分直逼人類
AI Agent 賽道又添一員猛將,一個叫 Intelligent Internet (II) 的團隊高調宣布,他們打造了 II-Agent,目標是“全球最強 Agent”,而且還要開源。
Stability AI 的前 CEO,Emad Mostaque,也為這個項目站臺。消息一出,社區直接炸鍋,高呼“LETS FREAKING GO”。
II 團隊的計劃簡單粗暴:
- 打造 II-Agent,可能是世界上最好的 Agent。
- 開源它。
- ...
- 大家一起獲利。
II 的使命是“提升人類的智能”。II-Agent 就是他們實現這個目標的關鍵一步,直接在 Agent 基準測試上名列前茅。
II-Agent 這玩意兒,聽起來挺牛:
- 性能強悍,還能擴展:設計之初就考慮了強大的能力,并且可以擴展,融合開源和閉源 AI 的優點。
- GAIA 跑分亮眼:在 Meta AI 推出的 GAIA 基準測試上,II-Agent 在可用模型中排名第一,拿到了75.57%的高分,離人類水平 (92%) 的差距正在縮小。
從放出來的圖看,II-Agent 的 75.57% 確實壓了 Genspark.ai (75.13%) 和 manus.ai (73.17%) 一頭,更別提 OpenAI DeepResearch (67.20%) 了。而且,他們的實現方法據說非常復雜,GAIA 的 Trace 數據也一并開源了。
- 通用 Agent 框架:雖然開箱即用就很能打,但 II-Agent 更被設計成一個易于適應和擴展的通用 Agent 框架。
- 未來是 Agent 群:II 團隊認為,未來是成群的 Agent 為我們所有人工作,II-Agent 只是他們構建的這個宏大系統的一部分。
他們在博客里詳細討論了 II-Agent,還附帶了 GAIA 測試分析和可復現性說明。所有結果都是“一次通過”的,他們相信通過更長的推理時間、更好的模型和迭代改進,與人類水平的差距會進一步縮小。
2025 年,是 Agent 之年。
II 團隊強調,對于那些真正重要的事情,Agent 必須是開放、透明和可用的。他們計劃為教育、健康等領域構建開源的 Agent、Agent 群和系統。
號召大家一起“共建智能未來”。
相關鏈接也一并放出:
- GitHub: ??https://github.com/Intelligent-Internet/ii-agent?? (MIT 許可證,相當寬松)
- GAIA 示例復現頁面: ??https://ii-agent-gaia.ii.inc??
- GAIA-Trace (Hugging Face)
LLM 越來越多地被稱為“AI Agent”,能幫你處理各種煩人的任務,比如報稅、保險、公務等等。這背后也引發了對 Agent 責任的討論,認為 Agent 應該被負責任地引導,保護生命,理解其珍貴。
本文轉載自???AI進修生???,作者:Aitrainee
