看不懂GitHub代碼?剛剛這個AI工具讓全球每個GitHub項目開口說話
還記得那個號稱全球首位 AI 軟件工程師 Devin 嗎?它的創造者Cognition Labs公司剛剛推出了一個名為 DeepWiki 的項目。簡單來說,這是一個目標宏大的計劃:為全世界每一個 GitHub 代碼倉庫(Repo)提供可以實時交流、即時更新的文檔。
你可以把它想象成一個由 Devin 技術驅動的、專門針對 GitHub 的“深度研究”工具。
亮點:免費、免注冊、即刻可用
最關鍵的是,對于開源項目,這項服務完全免費,甚至無需注冊。
怎么用?非常簡單:
1. 訪問 deepwiki.com,探索已經收錄的熱門開源項目的 Wiki。
2. 或者,更直接的方式:把你正在瀏覽的任何 GitHub 倉庫 URL 中的 github.com
替換成 deepwiki.com
,即可無縫跳轉到該倉庫的 DeepWiki 頁面。
能做什么?
對話式文檔: 你可以直接向代碼庫“提問”,DeepWiki 會嘗試理解你的問題并給出文檔級的解答。
深度研究 (Deep Research): 對于復雜問題,可以開啟此功能,讓 AI Agent 進行更深入的分析和回答。
按需索引: 如果你關心的公開倉庫還沒被收錄,可以請求 DeepWiki 為你索引。
私有倉庫支持: 對于私有倉庫,可以通過注冊 Devin 賬戶(devin.ai)來獲得服務。
輕松分享: 生成的 Wiki 頁面和問答結果都可以通過鏈接分享,方便團隊成員保持信息同步。
投入與規模
Cognition Labs 為了 DeepWiki 可謂投入巨大:
? 已索引約 3 萬個 GitHub 倉庫
? 處理了超過 40 億行代碼
? 索引過程的計算成本就超過了 30 萬美元
? 總計處理了超過 1000 億個 Token
據稱,平均索引一個倉庫的成本約為 12 美元,但目前對所有開源項目完全免費開放。
技術探秘:理解全局結構與提交歷史
我們知道,LLM 理解局部代碼的能力已經很強,但要掌握龐大代碼庫的全局結構是真正的難點。DeepWiki 的核心技術正是為了解決這個問題:
1. 層級化系統分解: 它首先將代碼庫分解成一個層級化的高階系統(high-level systems)結構。
2. 系統級 Wiki 生成: 然后為每一個識別出的系統生成對應的 Wiki 頁面,構建出整個項目的知識圖譜。
此外,DeepWiki 還利用了一個非常有價值的信號:代碼提交歷史 (commit history)。通過分析“哪些文件經常被哪些開發者一同修改”(這可以表示成一個圖),DeepWiki 能夠挖掘出代碼庫中隱藏的模式、模塊邊界和開發者協作關系,這些都是理解復雜項目的關鍵信息。
寫在最后
目前,DeepWiki 網站上已經有 3 萬個倉庫的 Wiki 可供探索。對于開發者來說,尤其是面對龐大、復雜的開源項目時,DeepWiki 無疑提供了一個強大的新工具,有望極大提升代碼理解效率,降低學習和參與門檻。
比較好奇DeepWiki背后使用的模型,哈哈!