AMD開源科研AI Agent,一站式自動寫論文
科學研究的漫長歷程中,受限于時間和資源,許多高質量的研究想法未能得到充分探索。如果能夠減少探索想法的限制,研究人員將能夠同時研究多個概念,增加科學發現的效率。
所以,為了幫助科研人員節省時間快速撰寫論文,AMD和約翰·霍普金斯大學的研究人員聯合開源了一個專用于科研的AI Agent——Agent Laboratory。
你只需要提供概念想法,Agent Laboratory就能自動檢索arXiv的文獻、完成實驗設計、內容生成和實驗報告,一站式自動化寫論文。
開源地址:https://github.com/SamuelSchmidgall/AgentLaboratory
Agent Laboratory的架構主要是基于大模型,并由文獻綜述、實驗設計和報告撰寫三大智能體聯合執行。
在文獻綜述階段,PhD Student智能體扮演著關鍵角色。它利用arXiv API來檢索與研究主題相關的論文,并執行三個主要動作:摘要、全文和添加論文。PhD Student智能體通過多次查詢,評估每篇論文的相關性,并提煉出全面的綜述。
這個階段的目標是為后續的研究階段提供堅實的理論基礎和參考文獻,確保研究方向的正確性和創新性。PhD Student智能體通過SUMMARY SEARCH QUERY命令,根據研究主題生成一個搜索查詢,以找到語義上相似的論文摘要。
然后,它會仔細篩選這些摘要,挑選出最相關的論文進行深入閱讀。對于每篇精選的論文,PhD Student智能體會使用FULL_TEXT命令獲取論文的全文,以便更全面地理解研究內容。在閱讀和分析了多篇論文后,PhD Student智能體會使用ADD_PAPER命令,將認為對研究項目有幫助的論文添加到官方綜述中。
接著,PhD Student智能體會不斷調整搜索查詢,以找到更多相關的文獻,直到構建出一個全面的文獻綜述,為后續的研究階段提供堅實的理論支持。
ML Engineer智能體主要負責實驗設計,使用mle-solver工具來執行實驗。mle-solver是一個高度自動化的模塊,它支持EDIT和REPLACE兩種代碼生成模式。
在命令執行環節,mle-solver首先會從維護的頂級程序集中采樣一個初始程序,然后通過REPLACE和EDIT操作,不斷調整代碼以更好地符合實驗目標。EDIT操作允許mle-solver在指定的行范圍內替換代碼,而REPLACE操作則會生成一個全新的Python文件。
在代碼執行環節,新的程序會被送入編譯器進行編譯,檢查是否存在運行時錯誤。如果代碼成功編譯,它會獲得一個分數,并且如果這個分數高于已有的程序,它將更新頂級程序列表。如果代碼編譯失敗,mle-solver會嘗試修復代碼,最多嘗試三次,然后返回錯誤并繼續嘗試新的代碼替換。
程序評分環節使用一個獎勵函數來評估代碼的有效性,這個獎勵函數會根據研究計劃、生成的代碼和觀察到的輸出來確定程序與初始目標的契合度。性能穩定環節則通過自反思機制,不斷提升代碼的可靠性和穩定性,確保代碼修改的穩定性和一致性。
報告撰寫階段由PhD Student和Professor智能體共同完成。這一階段使用paper-solver工具,它負責將研究成果整合成一份符合學術標準的報告。paper-solver的工作流程開始于初始報告框架的生成,它通過REPLACE命令創建一個新的論文框架,并通過LaTeX編譯器驗證格式。這個框架包括了論文的所有必要部分,如摘要、引言、背景、相關工作、方法、實驗設置、結果和討論等。
在報告編輯環節,使用EDIT命令進行精細修改,支持行級別的編輯操作,并通過獎勵函數評估論文質量。論文評審環節則使用LLM Agent模擬NeurIPS流程,從多個維度對論文進行評估,確保論文的質量和創新性。
最后,通過PhD Student的決策,判斷是否需要對報告進行修訂,必要時會回溯到前期環節進行修改,直到報告達到滿意的標準。目前,該項目超3000顆星非常火爆。