圍繞多智能體黑箱非凸優化共識難題,華南理工大學團隊發表系列研究
多智能體系統分布式共識優化的一系列研究來了!
在智能城市、智能電網、無人系統等前沿應用不斷擴展的今天,多智能體系統(Multi-Agent Systems, MAS)作為新一代智能協同的技術基礎,正迎來前所未有的發展機遇。
在這些系統中,多個具備計算與通信能力的智能體需要在沒有中心協調、通信受限的條件下實現任務協作、資源共享與一致性決策。
這一過程的核心挑戰之一,便是分布式共識優化問題。
近年來,分布式共識優化逐漸成為機器學習、運籌優化、群體智能等多個交叉領域的研究熱點,聚焦如何在僅依賴本地信息和鄰居通信的前提下,實現全局目標的優化與智能體之間的解一致性。
在這一背景下,華南理工大學計算智能團隊圍繞“多智能體共識與合作中的分布式進化計算”這一核心問題,持續開展系統研究,已取得一系列具有代表性的成果:
- 在IEEE/CAA Journal of Automatica Sinica發表綜述論文,提出描述性框架總結現有研究成果;
- 提出多智能體粒子群優化算法MASOIE,創新性地引入了內部學習與外部學習機制;
- 提出目標激勵驅動的協同演化算法MACPO,通過激勵機制引導協作行為;
- 設計了一種具有協作與累積特性的步長自適應機制,構建了更靈活的搜索節奏調控方式;
- 提出MASTER算法應對無線傳感器網絡中常見的“無數據關聯”問題。
另外,華南理工大學計算智能團隊還于CEC2024組織并主導了首屆分布式黑盒共識優化競賽。
相關研究不僅理論扎實、方法創新,更在多個現實場景中展現出顯著應用潛力。
分布式進化計算的系統性探索與算法創新
系統綜述:構建EC與MAS融合研究的理論藍圖
為梳理進化計算與多智能體系統交叉領域的發展脈絡,團隊在IEEE/CAA Journal of Automatica Sinica發表綜述論文,系統總結了二者融合的主要研究方向與技術路徑。
論文從兩個維度出發:
- 基于MAS的EC建模:探索如何利用多智能體模型增強EC的分布式能力與并行計算性能;
- EC輔助MAS優化:利用EC強大的全局搜索能力,提升MAS在協同任務中的優化表現。
此外,團隊還提出了一個描述性框架,總結現有研究成果,并展望了未來在聯邦學習、邊緣計算等新興技術背景下的融合潛力。
論文標題: 《The confluence of evolutionary computation and multi-agent systems: A survey》
期刊信息:IEEE/CAA Journal of Automatica Sinica(綜述),DOI:10.1109/JAS.2025.125246
多智能體粒子群優化算法MASOIE:內外部學習機制助力協同優化
在分布式環境下,智能體之間的通信能力和信息共享受限,如何在這一限制下協同優化全局目標函數是重要挑戰。
為此,團隊提出MASOIE(Multi-Agent Swarm Optimization With Adaptive Internal and External Learning)算法,創新性地引入了內部學習與外部學習機制,在保持系統一致性的同時提升整體優化性能。
- 內部學習:每個智能體根據自己的局部目標函數獨立優化,聚焦局部最優。
- 外部學習:智能體通過與鄰居的交流,實現經驗共享與協同進化,從而逐步接近全局最優。
算法還引入外部學習慣性速度控制策略,在演化過程中自適應調整通信頻率,提升了算法在收斂速度和通信效率上的平衡能力。
該工作結合共識理論和動力學系統理論,首次從理論上證明了所提出的內外部協同學習機制在多智能體系統上的系統共識性
論文標題:《Multi-Agent Swarm Optimization With Adaptive Internal and External Learning for Complex Consensus-Based Distributed Optimization》
期刊信息:IEEE Transactions on Evolutionary Computation,DOI:10.1109/TEVC.2024.3380436代碼開源:GitHub - MASOIE
目標激勵驅動的協同演化算法MACPO:讓“自私”節點協同起來
當系統中各個節點的局部目標函數存在矛盾時,如何實現合作優化?
團隊提出MACPO(A Multiagent Co-Evolutionary Algorithm With Penalty-Based Objective)算法,核心思路是通過激勵機制引導協作行為。
MACPO在設計上將優化過程拆分為兩個階段:
- 局部優化階段:引入懲罰目標函數,使每個節點即使在只知道本地信息的前提下,也能通過“獎勵/懲罰”機制更理性地搜索。
- 協商階段:節點之間根據共享變量是否存在沖突進行通信,并基于局部反饋動態調整目標方向,實現更合理的集體進化。
此外,算法設計了沖突檢測機制與共享變量協商機制(評估-競爭-共享),提高了解的一致性與可控性。
實驗顯示,該方法在無梯度約束優化場景中能取得與集中式算法相當的效果,且適應分布式部署需求。
論文標題:《A Multi-Agent Co-evolutionary Algorithm with Penalty-Based Objective for Network-Based Distributed Optimization》
期刊信息:IEEE Transactions on Systems, Man, and Cybernetics: Systems,DOI:10.1109/TSMC.2024.3380389
步長自適應機制 CCSA:動態調整節奏,提升黑盒優化性能
在黑盒共識優化中,如何選擇合適的步長策略至關重要。傳統方法大多使用固定或單調遞減的步長,難以適應復雜任務。
為此,團隊設計了一種具有協作與累積特性的步長自適應機制(CCSA),構建了更靈活的搜索節奏調控方式。
- 當多個智能體的搜索方向一致時,放大步長,快速朝向最優區域收斂。
- 當搜索方向存在顯著沖突時,縮小步長,以避免誤差擴散和信息偏離。
實驗結果表明,該算法在多個復雜函數測試中取得更優的收斂效果與系統一致性,展現出極強的黑盒優化能力。
論文標題:《Multi-Agent Evolution Strategy With Cooperative and Cumulative Step Adaptation for Black-Box Distributed Optimization》
期刊信息:IEEE Transactions on Evolutionary Computation,DOI:10.1109/TEVC.2025.3525713
MASTER算法:提升傳感器網絡下多目標協同定位精度
面對無線傳感器網絡中常見的“無數據關聯”問題,團隊提出MASTER算法(Multi-Agent Swarm with contribution-based collaboration)。
該方法將傳感器間信息共享建模為雙層優化問題,核心貢獻包括:
- 利用Kuhn-Munkres算法與CSO方法實現本地優化;
- 設計“貢獻學習機制”,根據傳感器在全局目標中的貢獻程度,進行加權式經驗傳播;
- 在多個定位維度與目標數量場景下,實現了更小的誤差、更強的一致性。
論文標題:《Multi-agent swarm optimization with contribution-based cooperation for distributed multi-target localization and data association》
期刊信息:IEEE/CAA Journal of Automatica Sinica,DOI:10.1109/JAS.2025.125150
分布式黑盒共識優化競賽:構建統一研究基準平臺
華南理工大學計算智能團隊于CEC2024組織并主導了首屆分布式黑盒共識優化競賽,為分布式共識優化領域構建了具有挑戰性與實際導向的測試平臺。
競賽模擬多智能體在不同通信拓撲、目標函數異質性、沖突環境下的協同場景,吸引了眾多研究團隊參與,推動了算法性能與工程適配的共同進步。
未來展望:從智能協同到智慧生態系統
分布式共識優化不僅是算法問題,更是智能系統協作能力的“中樞神經”。
隨著IoT、自動駕駛、智能制造的深入發展,去中心、可擴展、高魯棒的優化機制將成為智能基礎設施的剛需。 未來,該領域有望向以下方向持續拓展:
- 與聯邦學習、圖神經網絡等架構深度融合;
- 面向隱私保護和不可見目標函數的優化;
- 在工業控制、能源系統、復雜機器人編隊等場景中廣泛部署。
華南理工大學計算智能團隊將持續圍繞“分布式智能優化”的核心命題,推進基礎研究與應用落地的雙輪驅動,歡迎來自不同領域的同行共同探討與合作。