用大語言模型控制交通信號燈,有效緩解擁堵!
引言:城市交通擁堵的挑戰與智能交通信號控制的進展
城市交通擁堵是一個全球性的問題,在眾多緩解交通擁堵的策略中,提高路口交通信號控制的效率至關重要。傳統的基于規則的交通信號控制(TSC)方法,由于其靜態的、基于規則的算法,無法完全適應城市交通不斷變化的模式。
隨著傳感器技術和數據收集的發展,更加自適應的TSC策略得以發展。它們可能過度擬合特定的交通模式,并且通常依賴于可能無法捕捉到罕見但關鍵事件的獎勵函數,如緊急車輛的突然到來或意外的道路阻塞,這降低了它們在現實世界條件下的實用性。
本文介紹了一種新穎的方法,將大語言模型(LLMs)整合到TSC框架中,以協助決策過程,命名為LLM-Assist Light(LA-Light)。利用LLMs廣泛的知識和“常識”推理能力,以增強在復雜和不常見交通情況下的決策制定。此外還引入了一套專門設計的工具,以彌合TSC系統和LLM之間的差距。這些工具作為中介,收集環境數據并與LLM通信,然后指導TSC系統。
實驗表明,所提出的LA-Light系統在典型場景以及涉及罕見事件的情況下均取得了良好的性能。實驗突出了LLM輔助系統深入理解交通場景的能力,并為其行動提供了清晰的解釋。LA-Light被證明做出了增強安全性、效率和舒適性的明智決策,超越了在具有挑戰性條件下可能失敗或產生次優結果的現有方法。
論文標題:LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments
論文鏈接:??https://arxiv.org/pdf/2403.08337.pdf??
概述傳統交通信號控制方法的局限性
盡管傳統的TSC方法,如Webster方法和自組織交通信號控制(SOTL),在緩解擁堵方面取得了一些成就,但它們在實時交通數據利用和適應快速變化的交通狀況方面存在局限性。此外,這些方法在復雜交通場景中往往表現不佳。例如:
- Webster方法計算交叉口的理想周期長度和交通信號相位的分配,這基于交通量和假設在特定時期內交通流量穩定。
- SOTL方案使用一組預定的規則來決定是繼續當前的交通信號相位還是改變它。自適應TSC系統如SCOOT和SCATS通過選擇一系列預定義的計劃來動態改變周期長度、相位劃分和偏移,以響應實時交通傳感器數據。
然而,這些方法在實時數據利用和適應快速變化的交通狀況方面存在局限性。
引入大語言模型(LLM)在交通信號控制中的應用
近年來,傳感器技術和數據收集的進步導致了更多自適應TSC策略的發展。尤其是強化學習(RL) 作為一種吸引人的方法出現了,它利用實時數據動態調整交通信號。
然而,基于RL的TSC系統并非沒有局限性。這些系統可能會過度擬合特定的交通模式,并且RL系統通常依賴于可能無法捕捉到罕見但關鍵事件的獎勵函數,例如緊急車輛的突然到來或意外的道路阻塞。這可能會降低它們在現實世界條件下的實用性。
本文提出了一種新穎的方法,將大語言模型(LLM)集成到TSC框架中,以協助決策過程,命名為LLM-Assist Light(LA-Light)。利用LLM廣泛的知識和“常識”推理能力,以增強復雜和不常見交通情況下的決策。
此外還引入了一套專門設計的工具,以彌合TSC系統和LLM之間的差距。這些工具作為中介,收集環境數據并與LLM通信,然后指導TSC系統。這種協作過程允許一個全面的控制策略,不僅做出了明智的決策,還為這些決策提供了理由,從而提高了系統的透明度并建立了與交通管理運營商的信任。
為了證實所提出框架的有效性,開發了一個仿真平臺,并在該平臺上進行了廣泛的實驗,考慮了各種交叉口配置。結果表明,所提出的LA-Light系統在典型場景以及涉及罕見事件的情況下都取得了良好的性能。
此外還提供了幾個定性示例,其中LA-Light準確分析了復雜的交通條件,并做出了比傳統TSC方法更合理的決策。實驗突出了LLM輔助系統深入理解交通場景的能力,并為其行動提供了清晰的解釋。LA-Light做出了提高安全性、效率和舒適性的明智決策,在具有挑戰性條件下,優于可能失敗或產生次優結果的現有方法。
LA-Light框架介紹
1. 框架的核心理念與設計
LA-Light框架旨在通過整合大語言模型(LLM)的人類模仿推理能力,提升交通信號控制(TSC)算法對復雜交通場景的理解和響應能力。這一創新使得信號控制算法能夠以類似人類認知的細膩判斷來適應城市交通挑戰,特別是在處理傳統系統可能忽視的不可預測和罕見事件方面。
LA-Light框架通過一個閉環的交通信號控制系統,將LLM與一整套互操作的工具集成在一起,實現了對一致和變化交通模式的深入洞察,從而裝備了系統以實時分析和決策的能力,這些決策反映了人類智能。
2. LLM在框架中的角色與功能
在LA-Light框架中,LLM扮演著決策輔助的角色。LLM利用其先進的自然語言處理能力,解釋復雜的交通場景,并推薦可能被基于規則或基于強化學習(RL)的系統忽視的行動。
LLM首先從增強的工具集中選擇最相關的感知工具和決策算法來收集和分析交通數據,然后評估這些信息,并根據需要調整其工具選擇,直到形成最終的交通控制決策。
3. 框架的決策工具集
LA-Light框架包含了一套工具集,這些工具作為LLM與交通環境互動的中介。工具集分為兩大類:感知工具和決策工具。
- 感知工具負責收集靜態和動態的交通信息;
- 決策工具則支持和評估決策過程。
這些工具的設計是模塊化和可擴展的,確保了新功能的容易集成,以應對各種交通管理挑戰。
實驗設置:模擬平臺與數據集描述
實驗使用了Simulation of Urban MObility (SUMO)平臺進行,這是一個廣泛認可的開源交通模擬器。為了準確捕捉交叉口的交通動態,研究者在模擬中使用了虛擬車道區域探測器來收集每個車道的車輛計數和排隊長度等數據。
在配置交通信號時遵循了常見的城市信號序列:綠燈階段,接著是3秒的黃燈,然后是紅燈階段。將參數設置為與現實城市交通流相匹配,最高速度限制為13.9米/秒(即50公里/小時),車輛之間的最小距離保持在2.5米,符合城市環境中安全駕駛距離。
本次實驗使用了合成和真實世界的數據集來評估LA-Light在交通信號控制中的性能。
- 合成數據集包括不同布局的孤立交叉口場景:一個三路交叉口和一個四路交叉口,每個方向都有三條車道。
- 對于真實世界數據,研究者關注上海市松江區辰塔路周圍的城市道路網絡,該地區因高密度建設和商業活動而交通擁堵。
為了收集交通流量數據,研究者們分析了這些交叉口在2021年7月30日的視頻監控數據,并將每分鐘的車輛數量記錄下來,然后在SUMO平臺中重現交通場景。
為了全面評估LA-Light在復雜城市交通情況下的性能,研究者為每個道路網絡設計了三個特定的測試場景。這些場景包括緊急車輛(EMV)場景、道路封鎖事件(RBI)場景和傳感器故障(SO)場景。這些場景的設計旨在測試系統在應對緊急情況和意外事件時的響應能力。
實驗結果與分析
1. LA-Light在典型場景中的表現
在典型的交通場景中,LA-Light系統表現出色。通過模擬平臺進行的廣泛實驗表明,LA-Light在處理常規情況以及涉及罕見事件的情況下均能取得良好性能。例如在四路交叉口(4-Way INT)的緊急車輛(EMV)場景下,與Maxpressure方法相比,LA-Light在平均旅行時間(ATT)上實現了32.1%的降低,而在上海網絡中實現了10.8%的降低。
在緊急車輛效率方面,即平均緊急旅行時間(AETT),LA-Light相較于Maxpressure在上海網絡中的改善更為顯著,減少了15.3%。
2. LA-Light在應對緊急情況下的效能
在緊急情況下,LA-Light的性能同樣出色。
- 在模擬的緊急車輛(EMV)場景中,LA-Light能夠有效地優先處理緊急車輛,顯著改善了緊急響應車輛的指標,如AETT和平均緊急等待時間(AEWT)。
- 在上海網絡的四路交叉口中,與UniTSA相比,LA-Light在AETT上表現出35.6%的改善,在AEWT上表現出74.5%的改善。這一結果突顯了LA-Light在緊急情況下的強大適應性和有效性。
3. 與傳統方法和RL方法的對比
與傳統的交通信號控制(TSC)方法和基于強化學習(RL)的方法相比,LA-Light在多個方面表現出了優越性。
- 相對于傳統的Webster方法和SOTL方法,LA-Light在ATT和AWT上均實現了降低。與RL方法如IntelliLight、PressLight和UniTSA相比,LA-Light在緊急車輛效率上表現更佳,盡管在ATT和AWT上并非總是領先。
- 與直接使用LLM進行決策的Vanilla-LLM方法相比,LA-Light在所有測試網絡中的ATT和AWT上均顯示出顯著改善。
- 在復雜的上海網絡中,與Vanilla-LLM相比,LA-Light在ATT和AWT上分別減少了16.5%和24.2%。
討論:LA-Light決策過程的透明度與解釋能力
LA-Light框架通過整合大語言模型(LLM)的認知能力和傳統的交通管理方法,提出了一種創新的混合決策過程。該框架通過一系列有條理的步驟進行決策,從指定LLM的角色開始,到選擇最合適的工具,再到激活所選工具以收集交通數據,然后由LLM評估數據并確定下一步行動,最后形成交通信號定時建議并實施。
在決策過程中,LLM不僅能夠根據實時數據做出信息化的決策,還能提供其決策背后的理由,從而提高系統的透明度并建立交通管理操作員的信任。
- 例如,在SO場景下,LA-Light通過分析交通環境的靜態和動態方面,識別出傳感器故障并采取補救措施,同時提供決策的邏輯解釋。這種決策透明度對于交通操作員至關重要,因為它增強了系統操作的可靠性和信任度。
總體而言,LA-Light框架不僅在操作性能上表現出色,而且在決策清晰度上也有所體現,這得益于LLM的解釋能力。LA-Light能夠識別并利用給定交通情況下最合適的工具,為其決策過程提供清晰的洞察力。盡管LA-Light框架是一個重要的進步,但它在與LLM進行頻繁交互以進行決策的依賴性上存在需要進一步完善的地方。
結論與未來研究方向
1. LA-Light的貢獻與優勢
LA-Light框架通過整合大語言模型(LLMs)到交通信號控制(TSC)系統中,提供了一種創新的混合決策制定過程。該框架利用LLMs的認知能力與傳統交通管理方法相結合,以適應城市交通的不斷變化和復雜性。
通過在三個不同的交通網絡和九個獨特場景中的全面評估,LA-Light在不需要額外訓練的情況下展現了其有效性。與傳統方法相比,LA-Light在平均旅行時間(ATT)和平均等待時間(AWT)方面均實現了降低,同時在緊急響應車輛的指標上,如平均緊急旅行時間(AETT)和平均緊急等待時間(AEWT),也顯示出改進。
2. 框架的潛在改進空間
盡管LA-Light框架標志著向前邁出了重要的一步,但它仍有需要進一步完善的領域。當前框架依賴于與LLM頻繁交互以進行決策,這可能會引入延遲,影響交通信號調整的及時性。此外,框架依賴于文本描述來描繪交通場景,可能無法包含最有效決策所需的所有細節。
這指向了采用更直接的基于圖像的方法的潛在好處,該方法可以從視覺數據中解釋交通狀況。未來的工作將致力于通過改進交互過程以加快響應時間,并通過整合能夠直接處理視覺信息的基于視覺的模型來解決這些問題。這些增強預計將提高框架在處理現實世界交通系統的復雜性時的熟練度,提高速度并減少對文本描述的依賴。
3. 對未來智能交通管理系統的展望
LA-Light框架在不同場景下的性能比較分析突顯了其在環境不確定性中的可靠效果。特別是在上海網絡中,從EMV到SO場景的轉變導致ATT和AWT的輕微增加,顯示了LA-Light的值得稱贊的穩定性。這種性能顯著優于基于RL的方法,如UniTSA,在相同條件下表現出顯著的性能下降。
此外,LA-Light在所有三個場景中的緊急響應指標,特別是AETT和AEWT,始終是所有基準測試中最好的。這種一致性證實了LA-Light框架的韌性,該框架利用LLMs確保即使在不太常見的情況下也能保持最小的性能下降。這些結果強調了LA-Light在多樣化和復雜的城市環境中提供可靠交通信號控制的能力。
未來的智能交通管理系統將需要在實時數據處理、決策制定和自適應性方面進行進一步的創新。隨著傳感器技術和數據分析能力的進步,以及人工智能和機器學習算法的發展,我們預期未來的系統將能夠更加精確地預測交通流量變化,并實時調整以優化交通流。
此外,系統將需要更好地處理緊急情況和罕見事件,確保所有道路使用者的安全和效率。通過整合更多的環境感知能力和先進的推理算法,未來的系統將能夠提供更加個性化和智能化的交通管理解決方案。
本文轉載自夕小瑤科技說,作者:松果
