用大语言模型控制交通信号灯,有效缓解拥堵!

news2024/11/15 1:41:16

城市交通拥堵是一个全球性的问题,在众多缓解交通拥堵的策略中,提高路口交通信号控制的效率至关重要。传统的基于规则的交通信号控制(TSC)方法,由于其静态的、基于规则的算法,无法完全适应城市交通不断变化的模式。

随着传感器技术和数据收集的发展,更加自适应的TSC策略得以发展。它们可能过度拟合特定的交通模式,并且通常依赖于可能无法捕捉到罕见但关键事件的奖励函数,如紧急车辆的突然到来或意外的道路阻塞,这降低了它们在现实世界条件下的实用性。

本文介绍了一种新颖的方法,将大语言模型(LLMs)整合到TSC框架中,以协助决策过程,命名为LLM-Assist Light(LA-Light)。利用LLMs广泛的知识和“常识”推理能力,以增强在复杂和不常见交通情况下的决策制定。此外还引入了一套专门设计的工具,以弥合TSC系统和LLM之间的差距。这些工具作为中介,收集环境数据并与LLM通信,然后指导TSC系统。

分享几个自用的Claude 3和GPT-4的镜像站给大家吧,均为国内可用:


hujiaoai.cn(最牛的Claude 3 Opus,注册即用,测评下来完全吊打了GPT4)

higpt4.cn(稳定使用一年的chatgpt-4研究测试站,非商业目的,而且用的是最牛的128k窗口的版本)

实验表明,所提出的LA-Light系统在典型场景以及涉及罕见事件的情况下均取得了良好的性能。实验突出了LLM辅助系统深入理解交通场景的能力,并为其行动提供了清晰的解释。LA-Light被证明做出了增强安全性、效率和舒适性的明智决策,超越了在具有挑战性条件下可能失败或产生次优结果的现有方法。

论文标题:LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments

论文链接:https://arxiv.org/pdf/2403.08337.pdf

概述传统交通信号控制方法的局限性

尽管传统的TSC方法,如Webster方法和自组织交通信号控制(SOTL),在缓解拥堵方面取得了一些成就,但它们在实时交通数据利用和适应快速变化的交通状况方面存在局限性。此外,这些方法在复杂交通场景中往往表现不佳。例如:

  • Webster方法计算交叉口的理想周期长度和交通信号相位的分配,这基于交通量和假设在特定时期内交通流量稳定。

  • SOTL方案使用一组预定的规则来决定是继续当前的交通信号相位还是改变它。自适应TSC系统如SCOOT和SCATS通过选择一系列预定义的计划来动态改变周期长度、相位划分和偏移,以响应实时交通传感器数据。

    图片

然而,这些方法在实时数据利用和适应快速变化的交通状况方面存在局限性。

引入大语言模型(LLM)在交通信号控制中的应用

近年来,传感器技术和数据收集的进步导致了更多自适应TSC策略的发展。尤其是强化学习(RL) 作为一种吸引人的方法出现了,它利用实时数据动态调整交通信号。

然而,基于RL的TSC系统并非没有局限性。这些系统可能会过度拟合特定的交通模式,并且RL系统通常依赖于可能无法捕捉到罕见但关键事件的奖励函数,例如紧急车辆的突然到来或意外的道路阻塞。这可能会降低它们在现实世界条件下的实用性。

本文提出了一种新颖的方法,将大语言模型(LLM)集成到TSC框架中,以协助决策过程,命名为LLM-Assist Light(LA-Light)。利用LLM广泛的知识和“常识”推理能力,以增强复杂和不常见交通情况下的决策。

此外还引入了一套专门设计的工具,以弥合TSC系统和LLM之间的差距。这些工具作为中介,收集环境数据并与LLM通信,然后指导TSC系统。这种协作过程允许一个全面的控制策略,不仅做出了明智的决策,还为这些决策提供了理由,从而提高了系统的透明度并建立了与交通管理运营商的信任。

为了证实所提出框架的有效性,开发了一个仿真平台,并在该平台上进行了广泛的实验,考虑了各种交叉口配置。结果表明,所提出的LA-Light系统在典型场景以及涉及罕见事件的情况下都取得了良好的性能。

此外还提供了几个定性示例,其中LA-Light准确分析了复杂的交通条件,并做出了比传统TSC方法更合理的决策。实验突出了LLM辅助系统深入理解交通场景的能力,并为其行动提供了清晰的解释。LA-Light做出了提高安全性、效率和舒适性的明智决策,在具有挑战性条件下,优于可能失败或产生次优结果的现有方法。

LA-Light框架介绍

1. 框架的核心理念与设计

LA-Light框架旨在通过整合大语言模型(LLM)的人类模仿推理能力,提升交通信号控制(TSC)算法对复杂交通场景的理解和响应能力。这一创新使得信号控制算法能够以类似人类认知的细腻判断来适应城市交通挑战,特别是在处理传统系统可能忽视的不可预测和罕见事件方面。

LA-Light框架通过一个闭环的交通信号控制系统,将LLM与一整套互操作的工具集成在一起,实现了对一致和变化交通模式的深入洞察,从而装备了系统以实时分析和决策的能力,这些决策反映了人类智能。

2. LLM在框架中的角色与功能

在LA-Light框架中,LLM扮演着决策辅助的角色。LLM利用其先进的自然语言处理能力,解释复杂的交通场景,并推荐可能被基于规则或基于强化学习(RL)的系统忽视的行动。

LLM首先从增强的工具集中选择最相关的感知工具和决策算法来收集和分析交通数据,然后评估这些信息,并根据需要调整其工具选择,直到形成最终的交通控制决策。

3. 框架的决策工具集

LA-Light框架包含了一套工具集,这些工具作为LLM与交通环境互动的中介。工具集分为两大类:感知工具和决策工具。

  • 感知工具负责收集静态和动态的交通信息;

  • 决策工具则支持和评估决策过程。

这些工具的设计是模块化和可扩展的,确保了新功能的容易集成,以应对各种交通管理挑战。

图片

实验设置:模拟平台与数据集描述

实验使用了Simulation of Urban MObility (SUMO)平台进行,这是一个广泛认可的开源交通模拟器。为了准确捕捉交叉口的交通动态,研究者在模拟中使用了虚拟车道区域探测器来收集每个车道的车辆计数和排队长度等数据。

在配置交通信号时遵循了常见的城市信号序列:绿灯阶段,接着是3秒的黄灯,然后是红灯阶段。将参数设置为与现实城市交通流相匹配,最高速度限制为13.9米/秒(即50公里/小时),车辆之间的最小距离保持在2.5米,符合城市环境中安全驾驶距离。

本次实验使用了合成和真实世界的数据集来评估LA-Light在交通信号控制中的性能。

  • 合成数据集包括不同布局的孤立交叉口场景:一个三路交叉口和一个四路交叉口,每个方向都有三条车道。

  • 对于真实世界数据,研究者关注上海市松江区辰塔路周围的城市道路网络,该地区因高密度建设和商业活动而交通拥堵。

    图片

为了收集交通流量数据,研究者们分析了这些交叉口在2021年7月30日的视频监控数据,并将每分钟的车辆数量记录下来,然后在SUMO平台中重现交通场景。

图片

为了全面评估LA-Light在复杂城市交通情况下的性能,研究者为每个道路网络设计了三个特定的测试场景。这些场景包括紧急车辆(EMV)场景、道路封锁事件(RBI)场景和传感器故障(SO)场景。这些场景的设计旨在测试系统在应对紧急情况和意外事件时的响应能力。

图片

实验结果与分析

1. LA-Light在典型场景中的表现

典型的交通场景中,LA-Light系统表现出色。通过模拟平台进行的广泛实验表明,LA-Light在处理常规情况以及涉及罕见事件的情况下均能取得良好性能。例如在四路交叉口(4-Way INT)的紧急车辆(EMV)场景下,与Maxpressure方法相比,LA-Light在平均旅行时间(ATT)上实现了32.1%的降低,而在上海网络中实现了10.8%的降低。

紧急车辆效率方面,即平均紧急旅行时间(AETT),LA-Light相较于Maxpressure在上海网络中的改善更为显著,减少了15.3%。

图片

2. LA-Light在应对紧急情况下的效能

紧急情况下,LA-Light的性能同样出色。

  • 模拟的紧急车辆(EMV)场景中,LA-Light能够有效地优先处理紧急车辆,显著改善了紧急响应车辆的指标,如AETT和平均紧急等待时间(AEWT)。

  • 上海网络的四路交叉口中,与UniTSA相比,LA-Light在AETT上表现出35.6%的改善,在AEWT上表现出74.5%的改善。这一结果突显了LA-Light在紧急情况下的强大适应性和有效性。

    图片

3. 与传统方法和RL方法的对比

与传统的交通信号控制(TSC)方法和基于强化学习(RL)的方法相比,LA-Light在多个方面表现出了优越性。

  • 相对于传统的Webster方法和SOTL方法,LA-Light在ATT和AWT上均实现了降低。与RL方法如IntelliLight、PressLight和UniTSA相比,LA-Light在紧急车辆效率上表现更佳,尽管在ATT和AWT上并非总是领先。

  • 与直接使用LLM进行决策的Vanilla-LLM方法相比,LA-Light在所有测试网络中的ATT和AWT上均显示出显著改善。

  • 在复杂的上海网络中,与Vanilla-LLM相比,LA-Light在ATT和AWT上分别减少了16.5%和24.2%。

讨论:LA-Light决策过程的透明度与解释能力

LA-Light框架通过整合大语言模型(LLM)的认知能力和传统的交通管理方法,提出了一种创新的混合决策过程。该框架通过一系列有条理的步骤进行决策,从指定LLM的角色开始,到选择最合适的工具,再到激活所选工具以收集交通数据,然后由LLM评估数据并确定下一步行动,最后形成交通信号定时建议并实施。

在决策过程中,LLM不仅能够根据实时数据做出信息化的决策,还能提供其决策背后的理由,从而提高系统的透明度并建立交通管理操作员的信任。

  • 例如,在SO场景下,LA-Light通过分析交通环境的静态和动态方面,识别出传感器故障并采取补救措施,同时提供决策的逻辑解释。这种决策透明度对于交通操作员至关重要,因为它增强了系统操作的可靠性和信任度。

    图片

总体而言,LA-Light框架不仅在操作性能上表现出色,而且在决策清晰度上也有所体现,这得益于LLM的解释能力。LA-Light能够识别并利用给定交通情况下最合适的工具,为其决策过程提供清晰的洞察力。尽管LA-Light框架是一个重要的进步,但它在与LLM进行频繁交互以进行决策的依赖性上存在需要进一步完善的地方。

结论与未来研究方向

1. LA-Light的贡献与优势

LA-Light框架通过整合大语言模型(LLMs)到交通信号控制(TSC)系统中,提供了一种创新的混合决策制定过程。该框架利用LLMs的认知能力与传统交通管理方法相结合,以适应城市交通的不断变化和复杂性。

通过在三个不同的交通网络和九个独特场景中的全面评估,LA-Light在不需要额外训练的情况下展现了其有效性。与传统方法相比,LA-Light在平均旅行时间(ATT)和平均等待时间(AWT)方面均实现了降低,同时在紧急响应车辆的指标上,如平均紧急旅行时间(AETT)和平均紧急等待时间(AEWT),也显示出改进。

2. 框架的潜在改进空间

尽管LA-Light框架标志着向前迈出了重要的一步,但它仍有需要进一步完善的领域。当前框架依赖于与LLM频繁交互以进行决策,这可能会引入延迟,影响交通信号调整的及时性。此外,框架依赖于文本描述来描绘交通场景,可能无法包含最有效决策所需的所有细节。

这指向了采用更直接的基于图像的方法的潜在好处,该方法可以从视觉数据中解释交通状况。未来的工作将致力于通过改进交互过程以加快响应时间,并通过整合能够直接处理视觉信息的基于视觉的模型来解决这些问题。这些增强预计将提高框架在处理现实世界交通系统的复杂性时的熟练度,提高速度并减少对文本描述的依赖。

3. 对未来智能交通管理系统的展望

LA-Light框架在不同场景下的性能比较分析突显了其在环境不确定性中的可靠效果。特别是在上海网络中,从EMV到SO场景的转变导致ATT和AWT的轻微增加,显示了LA-Light的值得称赞的稳定性。这种性能显著优于基于RL的方法,如UniTSA,在相同条件下表现出显著的性能下降。

此外,LA-Light在所有三个场景中的紧急响应指标,特别是AETT和AEWT,始终是所有基准测试中最好的。这种一致性证实了LA-Light框架的韧性,该框架利用LLMs确保即使在不太常见的情况下也能保持最小的性能下降。这些结果强调了LA-Light在多样化和复杂的城市环境中提供可靠交通信号控制的能力。

未来的智能交通管理系统将需要在实时数据处理、决策制定和自适应性方面进行进一步的创新。随着传感器技术和数据分析能力的进步,以及人工智能和机器学习算法的发展,我们预期未来的系统将能够更加精确地预测交通流量变化,并实时调整以优化交通流。

此外,系统将需要更好地处理紧急情况和罕见事件,确保所有道路使用者的安全和效率。通过整合更多的环境感知能力和先进的推理算法,未来的系统将能够提供更加个性化和智能化的交通管理解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1535247.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RK3568笔记二十:PP-YOLOE部署测试

若该文为原创文章,转载请注明原文出处。 注:转换测试使用的是Autodl服务器,CUDA11.1版本,py3.8。 一、PP-YOLOE环境安装 创建环境 # 使用 conda 创建一个名为 PaddleYOLO 的环境,并指定 python 版本conda create -n…

[flask]flask的路由

路由的基本定义 路由就是一种映射关系。是绑定应用程序(视图)和url地址的一种一对一的映射关系!在开发过程中,编写项目时所使用的路由往往是指代了框架/项目中用于完成路由功能的类,这个类一般就是路由类,…

电子方案定制 /家庭K歌话筒

无线K歌话筒是一种可以与智能手机、平板电脑或其他设备无线连接的话筒,主要用于唱歌、录音和娱乐。 东莞市酷得智能科技有限公司,作为一家专业的玩具底层方案服务商,与国内外多家优秀制造企业有着深度合作,始终坚持以客户为中心&…

从相机空间到像素空间的投影和反投影原理和代码

目录 从相机空间到像素空间的投影 效果 ​编辑 公式 ​编辑 代码 像素空间到相机空间的反投影 记录一下从相机空间到像素空间的投影(3D-->2D)和像素空间到相机空间的反投影(2D-->3D)。 推荐blog:SLAM入门之视…

【.net/.net core】后台生成echarts图片解决方案及.net core html转word方法

工具环境下载: EChartsConvert:https://gitee.com/saintlee/echartsconvert EChartsConvert为生成echarts图片的服务端,用于接收参数和生成echarts图表图片BASE64编码 PhantomJS:Download PhantomJS PhantomJS用来发布EChartsConvert服务…

Amazon SageMaker + Stable Diffusion 搭建文本生成图像模型

如果我们的计算机视觉系统要真正理解视觉世界,它们不仅必须能够识别图像,而且必须能够生成图像。文本到图像的 AI 模型仅根据简单的文字输入就可以生成图像。 近两年,以ChatGPT为代表的AIGC技术崭露头角,逐渐从学术研究的象牙塔迈…

基于python+vue云上水果超市的设计与实现flask-django-php-nodejs

本论文的主要内容包括: 第一,研究分析当下主流的web技术,结合超市日常管理方式,进行云上水果超市的数据库设计,设计云上水果超市功能,并对每个模块进行说明。 第二,陈列说明该系统实现所采用的架…

kubernetes-RBAC 鉴权

kubernetes-RBAC 鉴权 kubernetes-RBAC 鉴权1、查看整个k8s集群内部有哪些资源2、什么是鉴权2.1、鉴权的目的2.2、怎么去鉴权:RBAC2.3、对鉴权的理解🌱2.4、租户 3、对一些概念的解释3.1、概念简述3.2、账号类型:Useraccount和ServiceAccount…

AI绘画可以稳定生成中文了:白嫖阿里云部署AnyText

长久以来,在AI绘画中书写文字一直是个难题。即使到了SDXL时代,我们也只能输出英文,而且还经常出现漏掉字母的情况。现在阿里达摩院搞出了一个解决方案,可以在Stable Diffusion生成的作品中稳定输出中、英、日、韩等多种文字&#…

Prompt-RAG:在特定领域中应用的革新性无需向量嵌入的RAG技术

论文地址:https://arxiv.org/ftp/arxiv/papers/2401/2401.11246.pdf 原文地址:https://cobusgreyling.medium.com/prompt-rag-98288fb38190 2024 年 3 月 21 日 虽然 Prompt-RAG 确实有其局限性,但在特定情况下它可以有效地替代传统向量嵌入 …

基于Springboot+vue的在线试题题库管理系统+数据库+报告+免费远程调试

项目介绍: Springbootvue的在线试题题库管理系统,Javaee项目,springboot vue前后端分离项目 本文设计了一个基于Springbootvue的前后端分离的在线试题题库管理系统,采用M(model)V(view)C&#x…

Java项目:68 ssm校园美食交流系统+vue

作者主页:源码空间codegym 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 主要功能包括管理员:首页、个人中心、美食分类管理、美食信息管理、用户管理、管理员管理、论坛中心、系统管理。 前台首页&#…

Docker部署Alist全平台网盘神器结合内网穿透实现无公网IP访问云盘资源

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法|MySQL| ​💫个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-oZuxWTWUiXLx3aQO {font-family:"trebuchet ms",verdana,arial,sans-serif;f…

B011-springcloud alibaba rpc通信 Dubbo

目录 介绍实现提供统一业务api服务提供者1.导入依赖2添加dubbo配置3编写并暴露服务 服务消费者1.导入依赖2添加dubbo配置3引用服务 测试 介绍 Dubbo是阿里巴巴开源的基于 Java 的高性能 RPC分布式服务框架,致力于提供高性能和透明化的 RPC远程服务调用方案&#xf…

数字化转型:传统行业的新出路?

近年来,数字化转型已成为各行各业的热议话题。许多传统行业正面临着巨大的挑战,例如市场竞争加剧、成本上升、利润率下降等。数字化转型被视为传统行业破局的关键。那么,数字化转型究竟是不是传统行业的新出路呢? 传统行业面临的挑…

vscode中转(跳板)连接目标主机

vscode中转(跳板)连接目标主机 文章目录 引言正文跳转配置本地密钥 总结 引言 简单讲解如何通过vscode经过跳板机到达目标机的方式,本文基于linux平台,理论上vscode是跨平台的1。 如下本机通过两层跳板到目标主机如何通过vscode…

【开源】SpringBoot框架开发知识图谱构建系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 知识图谱模块2.2 知识点模块2.3 学生测评模块2.4 学生成绩模块 三、系统展示四、核心代码4.1 查询知识点4.2 新增知识点4.3 查询知识图谱4.4 查询学生成绩4.5 查询学生成绩 五、免责说明 一、摘要 1.1 项目介绍 基于J…

学习笔记|如何用Go程序采集温湿度传感器数据

在共创社内部的交流中,先前有一位成员展示了如何借助C语言来实现对AHT20温湿度传感器数据的读取。这一实例触发了另一位共创官的灵感,他决定采纳Go语言重新构建这一数据采集流程。接下来,我们将详细解析整个利用Go语言从AHT20温湿度传感器获取…

图论基础|695. 岛屿的最大面积、1020. 飞地的数量、130. 被围绕的区域

695. 岛屿的最大面积 力扣题目链接(opens new window) 给你一个大小为 m x n 的二进制矩阵 grid 。 岛屿 是由一些相邻的 1 (代表土地) 构成的组合,这里的「相邻」要求两个 1 必须在 水平或者竖直的四个方向上 相邻。你可以假设 grid 的四个边缘都被 0&#xff0…

WebGIS航线编辑器(无人机航线规划)

无人机航点、航线规划,实现全自动航点飞行作业及飞行航拍。禁飞区、作业区功能保障飞行安全。 GIS引擎加载 const viewer new Cesium.Viewer("cesiumContainer", { imageryProvider: new Cesium.IonImageryProvider({ assetId: 3872 }), }); const im…