交通控制系统中的 Prompt工程：引导LLMs实现高效交叉口管理 !

本研究提出了一种新型的交通控制系统方法，通过使用大型语言模型（LLMs）作为交通控制器。该研究利用它们的逻辑推理、场景理解和决策能力，实时优化通行能力并提供基于交通状况的反馈。LLMs将传统的分散式交通控制过程集中化，并能够集成来自不同来源的交通数据以提供情境感知决策。

LLMs可以通过无线信号和视觉等多种方式向驾驶员、基础设施和自动驾驶车辆提供定制的输出。为了评估LLMs作为交通控制器的性能，本研究提出了一种四阶段方法。该方法包括数据创建和环境初始化、 Prompt 工程、冲突识别和微调。作者模拟了多车道四腿交叉口场景，并生成了详细的 datasets，以使冲突检测使用 LLMs 和 Python 模拟作为 GT 情况。

作者使用连贯性 Prompt 来引导 LLMs 理解上下文，检测冲突，使用交通规则解决冲突，并交付情境敏感的交通管理解决方案。作者评估了 GPT-mini、Gemini 和 Llama 作为交通控制器。结果表明，微调的 GPT-mini 实现了 83% 的准确率，F1 得分为 0.84。

GPT-mini 模型在生成可操作的交通管理洞察方面表现出色，冲突识别的 ROUGE-L 得分达到了 0.95，决策达到了 0.91，优先级分配达到了 0.94，等待时间优化达到了 0.92。本研究证实了 LLMs 在实际应用中的交通控制器优势。作者证明了 LLMs 可以实时向驾驶员提供精确建议，包括根据车辆动力学让行、减速或停车。本研究展示了 LLMs 在交叉口交通控制方面的变革潜力，提高了交叉口效率和安全性。

城市交叉口, 交通控制系统, 大型语言模型(LLMs), 逻辑推理。

城市交叉口是城市交通的重要节点,需要有效的交通控制系统来保证交通流畅和安全。大型语言模型(LLMs)在交通控制系统中的应用也越来越广泛,可以用于交通信号控制、交通流预测和交通优化等方面。此外,逻辑推理在交通控制系统中的作用也越来越重要,可以用于交通规则的制定和交通行为的预测等方面。

项目介绍：https://zenodo.org/records/14171746

Introduction

交通控制系统对于维持城市交通网络的安全和效率至关重要，其中混合了车辆、行人和公共交通车辆在交叉口和其他冲突点处交汇。通过管理交通流量，这些系统旨在减少拥堵、防止碰撞、最小化延误，以确保所有道路用户获得更顺畅、更安全、更环保的体验。在城市地区，有效的及时交通控制尤为重要，因为密集的人口环境和高度的 Stream 性需求如果没有得到妥善管理，可能会迅速导致拥堵、污染和安全关键事件。交通信号、标识和智能交通系统构成了这个控制系统的核心，它们根据预定的算法、传感器输入和历史数据来指导交通流，以优化交叉口的使用，并提高其效率。

然而，现代城市交通控制系统面临着巨大的挑战，由于城市交通模式日益复杂和动态性 [8, 9]。传统系统往往难以适应交通状况的实时变化，例如车辆数量的突然增加，交通工具的多样化，以及行人和驾驶员行为的不可预测，尤其是在行人、自行车和车辆混行的场景中。此外，同时优化多个目标，如安全性、运营效率和环境影响，对许多传统交通控制系统提出了更大的挑战，这些系统通常缺乏平衡这些目标的能力 [14]，[15]，[16]。因此，迫切需要更先进、灵活和适应性强的交通控制系统，能够动态响应实时数据，并通过整体方法管理交通流量。大型语言模型（LLMs）有潜力改变交通控制系统，因为它们已经接触到大量数据，允许它们提高逻辑推理、场景理解和决策过程的性能。

在交通管理背景下，LLMs 能够高效处理数据并生成符合情境的响应和预测。以前的研究表明 LLMs 在交通信号管理方面的有效性，包括 LLMLight 和 TrafficGPT [23, 24]。然而，在文献中关于将 LLMs 作为交通控制器的研究仍然缺失 [4]。

本文的贡献如下：

提出一种新颖的范式，其中LLM作为动态交通控制器发挥作用，利用其逻辑推理、场景理解和决策能力。

呈现一个基于LLM的4D框架，用于交通控制系统，该框架将传统上由断开组件管理的交通控制过程进行集中。

提出一个四阶段的流程，将LLMs集成到交通控制中，包括数据创建和初始化，使用思维链法生成 Prompt ，冲突识别和解决，以及微调和性能分析。

评估LLM模型性能的指标，如准确性、精确度、召回率、F1分数和ROUGE-L。它将GPT-mini模型确定为冲突检测和交通管理任务中最有效的模型。

LLMs as Traffic Control Systems: A New Paradigm

本研究提出了一种新型的交通控制系统，该系统使用LLM（语言模型）作为交通控制器，可以作为当前信号化交叉口系统的实际和高效替代方案。LLM在多个应用中显示出其高级逻辑推理和决策能力，具有巨大的潜力[21, 26, 27, 28, 29]。本研究认为，LLM为交通控制提供了一种变革性的方法，它们固有的灵活性和适应性可以动态地响应变化的交通条件，而不同于传统的固定或适应性控制系统[9, 30, 31]。通过在交通管理中部署LLM，交叉口可以受益于更适应、更具上下文 Aware 的决策，以解决实时交通流量和多样化混合交通类型（车辆、行人、自行车和公共交通）以及提供定制化模块反馈给驾驶员，且延迟最小[32]。用LLM基础的控制器替换（或增强）现有系统，可以带来多个优势，包括优化交通通行能力、增强对交通需求波动的响应、减少拥堵和等待时间[33]。这种由LLM驱动的控制可以显著减少环境影响，通过优化燃油消耗和最小化怠速时间，这可能有助于提供环保和可持续的城市移动解决方案。

LLMs也可能为交通管理中的多目标优化任务提供独特的处理能力。LLMs可以同时处理和优先多个目标，如安全、运营效率和燃油消耗[34, 35]。这种灵活性使得LLMs能够平衡速度、时间和流量等因素与环保因素。利用预训练的知识和实时数据处理，LLMs可以调整信号定时或向驾驶员提供直接指令，以降低排放和燃油消耗，同时保持安全并减少运营延误。此外，LLMs的适应性使得它们能够根据历史和实时数据演变和优化其决策，从而使其能够学习最优交通模式并调整参数以最大化整体交叉口性能[9, 30]。

就此而言，采用LLM作为交通控制器引入了一种新范式，扩展并增强了传统定义和特征。交通控制系统通常定义为管理运输系统用户，以确保无冲突的移动[8, 36]。传统上，交叉口交通控制涉及各种设备，包括信号、标志和路面 Token ，这些设备可以手动操作或基于规则的算法[37]。然而，LLM允许采用更集成和中心化的方法，可以组合控制组件。它们处理和解释大量不同类型数据的能力，使它们能够为人类驾驶员、基础设施和自动驾驶车辆提供针对性的指导[38, 39, 40]。这可以适应各种交叉口设计，包括四路交叉口、环形交叉口、 interchange 以及新兴城市交叉口模型。此外，LLM可以通过语音、信号、代码、视觉或通过车辆与基础设施（V2I）和车辆与车辆（V2V）技术无线通信来传达指令，这可以增强现有的控制框架。

这项研究将LLM视为一个交通控制器，通过概念上的“4D交通控制系统”（即检测、决策、传播、部署，如图1[8, 37, 43]所示）来实现。LLM可以集中和整合检测和应对各种交通状况的断开过程，如图1（a）所示的传统交通控制器系统。作者认为，LLM可以同时利用多种检测技术的数据，如环形检测器、GPS、视频成像和DSRC，处理个体和群体的轨迹，从而全面理解城市交叉口的道路流量[34]。这种检测信息将影响其决策过程，使LLM能够根据实时和预测分析合理地推理“哪里”、“何时”、“谁”和“如何”来控制交通。此外，“决策”阶段中多个目标的整合，从安全到运营效率和节能，确保LLM与交通管理中的特定关键目标保持一致。

在“传播”和“部署”阶段，LLMs具有展示更多灵活性的潜力。LLMs可以通过多种通信渠道和包括语音、视觉信号、无线信号、代码或DSRC的不同方式与人类、机器和其他道路基础设施进行交互。LLMs还可以提供及时有效的控制输出，这些输出可以是二进制的（停止/前进）或非二进制的（通过逻辑和可操作指令调整速度或路径），从而实现对驾驶员的定制响应，提高遵守交通规则的可能性并降低复杂交通条件下的风险[26], [28], [38]。

Background

LLMs有可能实现更灵活、更适应的智能交通控制系统，同时能够为驾驶员、交通工程师和政策制定者提供可操作的反馈。

以往的研究提出了使用LLMs和物联网（IoT）技术整合道路交通管理的解决方案[31, 33, 44]。提出了不同解决方案，如路由机制、智能交通灯解决方案或网络交通管理策略，从而进行分类[31, 33, 44]。关于机器和深度学习在交通管理方面的研究已经进行调查，以展示这些技术的优势和劣势[45]。其他调查强调了未来的研究方向，并揭示了机器学习和深度学习如何有助于解决交通管理问题[46]。

利用最近的AI工作，将LLM用于交通预测，涉及将序列和图嵌入层集成到模型中，以获得与LLM输入格式兼容的特征，然后利用高效的微调技术[23]。实验表明，这些框架在历史样本大小和少样本预测性能方面取得了显著成果[23]。创新地将多个LLM和交通基础模型相结合可以成为使用具有适当感知、分析和操作运输数据能力的LLM的吸引人的方法[24]。此外，其他研究提出了一种多任务决策系统，用于自动驾驶[47]，该系统利用强化学习和LLM序列建模在复杂的设置[48]，例如失控的交叉口[49]，中有效地执行。此外，已经证明，使用来自多个传感器的LLM，其中包括摄像头和激光雷达，可以增强全面交通调查中运输场景的主题感知[25]。在先进互联和自动驾驶的背景下，包括LLM也有助于提高交通管理的效果[50]。

此外，LLMs在交通管理中能以最小的人力投入开发安全案例的能力，表明并确保了合规性和安全性[51]。基于LLMs提升交通功能预测能力的新颖变革方法，为先进交通系统的提升提供了新的途径[52]。

Methodology

如图2所示，将LLMs引入交通控制系统并实时评估其性能的具体框架包括四个关键阶段：数据创建与初始化、 Prompt 生成、冲突识别以及微调和模型分析。

Dataset Creation and Initialization

该框架从创建数据集和初始化环境开始，其中解释了LLM包括车道、进入和离开点以及每辆车的初始参数，如速度、初始车道、方向和目的地通过交叉口。为覆盖真实城市环境中交叉口场景，作者开发了一个基于理性思维、计算方法和交通法规的系统。接下来一节描述了为这些场景生成和生成实际数据集的过程。该过程如图3所示，概述了场景准备和数据收集的工作流程。

首先，交叉口布局被解析，以获取关于单个车道和可能的目的地的信息。通过将布局存储为结构化的JSON格式，使得车辆运动分析更加普及和便利。解析有助于理解交叉口是如何布置的，这在确定车辆将通过的位置以及可能发生事故的位置时至关重要。作者假设最初的测试将在一个多车道四足城市交叉口进行，如图4所示，该交叉口可以使车辆向不同方向行驶。每个腿都有用于特定目的的车道，包括只能向前行驶和向左或右转弯。这使得通过特定车道避免左转和右转冲突的交通流量得以在’交叉’部分通行。

表格1显示了用于定义环境的不同属性。车辆类中的每个实例代表一辆驶向交叉口的车辆。车辆类中的方法用于验证输入、计算时间和确定运动。输入验证负责检查所有车辆数据属性的正确性，包括非负速度、距离大于零和有效方向。时间计算方法旨在确定在考虑了车辆当前行驶速度以及距离交叉口还有多远的情况下，这辆车还需要多长时间才能到达交叉口。因此，运动确定在此处将车辆的运动提前分类为某些类型，如交叉口、车道和目的地等。

车辆通过读取车辆的JSON场景数据并为其创建一个目标来解析。为了避免重复车辆ID，系统在确保所有请求的信息正确的同时进行确认。这使得原始场景数据变成了可以进行进一步分析的有组织的目标。

Prompt Design

为了正确地导航框架并利用LLM功能，作者创建了使用思路链法的方法。这使得LLM能够进行情境分析，识别可能的冲突并提供建议。这些 Prompt 的构造包含了关于交通情况、车辆状况和潜在冲突的详细信息，以便LLM能够针对案例做出决策。表2说明了应用的一个示例 Prompt 。这个 Prompt 使得LLM能够获取关于交通的背景信息，并给出最佳管理交叉口的具体位置指导。

Conflict Detection

创建车辆场景需要仔细考虑冲突检测，这涉及多个连续步骤。首先，系统分析特定类型的运动是否可能使车辆在道路上交叉。例如，相反方向行驶而不转弯的车辆可能根本不会交叉对方的道路。然后，它评估是否有任何车辆可能在短时间内抵达交叉口，可能创建潜在的冲突。

您是一个四岔路口交通冲突检测器，负责监控来自北、东、南、西四个方向的交通。每个方向有两个车道引导车辆到不同的目的地：

北：车道1引导车辆到F和H，车道2引导车辆到E、D和C。
东：车道3通向H和B，车道4通向G、E和F。
南：车道5引导车辆到B和D，车道6引导车辆到A、G和H。
西：车道7引导车辆到D和F，车道8引导车辆到B、C和A。

分析所有方向和车道的交通数据，并确定交叉口上是否存在车辆冲突。仅输出冲突检测结果为“Yes”或“No”。

输出：

如果存在冲突，请提供以下报告结构：冲突状态：说明是否检测到冲突（例如，“冲突检测到。”）。冲突概述：提及冲突的数量和涉及的车辆（例如，“冲突数量：1。涉及的车辆：车辆V1234和车辆V5678。”）。行动与决策：总结任何关键决策或采取的行动（例如，“决策：车辆V5678必须让行车辆V1234。”）。优先级分配：列出车辆及其分配的优先级（例如，“车辆V1234：优先级1，车辆V5678：优先级2。”）。车辆等待时间：提供每辆车的等待时间（例如，“车辆V1234：5秒，车辆V5678：10秒。”）。

在存在冲突的情况下，输出格式必须完全遵循上述结构。

表格2：一个已使用的 Prompt 示例。

为了处理这些识别出的冲突，系统应用了交通优先级规则来确定车辆是否应该让行。在开发这些规则时，会考虑运动类型（左转、直行或右转）和诸如到达时间及相对位置等因素。系统还计算了较低优先级车辆在交叉口等待的时间，如图4所示，其中捕获了冲突和优先级决定，包括移动前的等待时间。

该过程从系统初始化开始，其中交叉口布局数据——对于理解可能运动至关重要——被读取并组织。然后，生成一个包含各种类型车辆的随机车辆场景，并为每辆车辆创建一个车辆目标。预定义的交通规则识别冲突并指定哪些车辆应该让路，但LLM超越了简单的规则应用。在评估初始条件后，LLM实时审查每个检测到的冲突，并提供上下文解释。它考虑了车辆位置、速度和预测到达时间等因素，以建议采取具体行动。通过在让路决策和速度调整方面提供上下文感知驾驶员指导，LLM增强了基于规则的系统，使其交互更具适应性和人性化。在无冲突的情况下，保留场景数据以完整呈现，并为人类理解生成文本描述。该过程在所有步骤完成后继续进行，为让路车辆和冲突、决策以及等待时间确定等待时间。

该系统还利用标准的道路交通优先规则来确定 conflicting 车辆之间的优先权。打算直行的车辆通常优先于打算转弯的车辆。例如，如果一辆车要左转，它必须等到所有右转的车辆都通过了路口。如果两辆车同时到达，没有明确的优先级，那么右侧车辆优先。这些规则对于根据普通交通法规解决冲突至关重要。

以下是我对您提供的英文AI学术论文的翻译：

以一个场景为例，假设有四辆汽车正在驶向一个交叉口。汽车V217从北部车道2以40公里/小时的速度驶来，距离交叉口80米，朝向目的地E。汽车V218从东部车道4以40公里/小时的速度驶来，距离交叉口80米，朝向目的地G。汽车V219从南部车道6以40公里/小时的速度驶来，距离交叉口80米，朝向目的地A。最后，汽车V220从西部车道8以40公里/小时的速度驶来，距离交叉口80米，朝向目的地C。在这个场景中，系统为V217、V218、V219和V220创建了车辆目标，计算每辆车辆到达交叉口的时间。根据车道和目的地，系统确定所有车辆都可能进行左转，导致它们同时接近时可能出现潜在冲突。根据交通规则，系统决定哪些车辆必须让路。例如，如果V218来自右侧，那么V217可能会让路给V218。为每个让路的车辆计算等待时间，并记录和描述冲突数据，包括决策和等待时间，以便人类理解。

然而，为了使场景更具可解释性，作者使用了一种系统将其转换为人类可读的文本描述。该系统接收场景数据，并提取出每辆车的关键细节。对于每辆车，解释都指定了车道、目的地点、速度、与交叉口或穿越路径的距离以及接近方向。然后将这些描述汇总为一个连贯的整体，概述了整个场景发生的情况。

Model Selection and Fine-Tuning

作者在三个不同的模型上测试了作者的新范式（即，将LLM作为交通控制器）包括GPT-mini，Gemini和Llama。这些模型被选择，因为它们能够解决自然语言问题，并且有可能在不断变化的环境中实时理解交通情况。作者使用两种学习方法进行了测试，包括零样本学习和微调。这使作者能够分析它们在各种任务中的有效性。

GPT-模型迷你版已经进行了缩减，以便在处理速度上超过较大的模型，并在三个数据集上进行了微调。第一个数据集是一个四辆车的数据集，而第二个数据集包含了八辆车的数据，例如每个场景中范围在2到8辆汽车之间的混合数据。这个混合数据集是根据一个假设创建的，即性能会在各种交通复杂度下得到提升。

对于微调后的模型，使用训练和验证数据集来调整模型以适应特定的冲突检测任务。另一方面，零样本模型没有针对特定任务进行微调，而是在测试数据集上直接进行评估。这种方法测试了模型在没有专用训练的情况下对新任务进行泛化的能力，从而提供了关于其在城市交通控制系统中的基础知识的洞察。

作者研究了这些模型在微调和零样本设置下的性能。作者的目标是确定LLM如何有效地适应现实世界的交通管理任务。因此，作者对每个LLM模型进行了分析，使用诸如准确率、精确度、召回率和F1分数等分类指标，以及通过ROUGE-L分数测量其生成交通场景详细分析的能力。作者使用基于Python的模拟模型测试了LLM的输出。

Analysis and Results

Logical Reasoning Results

在本节中，作者提出了使用LLM识别交叉口场景中的冲突结果。具体而言，作者在微调的GPT-mini、Gemini和Llama以及零样本条件下评估了这些模型在不同交通状况下的泛化能力。需要注意的是，这些数据集被设计为包含不同数量的车来评估这些模型在不同交通条件下的泛化能力。

根据参与车辆的数量，数据集进行了划分。4辆车数据集涉及仅在道路交叉口有4辆车的场景，而8辆车数据集则全部是8辆汽车在类似位置。作者还使用了一个混合车辆数据集，其中输入到LLM的车辆场景数量在2到8辆之间，总共分为3组，每组10,000个场景，包括7,000个用于训练，2,000个用于测试，1,000个用于验证。仅使用测试数据集进行零样本评估。测试数据集用于评估微调模型的性能，训练和验证则用于微调。表4总结了LLM在定义交叉口检测冲突方面的性能。

微调的GPT-mini模型在混合车辆场景下实现了83%的最高准确率，表明其在具有不同车辆数量场景上的泛化能力优越。在多样化的数据集上进行微调可能有助于其表现出强大的鲁棒性。0.85的高召回率表明该模型能有效识别实际冲突场景，这在应用场景中忽视冲突可能带来严重后果时至关重要。GPT-mini 4车辆微调模型表现良好，准确率为81%。这表明即使训练于具有固定车辆数量的场景，模型仍可实现高性能，尽管略低于混合数据集对应模型。与混合模型相比，准确性降低可能是由于过拟合于仅包含四辆车的场景，限制了其泛化到更多样化情况的能力。GPT-mini 8车辆微调模型的准确性降至71%，表明具有更高车辆数量的场景更具挑战性。

额外车辆引入的复杂性可能需要更复杂的建模或更大的数据集来捕捉在这种场景中的交互细节。零样本模型通常比微调后的模型表现不佳。混合GPT-mini零样本模型达到了61.9%的准确率，突显了微调对专业任务的重要性。没有针对特定任务进行训练，模型很难捕捉到交叉口场景中的冲突检测的复杂性。Gemini模型在微调和零样本设置中的表现都相对较低。其中，Gemini 1.5零样本混合模型在微调后达到了61.4%的最高准确率。这表明Gemini架构可能不适合这个分类任务，或者与GPT-mini模型相比，微调过程效果较差。Meta-Llama模型，特别是Meta-Llama-3.1-70B在4辆车辆上进行微调的模型，通过微调实现了中等改进，达到了平衡的F1得分0.51和51.5%的准确率。然而，由于缺乏对复杂交通冲突检测的优化，它们仍然落后于GPT-mini模型。这一比较强调了微调在多样化数据集上的有效性，并突显了GPT-mini架构在复杂交通场景中的适用性，如图6所示。

为了理解微调的GPT-mini模型的性能，作者对最佳性能的模型进行了混淆矩阵分析。图7呈现了不同场景下GPT-mini模型的混淆矩阵。三款微调后的混合车辆GPT-mini模型在三种模型中表现最好，具有更多的真阳性（820）和真阴性（849），以及更少的假阴性（180）和假阳性（151）。这表明该模型在正确识别冲突和非冲突场景方面非常擅长。将4辆车的微调GPT-mini模型与混合模型进行比较，作者观察到真阳性（797）和真阴性（830）略有降低，而假阴性（203）和假阳性（170）有所增加。这表明仅针对四辆车进行训练的模型可能不如混合模型有效，导致误分类率较高。8辆车的GPT-mini模型在混合和4辆车的模型中的性能下降，假阴性（324）和假阳性（255）的数量增加。这加强了之前观察到的现象，即具有更多车辆的场景增加了复杂性，挑战了模型准确分类冲突场景的能力。

Decision-Making and Feedback Results

在本节中，作者对在4辆车辆和混合车辆场景下，驾驶员所接收到的微调GPT-mini模型提供的决策和反馈进行了测试。评估采用基于四项测量的ROUGE-L分数，包括识别冲突、决策、优先级分配和等待时间。使用Python模拟找到真实值，并由交通工程专家进行验证。首先，识别冲突涉及检测车辆路径可能相交的潜在点，或其到达时间可能导致交叉口碰撞风险。其次，决策指的是在冲突场景中为每辆车确定行动，例如，一辆车是否应该让行、前进或调整速度以避免碰撞。第三，优先级分配涉及根据交通规则为车辆分配路权，例如，给直行车辆优先权，或应用右侧通行原则。最后，等待时间衡量车辆在冲突情况下必须在交叉口等待的时间，通常由于路权较低或让行要求。

如图8所示，各种场景下的ROUGE-L分数。在4辆车的场景中，微调的GPT-mini模型在所有组件上都获得了较高的ROUGE-L分数，冲突概述部分得分0.95。这表明该模型可以准确、连贯地总结冲突在更简单的场景中。决策部分得分为0.91，展示了模型根据交通规则解释和解释所做决策的能力。优先级分配（0.94）和车辆等待时间（0.92）的较高分数进一步展示了模型在分配优先级和计算车辆等待时间方面的熟练程度。对于混合车辆场景，ROUGE分数稍低但仍然强大。冲突概述部分得分为0.84，决策部分得分为0.81。这些结果表明，随着场景的复杂性增加，车辆数量的变化，模型在准确总结冲突方面面临更多挑战。然而，模型仍保持令人满意的表现，表明其处理复杂场景的有效性。优先级分配（0.87）和车辆等待时间（0.86）的得分分别反映了模型在更复杂的场景中应用交通规则和计算必要延迟的能力。决策部分在两种场景类型中始终保持较高分数，强调了模型对交通规则的深入理解及其在不同情况下的应用能力。混合车辆场景的得分略有下降，这突显了复杂性的增加，但也表明模型适应得相当好。这些结果表明，微调的GPT-mini模型不仅在二分类冲突场景方面表现出色，而且还能生成详细、连贯的分析。即使在复杂场景中，模型在关键组件上的高绩效也为其在需要详细解释的实际应用中提供了有前景的保证。

关键组件的高ROUGE分数表明，该模型可以通过提供准确的冲突检测和可行决策，有效地支持交通管理任务。在实际应用中，这些能力可以通过使交叉口实现主动预防事故和减少拥堵，从而提高交通流量的效率和安全。

ROUGE-L 分数对比：微调的 GPT-mini-4o 微调的 GPT 模型在表5 中的输出展示了其识别潜在冲突并针对接近交叉口的车提供精确建议的能力。在检测到冲突的场景中，如车辆 V4625 和 V1909 之间或车辆 V7019 和 V5264 之间，模型根据车辆的距离、速度和预期路径提出实际可行的措施，如让行或减速，以优先考虑安全并尽量减少碰撞风险。例如，模型建议车辆 V1909 让行车辆 V4625，因为后者在距离上具有优势，同时建议车辆 V7019 让行车辆 V5264，以避免交叉口拥堵。相反，模型建议所有车辆在没有调整的情况下继续行驶，准确地识别出安全的情况。这种方法适用于更复杂的场景，如北行和西行车辆 V9867 和 V6070 之间的冲突，模型提出 V9867 稍微让行以确保安全通行，这展示了其对合作交通流的细致理解。将冲突检测与定制、实时指导相结合，模型展示了交叉口管理的结构化和响应式框架，支持多车辆环境中的自动化安全与效率。

Conclusion

本研究提出了一种新的交通控制系统范式，将LLM（语言模型）作为动态交通控制器。利用其逻辑推理、场景理解及决策能力，LLM能够适应实时交通状况，在考虑安全、减少拥堵和环境影响的同时优化通行能力。通过4D交通控制系统框架（即检测、决策、传播和部署），LLM将传统由相互独立的组件管理的过程进行集中处理。LLM整合了多种数据来源（如环形检测器、GPS、视频成像等），以做出情境感知决策，并通过各种模块通过不同的通信渠道（如语音、无线信号、代码和图像等）为驾驶员、基础设施和自动驾驶车辆提供定制的控制输出和反馈。LLM能够处理多目标优化函数，从而改变城市出行方式。作者在这项研究中认为，由于LLM在通信方面的适应性、与人类的交互以及与机器的接口，这可能确保在复杂交通场景中遵守和安全性。

作者提出了一种将LLM集成并评估为实时交通控制系统控制器的 methodology，该方法包括四个关键阶段：数据创建和初始化、 Prompt 生成、冲突识别和模型分析微调。首先，作者提出了一种系统，该系统生成了反映真实世界多车道四腿城市交叉口场景的数据集。作者还解析了每个车辆的详细交叉口布局、车道配置和车辆属性，如速度、方向和目的地。这些数据集组织为车辆目标，以便进行场景模拟和冲突检测以找到真实值。使用连续思维方法设计的 Prompt 引导LLM分析交叉口条件，检测潜在冲突，并建议基于优先级的交通决策。冲突解决包括传统的交通规则，如右侧通行规则和让路优先级。这些冲突解决方案通过LLM对车辆位置、速度和到达时间的上下文感知分析进行增强。这种多阶段方法不仅提高了冲突检测，还提供了与实际规定相适应的适应性、上下文敏感的交通管理解决方案。作者测试了三种不同的LLM模型，包括GPT-mini、Gemini和Llama。作者使用准确性、精确度、召回率、F1得分和ROUGE-L来评估结果。

研究结果显示，LLM（特别是经过微调的GPT-mini模型）在交通 intersection 场景中具有显著的高识别冲突和支撑决策的能力。值得注意的是，Gemini和Llama模型通过微调也显示出改进的潜力，但它们的性能仍低于GPT-mini模型。这可能是因为架构限制或针对此特定任务的优化效果不佳。然而，经过微调的GPT-mini在混合车辆场景中实现了约83%的高准确率和0.84的F1得分，反映了其在不同交通条件下的泛化能力。这一性能得到了约0.85和0.83的高召回率和精确率的支持，分别表明LLM在检测实际冲突方面的可靠性，这是实时交叉口控制应用中至关重要的一个方面。

研究结果还表明，经过微调的GPT-mini模型在生成详细、可操作的决策和交通管理洞察方面表现出色。在交通专家的帮助下，LLM模型在四个关键组件上实现了较高的ROUGE-L分数，包括冲突识别约为0.95，决策约为0.91，优先级分配约为0.94，等待时间约为0.92。这些结果表明，LLM可以在考虑车辆的速度、距离和路径以及其他车辆接近交叉口的情况下，根据车辆的实际情况提供一致、精确的建议，如减速、停车或让行。

本研究的结果展示了LLMs的潜力和改变交通控制系统的能力。它可以在交叉口提高交通流效率和安全。它处理简单和复杂场景的能力使其成为实时交通管理系统中实现实时交通管理和向驾驶员、基础设施和自动驾驶车辆提供反馈的有前途的工具。然而，未来的工作将专注于在高度密集的交通场景中进一步提高性能，并将模型集成到实时交通管理应用程序中。