人工智能咨询培训老师叶梓 转载标明出处
传统的城市规划往往依赖于专业规划师的经验和判断,耗时耗力,且难以满足居民多样化的需求。近年来,大模型(LLMs)的崛起为城市规划领域带来了新的机遇。清华大学电子工程系的Zhilun Zhou及其团队在arXiv上发表的论文《Large Language Model for Participatory Urban Planning》中,提出了一种基于LLM的多智能体协作框架,用于模拟参与式城市规划过程,以生成满足居民多样化需求的城市用地规划。
参与式城市规划是一种现代城市规划的主流模式,它强调居民的积极参与。然而,这一模式面临诸多挑战,包括如何平衡不同居民的需求、如何高效地处理大量居民的参与过程等。Zhilun Zhou等人提出的解决方案是利用大模型创建模拟规划师和居民的智能体。通过精心设计的提示(prompts),这些智能体能在多智能体协作框架中模拟真实的规划过程。研究团队构建了一个框架,其中包括一个规划师智能体和数千个具有不同档案和背景的居民智能体。
方法
图 1 概述了研究者设计的参与式城市规划框架,核心在于通过智能体模拟实现居民和规划师的有效互动。初始阶段,规划师智能体基于专业知识提出土地使用草案。接着,城市区域被划分为多个社区,每个社区的居民智能体根据自身特点和需求参与讨论。利用鱼缸讨论机制,居民智能体分内外圈进行多轮讨论,以提高讨论效率并确保广泛意见的吸纳。讨论结果反馈给规划师智能体,促使其修订并优化土地使用计划。此过程循环进行,直至形成最终规划方案,确保了规划的包容性、动态性和居民满意度。
在研究者提出的参与式城市规划框架中,智能体角色的设计是至关重要的一环。这一环节的核心在于利用大模型(LLM)创建具有不同角色和任务的智能体,以模拟真实的城市规划参与者。这些智能体包括规划师和居民两种角色,这种设计确保了规划过程中能够充分考虑和平衡不同居民群体的利益和需求。
规划师设计涉及到为规划师智能体提供必要的信息和指导,使其能够从宏观角度出发,制定出符合实际的土地利用计划。研究者通过多模态输入技术,将区域地图的图像信息以及每个区域的位置描述和规划指南输入给规划师智能体。这样的设计使得规划师智能体能够更好地理解区域的空间分布,考虑到不同区域的特性和需求,生成出更加合理和现实的土地利用计划。
居民设计则更加注重个体差异和多样性。居民智能体的创建基于真实居民的档案分布,包括性别、年龄、教育水平和家庭规模等信息。这些智能体模拟的是区域内的居民,他们的需求和偏好将直接影响土地利用计划的制定。为了确保规划过程中的公平性和包容性,研究者还特意为一些居民智能体设置了特殊背景,例如单亲家庭、有病人的家庭和独居老人。这样的设计使得规划过程能够更加全面地考虑到不同居民群体的需求。
在规划工作流程中,研究者设计了一个由多智能体协作的规划过程。规划师智能体首先根据规划要求和专业知识提出一个初步的土地利用计划。这个计划将作为讨论的基础,居民智能体将基于他们的需求和偏好,对这一初步计划进行讨论和反馈。研究者将整个规划区域划分为若干个社区,并在每个社区内开展多轮讨论。通过这种方式,居民智能体可以分享他们对土地利用计划的看法,规划师智能体则可以根据这些意见和建议对计划进行修订。
为了解决居民数量庞大的问题,研究者引入了鱼缸讨论机制。这是一种在参与式规划中常用的方法,通过限制每轮参与讨论的居民数量,提高讨论的效率和质量。在每一轮讨论中,居民被随机分为内圈和外圈。内圈的居民将积极参与讨论,表达他们对土地利用计划的看法和建议,而外圈的居民则作为听众,认真倾听并吸收讨论的内容。每一轮讨论结束后,内外圈的成员进行角色交换,以确保更多的居民有机会参与到讨论中来。同时,为了避免讨论过程中上下文信息过长,研究者还会对每一轮的讨论进行总结,并将总结信息传递给所有居民。这样,即使在涉及大量居民的情况下,也能有效地控制讨论的时间成本,同时确保居民的意见和建议得到充分的考虑和平衡。通过这种设计,规划过程不仅能够考虑到居民的多样化需求,还能够提高规划的效率和参与度。
实验
研究者选择了北京的两个实际区域——回龙观(HLG)和大红门(DHM)作为实验区域。这两个区域具有不同的城市景观和社会经济特征,为研究提供了多样化的城市规划场景。研究者根据道路和现有的土地使用条件将区域划分为不同的小区,并保留了居住区和主要绿地,将其他区域视为待规划的空地。
研究者根据实际城市重建的常见情景,对HLG和DHM区域进行了划分,并根据人口普查数据生成了1000个智能体。这些智能体包括具有特殊背景的边缘群体,如独居老人、有病人的家庭、有学龄儿童的家庭等。在实验中,研究者使用了特定版本的大型语言模型,为居民和规划师提供输入,并设置了讨论轮数以及每次讨论中参与居民的数量。
为了评估所提出框架的有效性,研究者选择了六种方法作为基线进行比较,包括随机方法、集中方法、分散方法、几何集合覆盖算法(GSCA)、深度强化学习(DRL)以及人类设计师的结果。这些基线方法的实现遵循了文献中概述的既定程序。
研究者采用了两类指标来评估框架的性能:不考虑需求的指标(need-agnostic metrics)和服务需求感知的指标(need-aware metrics)。这些指标包括服务(Service)和生态(Ecology)两个不考虑个体特定需求的聚合指标,以及满意度(Satisfaction)和包容性(Inclusion)两个考虑居民特定需求的指标。
研究者的方法在需求感知指标上展现出了卓越的性能。在HLG数据集上,研究者的模型在满意度(Satisfaction)上得分为0.787,这个分数意味着居民们平均能够在他们住宅周边500米范围内访问到78.7%的他们所需的设施,这个比例比基线方法高出11.2%。这一结果显著地表明了研究者方法在满足居民具体需求方面的有效性。同时,在包容性(Inclusion)上得分为0.773,这表明边缘群体的需求得到了77.3%的满足,进一步证明了研究者方法在促进城市规划中的公平性和包容性方面的成功。
为了进一步验证模型中角色扮演和讨论机制的重要性,研究者进行了消融研究。在消融研究中,当去除角色扮演或讨论的任一组成部分时,几乎所有指标的性能都有所下降。这一发现强调了角色扮演和讨论机制在提升需求感知指标上的关键作用。特别是,去除讨论部分后,满意度和包容性指标下降了4.1%-6.3%,而去除角色扮演后,这两个指标下降了4.7%-8.0%,这表明居民的个体档案和他们之间的交流对于形成有效规划至关重要。
深入分析HLG区域居民的讨论内容以及规划师根据这些讨论修订计划的过程,研究者揭示了讨论如何帮助规划师理解并整合少数群体的观点,从而提高整个社区的满意度。例如,一些居民可能在讨论初期就对计划表示满意,而其他有特殊需求的居民则提出了增加特定设施的建议。随着讨论的进行,这些建议得到了其他居民的支持,规划师据此对计划进行了修订。
研究者还研究了鱼缸讨论中的一个关键超参数——讨论轮数(number of discussion rounds)。通过实验,他们发现随着讨论轮数从1增加到3,需求感知指标如满意度和包容性有了显著提升。然而,当讨论轮数继续增加到4时,性能并没有进一步的提升,这可能是因为过长的讨论可能导致讨论的效率降低,甚至出现性能下降的情况。这一发现为确定讨论轮数提供了实验依据,以实现在保证讨论质量的同时,避免过度延长讨论时间。
通过这些详细的实验设置和评估,研究者证明了所提出方法在参与式城市规划中的有效性和优越性。
论文链接:https://arxiv.org/abs/2402.17161