AI论文速读 | 【综述】城市计算中跨域数据融合的深度学习:分类、进展和展望

news2025/1/12 15:58:45

题目:Deep Learning for Cross-Domain Data Fusion in Urban Computing: Taxonomy, Advances, and Outlook

作者:Xingchen Zou, Yibo Yan, Xixuan Hao, Yuehong Hu, Haomin Wen(温皓珉), Erdong Liu, Junbo Zhang(张钧波), Yong Li(李勇), Tianrui Li(李天瑞), Yu Zheng(郑宇), Yuxuan Liang(梁宇轩)

机构:香港科技大学(广州),京东科技&京东智能城市,清华大学,西南交通大学

关键词:城市计算,数据融合,多模态数据,大语言模型,可持续发展

网址:https://arxiv.org/abs/2402.19348

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

Cool Paper:https://papers.cool/arxiv/2402.19348

`标题与作者
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要:

随着城市的不断发展,城市计算通过利用不同来源(例如地理、交通、社交媒体和环境数据)和模态(例如时空数据,视觉和文本模态)的跨域数据融合的力量,成为可持续发展的关键学科。 最近,看到利用各种深度学习方法促进智慧城市跨域数据融合的上升趋势。 为此,提出了第一篇综述——系统地回顾了为城市计算量身定制的基于深度学习的数据融合方法的最新进展。 具体来说,首先深入研究数据视角,以理解每种模式和数据源的作用。 其次,将该方法分为四个主要类别:基于特征、基于对齐、基于对比和基于生成的融合方法。 第三,将多模态城市应用进一步分为城市规划、交通、经济、公共安全、社会、环境和能源七类。 与之前的综述相比,本文更关注深度学习方法与城市计算应用的协同作用。 此外,还阐明了大型语言模型(LLM)和城市计算之间的相互作用,提出了可能彻底改变该领域的未来研究方向。 作者们坚信(firmly believe),综述中所描述的分类、进展和前景将极大地丰富研究界。

跨域城市计算蓝图。 左:通过数据融合过程整合来自不同模式的城市数据,包括时空、视觉、文本和其他模态。 右图:城市数据的多种来源,例如地理数据、交通、社交媒体、人口和环境。

本篇综述的动机:深度学习带来的范式转变使得之前关于城市数据融合的综述,有些过时了,因为传统的分类法可能无法恰当地捕捉这些先进方法之间的细微差别和差异。 鉴于这个问题,该综述致力于弥补这一差距,并通过提供符合深度学习时代的全面且更新的分类法来提供当代视角。

Q: 这篇论文试图解决什么问题?

A: 这篇论文旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。城市计算是一个多学科领域,它利用来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据融合来支持城市的可持续发展。随着城市化进程的加快,城市计算在解决能源消耗、环境污染、社会经济差异和交通问题等全球性挑战中发挥着越来越重要的作用。

论文的主要贡献和解决的问题包括:

  1. 数据视角:深入理解每种数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体和公民生成数据)在城市计算中的作用。
  2. 方法分类:将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  3. 应用分类:将多模态城市应用分为七类:城市规划、交通、经济、公共安全、社会、环境和能源。
  4. 深度学习与城市计算的结合:探讨深度学习方法与城市计算应用的结合,特别是大型语言模型(LLMs)在城市计算中的应用前景。
  5. 未来研究方向:提出未来研究的方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。
  6. 资源和实践应用:提供资源和实践应用的详细说明,帮助研究人员和利益相关者更好地理解城市数据模态的复杂性,并通过深度学习方法进行有效的数据融合。

通过这些贡献,论文旨在为城市计算领域的研究人员提供一个全面的资源,促进该领域的发展,并为解决城市化带来的挑战提供新的视角和工具。

Q: 有哪些相关研究?

相关综述与本文的比较(3方面:重点关注范围,相关模态和主要关注的主题)

A: 论文中提到了多个与城市计算和跨域数据融合相关的研究工作。以下是一些关键的相关研究:

  1. Zheng et al. (2015): 提供了跨域大数据融合方法的全面综述,特别是在城市计算领域。这项工作强调了跨域数据融合在整合多个信息源方面的关键作用。
  2. Wang et al. (2020): 对深度学习在时空数据挖掘中的应用进行了详尽的回顾,特别关注了多源时空数据的融合。
  3. Liu et al. (2020): 提供了城市大数据融合方法的总结,这些方法在2020年之前被广泛研究。
  4. Xie et al. (2020): 研究了基于生成对抗网络(GAN)的时空数据融合模型,特别是在人群流动预测方面。
  5. Yuan and Li (2021): 在智能交通领域,探讨了深度学习在城市计算中的应用。
  6. Afyouni et al. (2022): 研究了在社会事件检测中的应用,这是城市计算的一个子领域。
  7. Gao et al. (2022): 总结了基于生成对抗网络的融合模型,特别是在时空数据方面。
  8. Deldari et al. (2022): 集中在多模态数据融合的自监督表示学习上,这是一般领域的研究。
  9. Gao et al. (2023): 提出了一种基于Transformer的模型,用于交通需求预测,结合了多视图信息。
  10. Wang et al. (2023): 提出了一种基于扩散模型的街道视图图像生成方法,用于城市计算。
  11. Zhang et al. (2023): 提出了一种基于LLM的城市区域嵌入方法,用于城市计算。

这些研究为城市计算领域的数据融合提供了不同的视角和方法,涵盖了从基础理论到实际应用的广泛范围。论文通过这些相关工作,展示了城市计算领域在深度学习和数据融合方面的最新进展,并指出了未来研究的潜在方向。

Q: 论文如何解决这个问题?

A: 论文通过以下几个关键步骤来解决城市计算中跨域数据融合的问题:

  1. 系统分类:首先,论文提出了一个新颖的分类法,将现有的城市数据源分为五种类型(地理数据、交通数据、社交媒体数据、人口统计数据和环境数据),并从模态的角度(时空数据、视觉数据、文本数据等)对数据进行分类。这种分类有助于系统地理解和分析城市计算研究中使用的不同数据类型。
  2. 融合方法综述:论文详细回顾了城市计算中使用的融合方法,并将它们分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。每一类方法都有详细的技术描述和实例分析。
  3. 应用场景分析:论文进一步将城市应用分为七个领域:城市规划、交通、经济、公共安全、社会、环境和能源。对于每个领域,论文探讨了数据融合方法如何支持特定的下游任务。
  4. 数据集编译:为了支持研究和实践,论文全面编译了城市计算中常用的数据集,考虑了它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向:论文提出了未来研究的潜在方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。这些方向旨在解决当前城市计算领域面临的挑战,并推动该领域的发展。
  6. LLMs与城市计算的结合:论文探讨了大型语言模型(LLMs)在城市计算中的应用,特别是在处理多模态和多源数据方面。LLMs的引入为城市计算提供了新的视角和工具。
  7. 资源和实践应用:论文提供了一个全面的资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

通过这些步骤,论文不仅为城市计算领域的研究人员提供了一个全面的资源,而且为解决城市化带来的挑战提供了新的视角和工具。

综述中的城市计算中基于深度学习的跨域数据融合的分类框架。 该框架自下而上围绕三个维度构建:数据、融合方法和应用。 在每个视角中,将现有研究分为不同类别,以提供全面且组织良好的回顾。

Q: 论文做了哪些实验?

A: 在这篇论文中,作者并没有进行实验来验证某个特定的模型或算法,而是进行了一项全面的文献综述。这项综述旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。因此,论文的重点在于理论分析、方法论的分类和未来研究方向的提出,而不是实验验证。

论文的主要贡献包括:

  1. 数据视角的分析:对城市计算中使用的不同类型的数据源和模态进行了分类和讨论。
  2. 融合方法的分类:将现有的数据融合方法分为四类,并提供了每种方法的详细描述和应用实例。
  3. 应用领域的分类:将城市计算的应用分为七个主要领域,并探讨了深度学习在这些领域中的应用。
  4. 数据集的编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向的提出:基于当前研究的局限性和挑战,提出了未来研究的潜在方向。
  6. LLMs与城市计算的结合:探讨了大型语言模型(LLMs)在城市计算中的应用前景。

由于这项工作的性质是文献综述,所以没有包含实验部分。相反,作者通过分析现有的研究工作来建立一个全面的理论框架,并为未来的实证研究提供指导。

数据视角的分析

地理数据,交通数据,社交网络数据,人口数据,环境数据及其它。

城市计算跨域数据融合范围内强相关论文中数据集类型的比例。

融合方法的分类

基于特征融合,基于对齐融合,基于对比融合和基于生成融合

城市计算基于深度学习跨域数据融合的方法分类

应用领域的分类

城市规划,经济,社交,能源,交通,公共安全以及环境

城市计算中跨域数据融合的应用(类别)和常见下游任务(子类别)的分类

数据集的编译

地理数据,交通数据,社交网络数据,人口数据和环境数据

在城市计算中用于跨域数据融合的开源数据集的分类和总结

城市计算中基于深度学习的跨域数据融合模型的总结。方法名称将基于原始引用模型名称进行分配;否则,它们将以第一作者的名字命名。

Q: 有什么可以进一步探索的点?

A: 论文提出了几个未来研究方向,这些方向为城市计算和跨域数据融合领域的研究提供了潜在的探索点:

  1. 大型语言模型(LLMs)的应用:探索LLMs在城市计算中的应用,特别是在处理多模态和多源数据方面。研究LLMs如何与城市数据融合相结合,以及它们在城市分析和预测中的潜在作用。
  2. 智能体模拟(Agent-based Simulation):开发基于LLM驱动的智能体模型,以模拟城市动态并提高城市系统的适应性和响应性。这可以帮助创建更加智能和响应性强的未来城市。
  3. 多模态因果学习:研究如何将因果推断技术应用于城市数据,以提高对城市系统复杂动态的解释能力。这包括开发新的算法和技术来理解和预测城市环境中的因果关系。
  4. 多源数据隐私保护:研究如何在保护个人隐私的同时利用多源数据进行城市计算。这涉及到开发新的隐私保护技术,如差分隐私和联邦学习。
  5. 开放基准(Open Benchmark):合作开发标准化的数据格式、统一的评估指标和共享基准,以便于跨域数据融合模型的评估和比较。
  6. 下游任务多样性:扩展城市研究的范围,涵盖更多领域的应用,如经济、社会和环境,以全面理解城市环境中的挑战。
  7. 计算效率:优化城市计算模型的计算效率,包括模型压缩、高效训练和高效架构设计,以提高模型在实际城市环境中的可行性和有效性。
  8. 跨域数据融合的挑战:解决跨域数据融合中的具体挑战,如数据异构性、数据质量、数据集成和模型泛化能力。

这些研究方向不仅有助于推动城市计算领域的科学进步,而且对于解决实际城市问题和提高城市生活质量具有重要意义。

Q: 总结一下论文的主要内容

A: 这篇论文提供了一个全面的综述,专注于城市计算领域中跨域数据融合的最新进展,特别是深度学习方法的应用。以下是论文的主要内容总结:

  1. 背景与动机:随着城市化进程的加快,城市计算成为了一个关键领域,它通过整合和分析来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据来支持城市的可持续发展。
  2. 数据视角:论文首先从数据的角度出发,探讨了城市计算中使用的不同数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体等)的作用。
  3. 方法分类:提出了一个新颖的分类法,将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  4. 应用领域:将城市计算的应用分为七个主要领域,包括城市规划、交通、经济、公共安全、社会、环境和能源,并探讨了深度学习在这些领域的应用。
  5. 数据集编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  6. 未来研究方向:指出了城市计算领域中的一些潜在研究方向,如LLMs的应用、智能体模拟、多模态因果学习、数据隐私保护、开放基准、下游任务多样性和计算效率。
  7. LLMs与城市计算:探讨了大型语言模型(LLMs)与城市计算的结合,以及它们在处理多模态和多源数据方面的潜力。
  8. 资源和实践应用:提供了一个资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

总的来说,这篇论文为城市计算领域的研究人员提供了一个全面的资源,展示了深度学习在跨域数据融合中的应用,并为未来的研究提供了新的方向和视角。

项目概览

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

项目目录:

  • 相关综述
  • 分类框架
  • 数据融合方法
  • 开源数据集的分类总结
  • 强相关的论文列表

项目内容

相关综述

按照时间顺序的相关综述

相关综述

分类框架

分类框架

数据融合方法

数据融合方法

数据融合方法分为4类:

  1. 基于特征(Feature Based Data Fusion
  2. 基于对齐(Alignment Based Data Fusion
  3. 基于对比(Contrast Based Data Fusion
  4. 基于生成(Generation Based Data Fusion

开源数据集的分类总结

开源数据集的分类总结

开源数据集的分类总结分为(分类,内容,形式):

  1. 地理数据(Geographical Data)
    1. 卫星图像(Satellite Image):图像
    2. 街道图像(Street View Image):图像
    3. POIs:点向量(Point Vector)
  2. 交通数据(Traffic Data)
    1. 交通轨迹(Traffic Trajectory):时空轨迹
    2. 交通流(Traffic Flow):时空图
    3. 路网(Road Network):时空图
    4. 物流(Logistics):时空轨迹
  3. 社交网络数据(Social Network)
    1. 文本(Text):文本
    2. 地理标记的图像和视频(Geo-tagged Image&Video):图像和视频
    3. 用户信息(Users’ Info):时间序列
  4. 人口统计数据(Demographic Data)
    1. 犯罪(Crime):时间序列
    2. 土地利用(Land Use):时间序列
    3. 人口(Population):时序
  5. 环境数据(Environmental Data)
    1. 气象(Meteorology):时间序列
    2. 绿化(Greenery):时间序列
    3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

强相关的论文列表

国内外高校和企业里时空数据挖掘相关的团队有哪些?
环境数据(Environmental Data)

  1. 气象(Meteorology):时间序列
  2. 绿化(Greenery):时间序列
  3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

[外链图片转存中…(img-CBkZy1XP-1709808431165)]

国内外高校和企业里时空数据挖掘相关的团队有哪些?
https://www.zhihu.com/question/617528629/answer/3177883285
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1497482.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文读懂HDMI的演变-从HDMI1.0到HDMI2.1(建议收藏)

HDMI,全称为(High Definition Multimedia Interface)高清多媒体接口,主要用于传输高清音视频信号。 HDMI System HDMI系统包括HDMI的source和HDMI的sink, 其中source 是源端,即信号的来源;Sink的接收端&a…

2024最新GPT4.0使用教程,AI绘画,一站式解决

一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以和…

Unity类银河恶魔城学习记录8-4 P80 Blackhole ability state源代码

Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释,可供学习Alex教程的人参考 此代码仅为较上一P有所改变的代码 【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili Entity.cs using System.Collections; using System.Collections.Generic…

13年测试老鸟,接口性能测试-压测总结汇总,一文概全...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 1、概述 性能测试…

Unity性能优化篇(四) GPU Instancing

使用GPU Instancing可以在一个Draw Call中同时渲染多个相同或类似的物体,从而减少CPU和GPU的开销。 官方文档:https://docs.unity3d.com/Manual/GPUInstancing.html 启用GPU Instancing,我们可以选中一个材质,然后在Inspector窗口…

1.3 数据库系统的结构

目录 1.3.1 数据库系统模式的概念 1.3.2 数据库系统的三级模式结构 1. 模式 2. 外模式 3.内模式(也称存储模式) 1.3.3 数据库的二级映像功能与数据独立性 1.外模式/模式映像 2.模式/内模式映像 1.3.4 总结 模式 内模式…

Vue+OpenLayers7入门到实战:OpenLayers7如何使用gifler库来实现gif动态图图片叠加到地图上

返回《Vue+OpenLayers7》专栏目录:Vue+OpenLayers7 前言 OpenLayers7本身不支持gif图片作为图标要素显示到地图上,所以需要通过其他办法来实现支持gif图片。 本章介绍如何使用OpenLayers7在地图上使用gifler库先生成canvas画板,然后通过canvas画板的重绘事件来重新渲染地图…

通过Dockerfile创建镜像

通过Dockerfile创建镜像 Docker 提供了一种更便捷的方式&#xff0c;叫作 Dockerfile docker build命令用于根据给定的Dockerfile构建Docker镜像。 docker build语法&#xff1a; # docker build [OPTIONS] <PATH | URL | -> 1. 常用选项说明--build-arg&#xff0c;设置…

【剑指offer--C/C++】JZ6 从尾到头打印链表

一、题目 二、本人思路及代码 直接在链表里进行翻转不太方便操作&#xff0c;但是数组就可以通过下标进行操作&#xff0c;于是&#xff0c; 思路1、 先遍历链表&#xff0c;以此存到vector中&#xff0c;然后再从后往前遍历这vector,存入到一个新的vector&#xff0c;就完成…

2024年最佳WordPress奖励插件

谁不想获得奖励呢&#xff1f;当激励客户返回您的网站时&#xff0c;它的价值就会增加。为了让您更轻松地完成此任务&#xff0c;在本文中&#xff0c;我编译了16个最佳WordPress奖励插件&#xff0c;这些插件为您的客户提供了坚持使用您的网站的充分理由。此外&#xff0c;您无…

Android视角看鸿蒙第一课(工程目录)

Android视角看鸿蒙第一课&#xff08;工程目录&#xff09; 导读 鸿蒙马上就来了&#xff0c;这个工作很有可能落到Android开发的头上&#xff0c;既是机遇也是挑战&#xff0c;希望能跟上时代的浪潮&#xff0c;迫不得已开始学习鸿蒙开发&#xff0c;顺带分享记录下 我的学…

快速排序hoare优化

目录 三数取中法选key 优化点 基本思想 代码实现 小区间优化 优化点 基本思想 代码实现 由于hoare版快排在一些特殊情况下性能并不优&#xff0c;这里我们进行一些优化。 三数取中法选key 优化点 当数据有序时&#xff0c;快排就会很吃力&#xff0c;这是为什么呢…

电脑工作电压是多少你要看看光驱电源上面标的输入电压范围

要确定电脑的工作电压&#xff0c;必须查看电源上标注的输入电压范围。 国内法规规定民用220V电压范围为10%-15%&#xff0c;也就是说通信220V电压正常范围为187--242V&#xff0c;供电设备一般为180V。 --250V电压范围&#xff0c;即正常情况下电脑电源电压不低于187V即可工作…

linux命令行或桌面 显卡压力测试

windows下的压力测试非常简单&#xff0c;有很多图形化的测试工具 在github上找到一个项目&#xff1a;github链接 1.下载工具 cd /usr/localgit clone https://github.com/wilicc/gpu-burn如果没有安装git&#xff0c;则先安装 apt-get install git2.安装 cd /usr/local/…

Elasticsearch:dense vector 数据类型及标量量化

密集向量&#xff08;dense_vector&#xff09;字段类型存储数值的密集向量。 密集向量场主要用于 k 最近邻 (kNN) 搜索。 dense_vector 类型不支持聚合或排序。 默认情况下&#xff0c;你可以基于 element_type 添加一个 dend_vector 字段作为 float 数值数组&#xff1a; …

最新基于R语言lavaan结构方程模型(SEM)技术应用

结构方程模型&#xff08;Sructural Equation Modeling&#xff0c;SEM&#xff09;是分析系统内变量间的相互关系的利器&#xff0c;可通过图形化方式清晰展示系统中多变量因果关系网&#xff0c;具有强大的数据分析功能和广泛的适用性&#xff0c;是近年来生态、进化、环境、…

【实战】K8S集群部署nacos并接入Springcloud项目容器化运维

文章目录 前言Nacos集群搭建Spring cloud配置nacos将Springcloud项目部署在k8s写在最后 前言 相信很多同学都开发过以微服务为架构的系统&#xff0c;开发微服务必不可少要使用注册中心&#xff0c;比如nacos\consul等等。当然在自动化运维流行的今天&#xff0c;我们也会将注…

『操作系统OS笔记』MAC(m1芯片)电脑安装FFmpeg

MAC(m1芯片)电脑安装FFmpeg mac电脑安装ffmpeg两种方法 文章目录 1. brew安装FFmpeg2. 官网下载FFmpeg压缩包3. 使用FFmpeg将音频和视频合并 1. brew安装FFmpeg brew install ffmpeg # 需要等比较久的时间&#xff0c;安装很多东西&#xff0c;安装过程中如果遇到报错对应解决…

Unity性能优化篇(十二) 音频优化之导入音频后的属性设置

Unity支持后缀为.wav、.ogg、.mp3的音频文件&#xff0c;但建议使用.wav&#xff0c;因为Unity对它的支持特别好。 注意&#xff1a;Unity在构建项目时总是会自动重新压缩音频文件&#xff0c;因此无需刻意提前压缩一个音频文件再导入Unity&#xff0c;因为这样只会降低该音频文…

C++性能优化 —— TCMalloc的原理与使用

一、TCMalloc简介 1、TCMalloc简介 TCMalloc(Thread-Caching Malloc&#xff0c;线程缓存的malloc&#xff09;是Google开发的内存分配算法库&#xff0c;最初作为Google性能工具库 perftools 的一部分&#xff0c;提供高效的多线程内存管理实现&#xff0c;用于替代操作系统…