【论文分享】通过社交媒体图片和计算机视觉分析城市绿道的使用情况

城市街道为路面跑步提供了环境。本次给大家带来一篇SCI论文的全文翻译！该论文提出了一种非参数方法，使用机器学习模型来预测路面跑步强度。该论文提供了关于路面跑步的实证证据，并突出了规划者、景观设计师和城市管理者在设计适于跑步的城市街道时应考虑的关键因素。

【论文题目】

Analyze the usage of urban greenways through social media images and computer vision

【题目翻译

通过社交媒体图片和计算机视觉分析城市绿道的使用情况

【期刊信息】

Environment and Planning B Urban Analytics and City Science · January 2022

【作者信息】

Yang Song，得克萨斯农工大学景观建筑与城市规划系

Huan Ning，南卡罗来纳大学地理系

Xinyue Ye(通讯作者)，得克萨斯农工大学景观建筑与城市规划系xinyue.ye@tamu.edu

Divya Chandana and Shaohua Wang，新泽西理工学院信息系。

【论文链接】

https://doi.org/10.1177/23998083211064624

【关键词】

城市绿道、公园使用、计算机视觉、社交媒体、场所质量。

【摘要】

城市街道为路面跑步提供了环境。该研究提出了一种非参数方法，使用机器学习模型来预测路面跑步强度。这些模型是利用来自Keep这一移动运动应用的路线签到数据，以及北京核心区的街道地理信息数据开发的。结果显示，蓝色空间和路径连续性是提高路面跑步强度的最重要因素。天空开放度和街道封闭性有一个最佳设计值，需要在满足道路光照的同时与遮荫达到平衡。同时，提供适当的视觉透视性也很重要。此外，与日常活动不同的是，功能混合和功能密度较高并未对路面跑步强度产生显著的正面影响。本研究提供了关于路面跑步的实证证据，并突出了规划者、景观设计师和城市管理者在设计适于跑步的城市街道时应考虑的关键因素。

【摘要】

城市绿道是一种新兴的城市景观形式，为公共健康、经济和生态环境提供多方面的效益。然而，绿道的使用情况和用户体验往往很难衡量，因为调查这么大的区域成本很高。本文基于2017年Instagram上的帖子，采用计算机视觉(CV)技术来分析和比较普通大众如何使用两个典型的绿道公园，即纽约市的高线公园和亚特兰大的亚特兰大环线。通过人脸和物体检测分析来推断用户构成、活动和关键体验。我们展示了Instagram帖子的时间分布模式，以及从照片中检测出的群体聚会、微笑表情和代表性物体。我们的结果显示，两个公园的用户参与程度都很高，但青少年的参与明显较少。高线公园有更多的集体活动，并且在工作日比亚特兰大环线更为活跃。亚特兰大环线呈现出更强烈的逃离感和更多的体育活动。总之，结合人工智能技术后，社交媒体图片如Instagram可以为城市绿道的使用提供有力的经验性证据，这将有利于未来的景观建筑和城市设计实践。

【前言】

绿道是城市中的线性公园，通常在闲置土地、铁路线路、输电线路或水体边缘开发建设(Paneerchelvam et al., 2020)。它们在城市社区之间创建了重要的连接，并满足了各种娱乐需求(Watson, 2003)。城市的管理者设计了步行道、自行车道、水上路径、花园和农业设施，作为绿道的一部分供公众使用。绿道还连接了自然栖息地，缓解了城市地区的生物多样性丧失和碎片化问题(Ahern, 2013)。近年来，绿道作为一种新兴的开发形式，在美国和世界各地越来越受欢迎(Akpinar, 2016)。以往的研究表明，绿道可以促进更多的体育活动，增加人们与自然的互动，并增加就业机会(Cohn and Scott Shafer, 2009; Dallat et al., 2014)。

为了最大化绿道的效益，了解绿道的使用情况及其影响因素非常重要(Hamilton et al., 2017)。研究表明，公园的大小、邻近度、设施数量和项目数量与积极活跃的公园使用和体育活动有关(Bedimo–Rung et al., 2005)。另一方面，维护不善、安全问题、缺乏入口点和无效的活动编排可能会对绿道的使用产生负面影响，尤其是对少数群体(Boone et al., 2009)。尽管这些特征和属性很重要，但主观因素和直接体验被发现是成功公园和公共空间的更强指标(Fongar et al., 2019)。例如，可达性的感知比网络距离等邻近度测量更重要(Wang et al., 2015)。与植被面积百分比、公园规模和设施数量等客观指标相比，绿地的感知质量和自然相关性更能预测当地社区的公园访问频率(Flowers et al., 2016)。因此，从用户的角度直接调查公园的体验和使用情况是至关重要的。没有这些知识，研究人员和管理者将缺乏来自用户的实证证据来评估规划和制定干预措施。

近年来，越来越多的研究利用社交媒体评估用户的地点偏好和参与度(Heikinheimo et al., 2017; Wang et al., 2019)。丰富的大数据为跨越时间和空间的人类体验提供了更广泛的覆盖范围(Chen et al., 2020; Ye et al., 2020)。借助自然语言处理(NLP)和计算机视觉(CV)等AI技术，研究人员可以自动化数据分析过程，使用新兴的大城市数据解决复杂问题(Jamonnak et al., 2020; Li, 2020; Ning et al., 2021)。研究人员发现，社交媒体数据有助于弥补传统调查技术的局限性，因为后者成本高且频率低(Li et al., 2017; Wang et al., 2016; Ye et al., 2016)。地理定位照片与实证访问之间也存在密切联系(Donahue et al., 2018; Sessions et al., 2016)。特定地点的在线评论和照片发布可以描述用户在现场的体验(Song et al., 2021)。通过调查公园和街道等标志性公共空间，一些实证研究确定了用户的感知和使用情况，可以支持未来的城市设计和景观建筑实践(Song et al., 2020b)。

用户的长期使用和体验模式是了解城市绿道影响的关键。Sim等(2020)最近通过实地观察和调查比较了三个高架绿道公园的使用差异，但每个公园仅研究了两个工作日和两个周末日。现有文献很少收集大数据集来研究城市绿道的用户体验。本文利用Instagram上的社交媒体数据和计算机视觉技术，研究和比较2017年两处城市绿道公园的使用模式。我们选择了著名的亚特兰大环线(亚特兰大，乔治亚州)和高线公园(纽约，纽约州)作为案例研究地点。我们的研究目标是(1)检验使用Instagram数据和计算机视觉技术了解绿道使用情况的有效性；(2)根据Instagram照片的视觉内容检测有意义的场景和活动类型；(3)分析不同计算机视觉检测对象的时间分布模式，并识别其对公园用户及其体验的表征。

【研究方法】

2.1 研究地点和数据收集

亚特兰大环线(图1)是一个环绕乔治亚州亚特兰大市中心将原铁路走廊转变为多用途步道的项目。整个环线长达33英里，包含了游乐场、公园、购物中心和公共艺术品。本文研究重点在于亚特兰大环线的东侧部分，该部分最先向公众开放，包含三英里的步道。高线公园(补充图S1)建在纽约市一条历史悠久的高架铁路轨道上，设有花园、座椅、食品摊贩、观景台和艺术展示。这两个绿道公园都位于城市的中心市区，是美国最有影响力的项目之一，得到了公众的广泛认可。两者都因其卓越的设计和管理赢得了多个奖项(ASLA Professional Awards, 2010; Atlanta Beltline Awards, 2020)。

图1. 2017年全年各天的发布数量

作为全球最受欢迎的社交媒体平台之一，Instagram被认为是一个自我展示和个性塑造的平台，用户在此发布他们的日常生活和瞬间(Rettberg, 2017)。在预测公园访问量方面，Instagram比Twitter和Flicker等其他平台表现更好(Tenkanen et al., 2017)。本研究使用Instagram作为2017年的主要数据来源。我们使用位置标签“Atlanta Beltline”收集了7765个独立用户的11,198个Instagram帖子，并使用位置标签“The High Line”收集了94,715个独立用户的137,055个帖子。这些位置标签由用户位于公园或其周围时选择。然而，为了隐私原因，没有包含具体的地理位置信息(GPS坐标)。

2.2 面部检测

近年来，计算机视觉已成为人工智能进步的关键组成部分。我们回顾了计算机视觉中当前最先进的目标检测方法(Liu et al., 2020)，并使用这些技术推断公园的使用情况。本研究中包含了两种广泛使用的计算机视觉技术。第一种是面部检测，用于推断用户行为和情绪，这项技术近年来得到了很好的发展(Masi et al., 2018; Zheng et al., 2020)。商业公司(如FacePlusPlus)提供公开可访问的API，这些API以照片作为输入，然后返回检测到的面部属性(补充图S2)，例如性别、年龄和表情(微笑与否)，其准确性相对接近人类评估者的表现(Jung et al., 2018)。它已在许多研究中被用作可靠的工具(Patil et al, 2018)。

2.3 物体检测

第二种技术是通过预训练的YOLOv3检测器(Redmon and Farhadi, 2018)进行物体检测，该检测器可识别目标物体的边界框或边界。流行的物体检测器如YOLO(Redmon and Farhadi, 2018)和SSD(Liu et al., 2016)基于多层卷积神经网络(CNN)，需要大量的训练数据。COCO(Lin et al., 2014)数据集是物体检测研究中广泛使用的计算机视觉数据集，包含80种常见物体类型，如人、背包、瓶子和狗。在本研究中，我们使用预训练的YOLOv3模型来检测七种COCO对象类型中的四个目标类别(手袋、车辆、自行车和宠物)。虽然这些类别不是用户活动的直接记录，但它们可以作为公园使用和体验的代理测度(表1)。我们有选择地排除了其他COCO对象类型，包括：(1)在公园环境中检测不到足够数量的街道或室内物体(停车标志、笔记本电脑等)；(2)具有显著精度问题的物体(长凳、蛋糕、书籍等)；(3)与我们研究无关的物体(碗、泰迪熊)。

表1. 计算机视觉检测类别和COCO对象类型。

据我们所知，YOLOv3在户外公共空间的Instagram照片上的表现尚不清楚。因此，我们通过手动验证测试了我们的物体检测任务的可靠性。从整个数据集中取出3%作为验证集，由四位人工标注人员检查返回的边界框类别是否正确以及是否有漏检物体。最后，我们通过以下计算的精确度、召回率和F1评分来评估我们的计算机视觉模型性能。

【研究结果】

3.1 物体检测准确性

我们对公园用户的分析是在物体检测结果足够精度的前提下进行的。除了高线公园的宠物类别外，所有检测结果都有较高的精确度评分(表2)，这表明被正向检测出的物体具有很高的准确性。车辆和自行车(补充图S3)的检测非常精确，其F1分数都大于0.8。亚特兰大环线的宠物类别非常准确(F1 = 0.84)。然而，高线公园的宠物类别呈现出较低的精确度评分(F1 = 0.4)，有很多误报，比如模糊的物体、夜间的头发、炫目效果或照片中的艺术雕塑。(补充图 S3)。手提包类别的F1分数较低，约为0.5。主要是由于较低的召回率，存在许多假负例，模型无法检测到远处人们携带的较小手提包(补充图S3)。总体而言，YOLOv3模型对我们的数据集和后续分析的分析结果可以接受。

表2. 不同计算机视觉的准确性

3.2 总体统计和分布

Instagram上的发布数量可以让我们大致了解场地活动水平(Song et al., 2020a)。亚特兰大环线数据集中识别出5771张女性面孔和3279张男性面孔，5800个帖子没有面孔。如图1所示，周末的发布数量比工作日更多。周末每天平均发布数量为46.6(变异系数42%)，约为工作日平均发布数量24.4(变异系数31%)的两倍。对于高线公园的数据集，识别出47,391张女性面孔和36,917张男性面孔；同时，有55,693个帖子没有面孔。高线公园在工作日和周末的差异小于亚特兰大环线。高线公园周末一天的平均发布数量为429.5(变异系数32%)；而工作日的平均发布数量为355.4(变异系数30%)。高线公园表现出较低的波动性，因为其变异系数较低。从图1中的每日发布模式也可以看出，高线公园没有像亚特兰大环线那样出现较大的峰值和峰谷。

3.3 面部属性和检测对

如图2所示，左侧Y轴表示检测到的面部笑容比例。亚特兰大环线的粉色和蓝色曲线(综合平均值70%)显示的数值高于高线公园(综合平均值58%)。这表明亚特兰大环线的Instagram照片中的面部更可能带有笑容。两个地点的女性面部笑容比例一致较高(约为男性的1.5倍)。人们在开心时会拍照，笑脸在社交媒体照片(如Instagram或Facebook)中很常见。然而，社交媒体照片中笑容的强度是长期幸福感的有力预测指标(Seder and Oishi, 2012)。从Instagram照片中检测到的笑脸的长期模式可以间接表明公园访问对用户幸福感的贡献。尽管Instagram帖子中检测到的笑脸数量不能代表所有用户，但我们认为在控制其他变量时，这种分析仍有可能比较不同地点或不同时间的用户情绪。

图2. 每周平均人像数量(右侧Y轴)和检测到的人像中笑容比例(左侧Y轴)

由于我们的计算机视觉算法只检测前景面孔，我们检测到的照片中的主要面孔通常是旅行中的朋友或同伴。因此，我们将每张照片中的面孔数量作为社交互动的衡量标准。当照片中有三个或更多面孔时，我们将其计为社交活动。1-2张面孔的照片被归类为家庭或同伴活动。2017年的分布图(图3)显示，两处地点1-2张面孔(灰色)的照片数量多于3张以上面孔(粉色)的照片。高线公园有更高比例的3张以上面孔的照片(平均14.0%)，而亚特兰大环线为平均6.65%。亚特兰大环线的3张以上面部照片的峰值出现在9月初，而高线公园的峰值出现在5月下旬。

图3. 不同组别的发布数量分布

用户的年龄和性别的组成如图4所示。18-34岁是两处地点和性别中人数最多的年龄组。12-17岁的青少年是所有类别中出现最少的组。两处地点之间的明显差异在于35-64岁的男性组，高线公园的比例(19.25%)高于亚特兰大环线(14.62%)。此外，亚特兰大环线的18-34岁女性比例(40.21%)高于高线公园(33.73%)。

图4. 检测到的面孔的年龄组分析

四个物体类别的每周百分比结果如图5所示。由于我们的计算机视觉模型可以检测到500英尺远的汽车、公交车和卡车，街道或道路的照片可以记录非常多的车辆。高线公园的车辆类别占据主导地位，平均为90.3%，因为许多照片包含曼哈顿市中心的街道。对于亚特兰大环线，各类别更为均匀，车辆类别平均为46%，宠物类别平均为22.5%，自行车类别平均为25.9%。手提包类别在亚特兰大环线中最少，而在高线公园中则是第二大类别。在总体分布上，两个公园的自行车类别一般从1月开始增加，并在夏季的8月或9月达到峰值。宠物类别在两处地点没有显示出明显的模式，因为我们没有看到显著的季节差异。

图5. 物体检测结果分布

【讨论】

4.1 访问量和用户

4.1.1 公园参与度

假设Instagram发布数量与实际的访问量之间有很好的相关性，如之前的研究所示(Donahue et al., 2018)。我们数据集中的照片数量可以展现不同时间的整体公园参与度水平。总体而言，与关于西雅图市中心高速公园的类似研究相比，高线公园和亚特兰大环线的用户在Instagram上的发布数量明显更高(Song and Zhang, 2020)。这表明这两个公园的参与度和互动水平很高，并展示了绿道作为绿色基础设施投资如何吸引公众使用。

从图2可以看出，高线公园相关的Instagram发布数量在冬季较低(分布两侧的条形较低)。这与之前研究中的布莱恩特公园不同(Song et al., 2020b)，后者在冬季假日期间的公园参与度最高。通过人工浏览Instagram照片，我们也发现了冬季节日期间(如感恩节和圣诞节)活动较缺乏。寒冷和大风的气候加上植物休眠期可能影响了高线公园对人们的吸引力。

常识认为周末访问公园的人比工作日多，但根据图1，高线公园相关的Instagram的工作日发布数量比亚特兰大环线多。高线公园位于纽约曼哈顿，那里有更高密度和更适合步行的街道网络。对于许多当地居民来说，高线公园离他们的家或工作地点非常近，使他们能够在工作日进行短时间的游览。另一方面，亚特兰大环线东侧周围是单户住宅和汽车导向的商业开发区。亚特兰大环线周围的密度远低于高线公园。去亚特兰大环线的行程需要更长的时间，在工作日对许多居民来说不可行。

4.1.2 用户组成

本研究的用户构成结果总体上与之前的研究一致(Sim et al., 2020; Veitch et al., 2015)。我们在两个公园都看到了更多的女性用户(图4)。女性用户的比例为64%，也高于Instagram平台上的整体女性用户比例(51%)(Chen, 2020)。大多数用户是18至64岁的成年人，而儿童、青少年和老年人则较少。尤其是青少年(13-17岁)，两个公园的总平均比例仅为0.19%。青少年通常不会像成年人那样拍摄那么多Instagram照片，只有3.3%的Instagram用户是青少年(Chen, 2020)。然而，这仍然比我们数据中检测到的青少年高出17.3倍。两个公园都缺乏适合青少年的娱乐设施，如篮球场、山地自行车和滑板场。为服务不足的年龄组提供服务并设计包容性的绿道至关重要。

4.2 关于用户体验、活动和互动

4.2.1 用户微笑

同样，我们的微笑面孔结果可以表明两个公园的体验对用户的心理影响。如图2所示，两个地点在检测到的面孔中微笑的比例总体上表现稳定；冷季和暖季没有显著差异。出现在高线公园的人比在亚特兰大环线公园的人更少微笑。而且，女性在全年中都比男性更倾向于微笑。这可能表明两个公园都更能满足女性用户的需求。

4.2.2 团体活动

支持性的社会互动一直与心理健康密切相关(Antonucci et al., 2010)。从图3可以看出，两个地点都存在较多的团体活动(3+面孔)。团体照片的比例几乎达到了芝加哥林肯公园等大城市公园的水平(Tinsley et al., 2002)。高线公园吸引了比亚特兰大环线公园更高比例的团体活动。亚特兰大环线公园的团体活动在9月大幅增加可能是由于著名的艺术游行活动。而高线公园是由旧铁路轨道改建而成，宽度有限，很少有大型活动和聚会，但经常举办游览、瑜伽课、小型音乐会或艺术展览。总体而言，我们的结果证明，如果设计和规划得当，绿道不仅仅是用于交通目的的步道，还可以提供大量的社会互动和活动的公共空间。

4.2.3 通过检测到的物体分析公园用户

由我们的物体检测结果(图5)，我们发现四个类别对于直接或间接地了解公园的使用情况和使用体验都很有用。照片中的车辆数量可以与游客的恢复性体验相关联，因为人们更有可能在大自然中感受到逃离城市和置身荒野的感觉(Zoderer et al., 2020)。在高线公园中，车辆是人们Instagram帖子中最常见的元素，我们发现人们喜欢在高线公园与下面街道的交界处拍照。相比之下，亚特兰大环线公园与城市交通隔离，几乎看不到车辆。女性用户在参加社交活动、散步、观光或放松而不是锻炼时，通常会带着手袋，这间接表明了她们可能的旅行目的。因此，高线公园中更多的手提包可能表明女性用户进行体育锻炼的程度较低。这与Sim等人(2020)发现的高线公园无法容纳高强度体育活动的结论相呼应。城市高架绿道在支持体育活动方面有其局限性，因为自行车道、滑板坡道、排水设施和围栏等设施的建设通常更为昂贵。两个公园的宠物和自行车并不能很好地进行比较，因为高线公园的宠物和自行车太少了。然而，它们是展示亚特兰大环线公园体育活动的良好指标。

4.3 重要性与局限性

在我们看来，了解公共空间的使用情况是景观建筑和城市设计中的基础工作之一，因为在不了解人们如何使用这些空间的情况下，规划和设计空间将面临挑战。然而，大多数城市公园管理者并没有资源来收集全面甚至初步的数据(Godbey et al., 2005；Walls, 2009)。研究人员在收集长期的大数据样本方面也受到限制(White et al., 2019)。这一问题对于城市绿道研究尤其突出，因为这些研究涉及较长的绿道和广泛的城市覆盖面。

我们提供了一种可能的解决方案，通过使用Instagram数据作为代理测度来调查城市绿道公园的使用情况。与以往的视觉偏好调查方法类似(Nassauer et al., 2009)，Instagram上的帖子是用户自述的体验，代表了真实的用户参与，提供了丰富的视觉内容，可以揭示公园的访问模式、用户、活动和社交互动(Donahue et al., 2018；Kang et al., 2019；Sessions et al., 2016)。这些数据是研究场所感、文化景观、心理健康、体育活动、场所活力等主题的宝贵资源(Shaw et al., 2016；Ye and Liu, 2018)。

计算机视觉作为一项重要的新兴技术，将改变研究人员对人类与环境关系的认知。现成的计算机视觉技术，如预训练的YOLO模型，已广泛向公众开放，可以在许多环境(城市、乡村、室内、室外等)中使用，特别是对于计算机科学背景较少的城市设计师和景观建筑师而言。

未来的研究应开发定制化的计算机视觉数据集，以正确检测水体、雕塑、座椅、食物、外卖袋、手机、婴儿车、游乐场、运动场等。基于视觉的人类活动识别技术可以应用于社交媒体照片中的跑步或坐姿检测。还可以开展场景研究，分析“视角”或分析是什么构成了一个“值得发帖”的场景？比较本地居民和游客之间的不同感知也很重要。人类感知是城市研究中的一个重要组成部分。我们的研究确实展示了情感和微笑、团体规模和社会互动、车辆数量与恢复性体验(从城市逃离)之间的一些间接联系。然而，未来的研究可以寻找将社交媒体数据与调查或访谈相结合的方法，以直接衡量人类的看法。

像许多其他社交媒体研究(Ghermandi and Sinclair, 2019)一样，我们的数据限于拥有Instagram账户的特定人群，即使Instagram的使用率在增长。一些广告账户、机器人和假账户也可能混淆我们的结果(我们在人工浏览过程中排除了一些)。我们不知道我们的数据是否反映了本地居民或游客，也没有通过本地人口进行标准化。我们的面部检测结果可能无法反映所有用户，因为只有42%的Instagram照片包含人脸。定义我们的数据所代表的精确空间边界的困难也导致了我们结果中的选择偏差。从Instagram帖子中获取特定地理位置信息的困难限制了其对公园设计和规划的适用性。计算机视觉技术仅能有效检测一些常见活动。我们无法描绘公园使用情况的全貌。关于性别和年龄的推断，Jung等人(2018)的早期评估显示，FacePlusPlus在性别方面的结果是可靠的(准确率>0.92)，但在年龄方面的可靠程度较低(平均最小误差=0.89，平均最大误差=6.4)。需要对当前的面部属性检测进行新的评估，以反映不断发展的技术的性能。最后，我们的公园活动表征基于经验假设。例如，如果我们在照片中看到宠物，就假设用户正在遛狗或可能进行更多的体育活动。但这可能并不总是正确的。

【总结】

在本研究中，我们分析了两个具有影响力的绿道项目的使用情况，包括纽约市的高线公园和亚特兰大的亚特兰大环线。通过利用Instagram发布数据和计算机视觉技术，我们了解了绿道的使用者，以及绿道是如何被使用的。

总的来说，两个公园的共同特点包括：(1)这两个绿道公园都展示了强大的公共吸引力，我们发现了高水平的Instagram参与度；(2)检测到大量的团体活动，表明绿道具有增强社会互动和举办活动的潜力；(3)发现女性用户较多，她们对绿道的体验通常比男性更为满意；(4)青少年用户少于预期，这表明青少年设施的不足。

两个绿道的主要差异包括：(1)亚特兰大环线在工作日的访问量低于周末。这种差异可能来源于亚特兰大市区较低的连通性和城市密度，导致人们需要规划更长的行程来访问公园。(2)由于高线公园是高架的，用户可以从上方看到城市街景。在高线公园的Instagram照片中看到更多的车辆，表明其与自然的联系感和逃离城市的感觉较弱。(3)高线公园展示的体育活动少于亚特兰大环线，如跑步和骑车。高架绿道可能在容纳高强度体育活动方面具有局限性。

我们发现的这些共同点和差异可能为未来的绿道公园设计和管理提供指导。它们还展示了社交媒体照片用于了解城市绿道上的潜力，以及将人工智能(如预训练的计算机视觉模型)作为分析工具来理解城市环境中的用户行为的前景。