郑哲:学习、应用初探与探索创新 | 提升之路系列(四)

news2024/11/28 0:52:38

750f69b082c52ae0c232ec694dd8c615.png

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

我是土木工程系2019级的博士生郑哲(图1)。通过本科系列实践和实习,我深刻了解到土木工程行业的自动化程度较低,设计、审图、施工过程中的很多工作都完全依赖人工。人工完成工作容易犯错,并且导致相关从业人员工作压力巨大。我希望能将重复的工作交给计算机去完成,让工程师能够专注于设计与创造。

644992ca78905115efc2917d96b5ae84.png

0aabf5ce65373b7fa0bc3fc18088bf2c.png 图1 个人生活照

2019年入学后我加入了大数据能力提升项目,该项目给了我提升自己代码能力、学习前沿算法以及与不同专业同学交流的机会。经过一年的学习,我获得了大数据项目的证书。更重要的是,我提升了自己的通过编程解决实际问题的能力。转眼已博四,临近毕业,回想起来,从这个项目中收获到了很多。以下将就我在大数据能力提升项目中的一些收获与体会进行总结。

一、学习阶段——打好基础、兴趣驱动

最初,我对于AI、大数据相关内容都了解很少。借助大数据能力提升项目这个优秀的平台,我选择了四门课程提升自己的大数据技能,并在一学年内获得了3门A,1门A-的成绩,获得了大数据项目证书。在龙明盛老师的《深度学习》课程中我了解到“自然语言处理是人工智能皇冠上的明珠”,因此我对自然语言处理特别感兴趣。于是又选择了《自然语言处理与文本挖掘》这门课程,该课程决定了博士研究方向甚至未来的工作路线。

二、应用初探——实践课

本项目的暑期大数据实践课程让我受益匪浅。我参与了清华大学建筑系&北京城市实验室(BCL)龙瀛老师的“基于高分遥感影响的城市空地识别”课题。该课题旨在实现自动的空地识别,计算城市空地率,从而为城市规范发展提供建议。我主要负责技术路线(图2)制定、数据标注以及代码撰写工作,具体包括:遥感影像预处理、基于DeepLabv3的分层空地识别算法、预测结果后处理。所提出的方法精度与领域专家接近,在效率方法提升了15倍以上,降低了对人工的依赖。该工作获得了龙瀛老师的高度评价、大数据实践课“优秀团队奖”,相关成果发表在城规TOP期刊“Landscape and Urban Planning”上。在此之后,该方法被BCL应用于国内上百个城市空地的评估。这次实践课让我迈出了 “提升土建行业自动化”的第一步。

6e5d079371b6dc2c0e7371c18eaa4389.png 

83df20ce9053d484b75f329597b6642b.png

图2 基于高分遥感影响的城市空地识别技术路线

三、探索创新——智能审查助力行业转型升级

建筑建设过程包括:设计、审查、施工、运维四个阶段。审查是控制设计质量的关键环节,因为设计审查纰漏导致的工期、成本损失最高分别可达9%和20%以上。但现有人工审查费时耗力错漏多,因此智能审查应运而生。但是智能审查中面临三个关键难题:计算机如何读懂自然语言编写的规范?计算机如何理解设计以及设计的性能?如何构建智能审查系统?因此,我的科研工作主要围绕上述三个问题展开:计算机如何理解土建文本规范、设计审查中性能仿真以及智能审图与设计系统构建三个部分。

3.1 计算机如何理解土建文本规范

土建行业现有规范都采用自然语言编写,因此,让计算机理解以自然语言编写的规范(称为自动规则解译)是实现自动审查的关键也是最困难的一步,需要在模型和算法方面实现突破。

在模型方面,针对通用预训练模型难以理解领域专业术语的难题。我构建了千万级字符的土木领域语料,基于迁移学习建立了领域知识嵌入增强的预训练模型(图3)。实现了让通用模型变成领域专家;在土建领域多类自然语言处理任务的性能提升。相关论文发表在计算机TOP期刊computers in industry。

8c901f7331a5d8320b4ae80927b8243d.png 

58947b0b858400caa5f40c911daf4df1.png

图3 领域知识嵌入增强的预训练模型

在算法方面,针对人工将文本规范编写为计算机代码效率低难拓展的难题。我利用上述领域语言模型,提出了支持语义对齐与隐式推理的复杂条文自动解译方法(图4)。实现了自动将文本形式的规范条文转化为计算机可执行代码。该算法在复杂句解译方面比现有算法精度提升35%。同时相比人工解译能提升5倍以上的效率。相关论文发表在土木顶刊Automation in Construction上。

aa62904db2ea3ce7c9f24d4969a5e2ca.pngbed579e878c1afd6accde1d8e9897445.png 

4dbcf6b2b303d91d1cf92494af5ceaa1.png

8273b30f6899732d563062b16e4965f2.png

图4 支持语义对齐与隐式推理的复杂条文自动解译方法

3.2设计审查中性能仿真

审查过程离不开对设计的性能仿真。在设计审查中的仿真模拟方面,我提出了有限元与物理引擎联合模拟方法,实现高真实感场景构建。技术应用于国内外多起重大倒塌事故的情景构建工作。

4e8ce8ea3977c90b33256fcb7e3cfb73.png91e4936985bca9466aea660ab5ef69f2.png

图5  (a)联合模拟方法(b)倒塌模拟应用

3.3智能审图与设计系统构建

在智能设计与审查系统构建方面,首先我基于前述文本理解模型与算法,建立了支持自动规则解译的智能审查系统,审查效率相比人工审查提升40倍(图6)。此外,我将前述模型应用到了课题组的剪力墙智能设计系列研究中,实现在剪力墙设计生成过程中考虑文本法规的指导(图7)。

feab867092d9f0ddc51cb614ef73afeb.png 

ef0aef1d85afa64e00365f01895fdce8.png

图 6 支持自动规则解译的智能审查系统

8ed71ab889a5608961764e2d4b3ca6d5.png 

19f49a2d0ebc14189c68c61ee0b4fc99.png

图7 剪力墙智能生成式设计生成过程中考虑文本法规的指导

四、总结

入学以来,大数据能力提升项目帮助我开拓了视野、取得了成长。不过,学习与研究是永无止境的。未来,我依然会坚定地、不断地为土建行业自动化转型升级做出自己的些许贡献。真诚祝愿大数据项目未来越来越好。

编辑:于腾凯

校对:林亦霖

e5e517043ce42ab5eff35e14051adbf2.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/474680.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python中snap-stanford指导手册(主要用于做图网络)

文章目录 RequirementSnap操作手册Basic TypesVector TypesHash Table TypesPair TypesGraph and Networks Types(graph和network类型)Node and Edge Operation Requirement 需要提前安装用于操作图网络的snap库,这个库中有很多现成的图数据…

物联网平台:一文读懂什么是物模型

文章目录 一、什么是物模型二、标准参数(1)标准参数的意义 三、物模型字段详细说明(1)物模型的每个属性包含以下字段(2)物模型的每个方法包含以下字段(3)物模型的每个事件包含以下字…

【Python】【进阶篇】15、如何启动Django项目详解

目录 如何启动Django项目详解1. 启动项目并实现访问1) 启动项目命令介绍2) manage.py文件子命令 如何启动Django项目详解 我们使用 django-admin 命令成功创建项目后,我们要如何启动这个项目呢?本节的学习目标是能够通过本地回送地址 127.0.0.1 成功访问…

第十一章 Transform组件(上)

本章节我们介绍Transform类,它是一个组件,每一个游戏对象有拥有该组件。因此,它值得我们重点介绍一下。Transform代表了游戏对象的世界变换,也就是移动,选择和缩放。 首先,我们先介绍它的属性(…

Linux Ansible角色介绍

目录 角色的基础结构 角色来源与应用 Galaxy角色 系统角色 自定义角色 角色(roles)用于层次化、结构化地组织playbookroles通过标准化目录结构来装载变量文件、tasks(模块任务)、handlers(处理程序)、…

标准ACL配置

标准ACL配置 【实验目的】 掌握标准ACL的配置。 验证配置。 【实验拓扑】 实验拓扑如图1所示。 图1 实验拓扑 设备参数如表所示。 表1 设备参数表 设备 接口 IP地址 子网掩码 默认网关 R1 S0/3/0 192.168.1.1 255.255.255.252 N/A Gi0/0/0 192.168.2.1 255.…

大数据分析利器之Power BI,你是否已经掌握?(文末送书)

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

【校招VIP】IT职位校招简历千万不要用两栏的模板,另外,告诉你个陷阱:越个性机会越少

前两天在简历指导的直播里,发现了不应该出现的一种简历格式问题。 有的同学喜欢用那种竖栏两栏的简历模板。 我们建议研发岗的校招,简历不要这么去写。 因为两栏的话,实际上有一个很大的问题。 因为简历上需要写项目经历,需要写…

你最关心的4个零代码问题,ChatGPT 帮你解答了!

作为人工智能(AI)新型聊天机器人模型 ChatGPT,刚上线5天就突破100万用户,两个多月全球用户量破亿,不愧为业界最炙热的当红炸子鸡。 ChatGPT 是一种语言生成模型,由 OpenAI 开发和训练。它是基于 Transform…

C语言函数大全-- s 开头的函数(1)

C语言函数大全 本篇介绍C语言函数大全-- s 开头的函数(1) 1. sbrk 1.1 函数说明 函数声明函数功能void *sbrk(intptr_t increment);它是一个 Unix 系统的函数,用于调整程序的堆空间。 参数: increment : 增加的堆空…

机器学习算法系列(五)-- 支持向量机(SVM)

机器学习算法系列之–支持向量机(揭开SVM的神秘面纱) 支持向量机(Support Vector Machine :SVM):二分类算法模型,数据集较小时,分类效果甚至优于神经网络。 其最大的特点在于&#x…

C++ muduo日志库的使用

muduo日志库的使用 一、引用二、使用方法2.1、引入头文件2.2、 启动日志库2.3、记录日志2.4、输出格式2.5、日志滚动 三、总结 一、引用 muduo是一个高性能的网络库,它的日志库采用了异步、多线程的方式来记录日志,其主要特点包括: 能够按大…

使用Pano2VR实现全景图切换和平面图效果

内容简介 本文在文章《使用Pano2VR实现背景音乐、放大/缩小、旋转、缩略图和直线/立体/鱼眼模式等》基础上,增加全景图切换和平面图效果;效果如下图(为了可以上传缩小屏幕,属于PC端运行): 实现过程 1. 运行…

【Bus】编写一个Demo虚拟的总线-设备-驱动模型

文章目录 1. 前言2. 总线驱动模型三要素2.1 总线2.2 设备2.3 驱动 3. Demo Code3.1 virt_bus_core.c3.2 virt_device.c3.3 virt_driver.c 4. 工程代码下载地址5. 参考资料 1. 前言 Linux平台为了驱动的可重用性,虚拟了很多的虚拟总线。很经典的就是platform总线&am…

Android Room数据库如何使用增删改查

先看运行效果图。 1.在app下的build.gradle。在dependencies{}闭包中添加如下依赖 //roomdef room_version "2.3.0"implementation "androidx.room:room-runtime:$room_version"annotationProcessor "androidx.room:room-compiler:$room_version&q…

爱奇艺DRM修炼之路

01 DRM的定义和作用 DRM,即数字版权管理(digital rights management),是在数字内容交易过程中,对知识产权进行保护的技术、工具和处理过程。它的目的是防止数字内容被未经授权的用户复制、修改和分发,以保护…

解读TaskMatrix.AI

ChatGPT在广泛的开放域任务上展现出令人瞩目的强大对话、上下文学习和代码生成能力,而且它所获得的常识知识还可以为特定领域的任务生成高级解决方案概要。不过,除了更强大的学习、理解和生成能力,ChatGPT还有哪些问题需要解决呢?…

《利用光体积描记图信号的模糊递推特性估计无袖带血压的级联卷积神经网络模型》阅读笔记

目录 一、论文摘要 二、论文十问 Q1:论文试图解决什么问题? Q2:这是否是一个新的问题? Q3:这篇文章要验证一个什么科学假设? Q4:有哪些相关研究?如何归类?谁是这一…

城市的智能进化,汇成数字中国的璀璨银河

著名城市规划理论家刘易斯芒福德在《城市发展史——起源、演变和前景》中提出,“城市从其起源时代开始便是一种特殊的构造,它专门用来储存并流传人类文明的成果。这种构造致密而紧凑,足以用最小的空间容纳更多的设施。” 他认为,城…

我们如何将 Amazon Snowcone 送入轨道

我从 4 或 5 岁起就一直是太空旅行和美国太空计划的粉丝。我记得读过关于水星和双子星座计划的文章,兴奋地看着鹰号登月舱降落在月球上。 如今,随着每次发射到达近地轨道 (LEO) 的成本似乎都在不断下降,因此有比以往任何时候都要更多的机会&…