AI大语言模型对消防工程知多少?

news2024/9/25 3:28:16

在过去2年的时间里,大语言模型受到前所未有的关注。ChatGPT的出现更是让人工智能对话风靡一时。我们不再把搜索引擎当作求解问题的唯一途径,AI聊天成为了当前最受欢迎的问题求助工具。

让ChatGPT用通俗的语言解释什么是ChatGPT

什么是大语言模型?

大语言模型是基于深度学习的自然语言处理工具,能够理解和生成文本。通过在大量文本数据上训练,它具备问答、翻译和文本生成等功能。常用于聊天机器人、内容创作和教育等领域。尽管表现出色,但仍面临理解深度不足的挑战。随着技术进步,其应用潜力不断扩大。

如果说搜索引擎是帮助我们汇总了互联网信息,检索的结果是在汇总的信息里寻找最相关的内容,那么基于大语言模型的人工智能聊天则是充当搜索引擎内容的过滤器,它能帮助我们过滤掉无用信息的同时,借助训练的模型,整合出自己的答案。

然而,在与AI聊天的过程中,我们并不知道该工具到底掌握了哪些知识,也不明白它是如何自我验证信息的准确性,因此我们常常无法判断人工智能聊天输出结果的准确性。

搜索引擎与人工智能聊天的区别

尽管大语言模型被广泛认可为“惠及下一代教育”和“未来辅助工程应用”的重要工具 [1],但在要求更为严格的消防工程领域,学界有观点指出,人工智能聊天工具更适合被用于向非消防专业人员总结概念和文件,但不能用来取代消防工程师的地位,因为它目前还无法直接进行消防安全设计、评估和验收等消防领域专业工作。当然,大语言模型还在快速成长,未来可期。

目前,人工智能大语言聊天工具是否了解消防工程?它们对消防领域的知识到底储备了多少?为解决这样的困惑,我们选择测试时下热门的两大人工智能聊天工具ChatGPTGoogle Bard,通过"随便问"(Ask Me Anything)的形式,评估大语言模型处理消防安全相关问题的准确性[2]。通过模仿非专业人士和学生身份的形式,本文提出了25个难度不一的问题来测试大语言模型人工智能的表现。

1: What is fire engineering?

什么是消防工程?

2: Who was the world’s first fire engineer?

谁是世界上第一个消防工程师?

5: In terms of beams and columns, what is the best geometric shape that limits heat transfer?

就梁和柱而言,限制热传递的最佳几何形状是什么?

6: What is the expected fire resistance in terms of hours of a square reinforced concrete column with a width of 400 mm and a length of 4 m?

一根宽度为 400 毫米、长度为 4 米的方形钢筋混凝土柱的耐火极限是多少?

12: How can a wheelchair user evacuate from a building?

轮椅使用者如何从建筑物火灾事故中安全撤离?

20: List three most influential fire research papers published over the last 20 years.

列出过去 20 年内,最有影响力的三篇消防研究论文。

人工智能聊天工具回答错误的六个问题

最终人工智能聊天工具的表现分别如下图所示,ChatGPT回答问题的准确率为88%,高于Google Bard的80%胜率。

人工智能聊天工具回答的表现评估

该工作主要探究了人工智能聊天工具应用于消防安全领域的潜力,由美国Clemson University、香港理工大学和加拿大约克大学共同完成,文章已发表国家灾研院旗下的英文期刊Natural Hazard Research

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1996122.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SD微调 dreambooth Lora controlNet 持续更新中

微调:步骤 1 选择预训练模型 如ResNet VGG 2 准备新的数据集 3 构建模型 4 冻结部分模型 5 定义损失函数和优化器 6 微调模型 7 评估模型 8 微调的策略 https://www.zhangzhenhu.com/aigc/dreamBooth.html dreambooth (fix the object, then generate the same obje…

Android Media Framework(十五)ACodec - Ⅲ

这一篇我们一起来了解ACodec的Buffer分配流程。 1、initiateStart 首先对上一篇内容做一点补充,configureCodec执行完成后组件的状态没有变化,仍处在OMX_StateLoaded。因此,当我们调用initiateStart时,发出的消息将由ACodec::Loa…

SVN使用教程 - 快速上手

参考视频: SVN使用教程 - 快速上手 一、SVN简介 1、SVN的功能 (1)SVN是一种代码版本管理工具,它能记住程序员每次修改的内容,可以查看所有的历史修改记录,可以将代码恢复到任何历史版本,可以恢…

【Mysql】第十一章 事务-重点(原子性+持久性+隔离性+一致性)

文章目录 一、概念1.查看事务支持版本-show engines2.事务提交方式-show variables like autocommit3.事务常见操作方式1.将mysql的默认隔离级别设置成读未提交,方便看到实验现象2.需要重启终端,进行查看隔离级别3.创建一个银行用户表4.演示 - 证明事务的…

【Transformer】关于RNN以及transformer的相关介绍

文章目录 RNNTransformer是干什么的?什么是 Word Embedding ?什么是 Word2vec ?CBOW(Continuous Bag-of-Words Model)Skip-gram(Continuous Skip-gram Model)Word2vec 的优缺点 Transformer整体架构注意力机制self-attention(自注…

生成式人工智能助力6G核心技术

崔曙光 加拿大皇家科学院 加拿大工程院双院院士 主要工作:适配改造人工智能算法,来满足通信网络性能 从基础LLM到专用LLM:四个必须面对的问题 如何选择合适的基础LLM规模如何让基础LLM读懂专用领域信息如何避免基础LLM的幻觉现象&#xf…

第9天 xxl-job

使用xxl-job需要建表 引入依赖 添加配置 Bean public XxlJobSpringExecutor xxlJobExecutor() {logger.info(">>>>>>>>>>> xxl-job config init.");XxlJobSpringExecutor xxlJobSpringExecutor new XxlJobSpringExecutor();xxlJo…

sql注入——sqlilabs16-26

文章目录 less-163.注入 less-172.数据库名2.1 floor报错注入数据库名 3.查到数据表3.1floor 报错注入数据表 4.查取列名4.1 floor报错注入 列名 5.查取内容 less-181.添加X-Forwarded-For测试2修改User-Agent测试3.查数据表名4.查数据列5.查取数据 less-192.查数据库3.查数据表…

医疗大健康解决方案HIS方案

本篇接上篇文章医疗大健康解决方案HIS方案-CSDN博客,介绍第二部分区域医疗解决方案。 依托腾讯云优势,联合合作伙伴,连接政府、医疗服务机构、医药研发与流通、康养等,构建医疗大健康产业云生态,助力数字化升级。 方…

小怡分享之数据结构基础知识准备

前言: 🌈✨之前小怡给大家分享了JavaSE的知识,今天小怡要给大家分享一下数据结构基础知识。 一、初识集合框架 1.什么是集合框架 Java集合框架Java Collection Framework, 又称为容器container,是定义在Java.util 包…

Linux服务器基于NFS实现共享目录

NFS简介:NFS(Network File System)是一种分布式文件系统协议,允许用户通过网络访问远程计算机上的文件和目录,就像访问本地文件一样。NFS 最初由 Sun Microsystems 在 1984 年开发,现在已经成为类 Unix 系统…

SpringBoot企业人事管理系统-附源码与配套论文

1.1引言 随着计算机技术的飞速发展,计算机在各种单位机构管理中应用的普及﹐管理信息系统的开发在强调管理、强调信息的现代社会中也显得越来越重要。因此,利用计算机高效率地完成人事管理的日常事务,是适应现代各种单位机构制度要求、推动各种单位机构…

【项目】火灾烟雾检测管理系统。PyQT5+QT Designe+YOLOv8_ssod半监督算法+OpenCV

【项目】火灾烟雾检测管理系统。PyQT5QT DesigneYOLOv8_ssod半监督算法OpenCV 0.摘要1.引言2.烟雾检测算法2.0图像标注2.1 YOLOv8全监督算法结构2.2 Efficient-Teacher半监督算法结构 3.性能对比图4.源码、论文获取 0.摘要 火灾是常见而危险的自然灾害,不仅对人类生…

数值分析【3】

目录 第四章 插值 边角料: 分段二次插值——三个一插​编辑 三次样条插值 小结:等距看差分​编辑 第五章 最小二乘 第六章 数值积分 代数精度​编辑 第四章 插值 边角料: 分段二次插值——三个一插 三次样条插值 三次阳台函数是光滑…

Oracle一对多(一主多备)的DG环境如何进行switchover切换?

本文主要分享Oracle一对多(一主多备)的DG环境的switchover切换,如何进行主从切换,切换后怎么恢复正常同步? 1、环境说明 本文的环境为一主两备,数据库版本为11.2.0.4,主要信息如下: 数据库IPdb_unique_n…

落子“用户Happy”,vivo的“做活”与“长气”之道

有人说,中国手机行业,是名副其实的“Hard”模式。竞争焦灼,内卷不止。然而,这种主观的判断,也许从侧面反映出另一个客观事实:中国手机市场,凭借巨大的用户规模、多元化的消费倾向、自由展开的科…

从微软蓝屏事件聊到数据库系统中的纸牌屋

2024 年 7 月 19 日,全球约有 850 万台 Windows 电脑崩溃,无法重启,陷入蓝屏死机状态。这次故障影响了全球各地的企业和政府,波及运输、金融服务、医疗保健等绝大多数行业。 故障发生几小时后,蓝屏原因找到&#xff0…

Python 数组计算逻辑

a{1,2,3} b{2,3,4} 与 & 交集(取中) a&b{2, 3} 或 | 并集 (左中右) a&b{1,2,3,4} 差集 ^ 取左右 a^b {1,4} 减 - 取左 a - b {1} a-b {1}

同态加密和SEAL库的介绍(二)BFV 基础方案实现

写在前面: 本篇具体讲解如何使用 BFV 加密方案对加密的整数进行简单的计算(一个多项式评估),来源是官方提供的示例。BFV 是比较常见的方案,在很多大模型推理的时候,都是将浮点数的权重和输入变换成…

新品周销量20W+,月GMV1300W+,黑马品牌如何实现快速突围?

随着视频号用户的不断增加,直播带货生态的不断发展,越来越多的品牌也开始入局视频号。 近期友望数据发现,不少新品牌在视频号上脱颖而出。比如服饰内衣行业品牌「瑰菲女神」,专注女性内衣裤行业,周销量近20W件&#xf…