论文翻译:ChatGPT passing USMLE shines a spotlight on the flaws of medical education

news2024/9/22 5:30:47

ChatGPT passing USMLE shines a spotlight on the flaws of medical education
https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000205

ChatGPT 通过美国执业医师执照考试(USMLE)凸显了医学教育的缺陷

在这里插入图片描述

阿马拉奇·B·姆巴克韦1
, 伊斯米尼·劳伦特佐1
, 利奥·安东尼·切利ID2,3,4*, 奥伦
J. 梅卡尼克5,6,7, 阿隆
D. 达甘8
1 计算机科学系,弗吉尼亚理工学院,弗吉尼亚州布莱克斯堡,美国
2 医学工程与科学研究所,麻省理工学院,马萨诸塞州剑桥,美国
3 医学系,贝斯以色列女执事医疗中心,贝斯以色列女执事医疗中心,马萨诸塞州波士顿,美国
4 生物统计学系,哈佛大学公共卫生学院,马萨诸塞州波士顿,美国
5 eMed 数字医疗保健,佛罗里达州迈阿密,美国
6 急诊医学系,西奈山医疗中心,佛罗里达州迈阿密海滩,美国
7 急诊医学和重症医学系,佛罗里达国际大学赫伯特·韦特海姆医学院,佛罗里达州迈阿密,美国
8 急诊医学系,贝斯以色列女执事医疗中心,马萨诸塞州波士顿,美国

人工智能(AI)最近在数字健康领域引发了革命性的创新,其中大型语言模型(LLMs)做出了重要贡献。LLMs是具有大量参数空间的深度神经网络模型。这些模型包含数十亿参数,通常在千兆字节甚至太字节的文本数据上进行训练。LLMs代表了AI的一个重要进步,为自然语言理解和生成提供了新的可能性。

自2022年11月ChatGPT公开发布以来,关于AI及其在社会中角色的讨论达到了一个临界点。首次,一个复杂的LLM以一种非常易于访问的格式向广大公众开放。最初的反应无一例外地充满了惊讶,公众媒体的爆炸性报道赞扬该算法有潜力“改变我们对工作方式、思维方式以及人类创造力真正是什么的看法”。

在随后的几周里,所使用的LLM面临了日益复杂的挑战,通常利用标准化考试来确定算法与为这些考试设计的人相比如何。尽管缺乏特定领域的训练,ChatGPT并没有让人失望,经常通过或接近通过为各个专业领域设计的研究生水平考试[1]。在这个问题上,Kung等人报告了ChatGPT在美国医学执照考试(USMLE)上的表现。这种表现对我们意味着什么?[2]

随着我们对其能力的更多了解,我们必须考虑ChatGPT在医学考试上的成功对测试和当前医学教育意味着什么。USMLE考试的目标是评估“医生应用知识、概念和原则的能力,并展示在健康和疾病中重要的基本以患者为中心的技能,这些技能构成了安全有效患者护理的基础”[3]。虽然实现这些目标确实需要一些机械记忆,但我们越来越意识到,在信息可以快速在指尖上获取的时代,能够复述健康和疾病的机械模型可能不那么重要。我们还意识到,还有其他重要的特征,如解决问题的能力、熟悉信息资源、强烈的职业道德、尊重患者和整个护理团队、礼貌、热情和谦逊,这些特征使一个人成为优秀的临床医生,而不仅仅是拥有适当的医学知识广度。因此,像USMLE这样的考试未能完全评估现代医疗实践所需的技能。

ChatGPT的成功也反映了医学教学方式的僵化,其中有一个正确和错误的答案(AI聊天机器人可以挑选出来),而“正确”的答案可能更加微妙且依赖于上下文。将医学知识框架化为可以包含进多项选择题的东西,创造了一种错误确定性的认知框架。医学知识通常被教授为健康和疾病的固定模型表示。治疗效果被呈现为随时间稳定,尽管实践模式不断变化。机械模型从教师传给学生,很少强调这些模型是如何得出的,围绕它们的不确定性,以及它们必须如何重新校准以反映值得纳入实践的进步。

同样令人恐惧的是,观察到潜在有偏见的互联网医学内容(ChatGPT训练的基础)足以通过医学考试。这些偏见源于在高收入国家进行的研究和教科书,描述的研究可能不代表全球人口[4]。这些脆弱性因采样选择而加剧,内容来自高影响力的学术机构,主导了健康和疾病的科学。当前的医学教育没有评估学生识别或提及他们知识中潜在偏见的能力:一般来说,它甚至没有让学生意识到这些问题。

直接将AI应用于标准考试的做法存在复制这些模型训练数据中的偏见的风险。对于未经严格错误和偏见评估就部署的专有算法的恐怖故事几乎没有提及[5-7]。AI在处理细微差别和上下文时非常糟糕,当没有明确规则,当专家对正确答案有分歧时。如果有一门知识需要细微差别和上下文,即使证据不够坚实也规定指导方针,并且由经常对正确答案有分歧的专家维护,那将是医学。在这种情况下,声音最大的人将塑造输入,因此也塑造LLM的输出。

学习是利用当前的知识体系,理解其差距,并寻求填补这些差距。它需要能够舒适地并能够探究不确定性。我们作为教师失败了,因为我们没有教学生如何理解当前知识体系的差距。当我们宣扬确定性而不是好奇心,傲慢而不是谦逊时,我们就失败了。医学教育还需要意识到医学知识创造和验证过程中的偏见。这些偏见最好通过优化社区内的认知多样性来解决。比以往任何时候都更需要激发跨学科协作学习和问题解决。医学生需要数据科学技能,这将使每个临床医生能够为医学知识做出贡献,不断评估和重新校准医学知识。

ChatGPT缺乏像人类一样的深思熟虑的推理,它的及格分数强调了当前版本的USMLE主要侧重于机械记忆健康和疾病的机械模型。但这远非基于人类互动的实际医疗实践,因此,出于这些原因,AI永远不会取代护理前线的护士、医生和其他专业人员。毫无疑问,AI和LLM将改变我们所做的每一个方面,从研究和写作到图形设计和医学诊断。然而,它目前在通过一个又一个标准化考试方面的成功是对我们如何训练和评估我们的医生、律师和一般学生的控诉。

ChatGPT通过了一项考试,这项考试奖励记忆系统的组成部分,而不是分析它是如何工作的,它是如何失败的,它是如何创建的,它是如何维护的。它的成功展示了我们训练和评估医学生的一些不足之处。批判性思维需要认识到医学中的真理不断变化,更重要的是,了解它们为什么和如何变化。也许LLM在通过像USMLE这样的考试中的成功最重要的教训是,现在是时候重新思考我们如何训练和评估我们的学生了。医学的荣耀传统上归于创新者,他们当然至关重要。但同样重要的是那些充分利用我们已有的知识和技能的临床医生,并有时间、意愿和能力将这些传递给下一代医学生,并为他们创造更相关和有效的评估。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2075029.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

你不知道的100个国外搜索引擎升级版

首先是要支持国产品牌磁力狐-cilih.com DMOZ – 一个多语种、开放式网站目录。 Food Blog Search -可以让你从上千个博客和网站查找菜谱。 Swoogle – 一个语义、文件、术语和数据的搜索引擎,不同于普通的搜索引擎。 SimilarSiteSearch – 帮你找到相似…

排序------快速排序(C语言实现)

目录 快速排序算法 例题 题目描述 具体代码: 代码分析 函数定义: 主函数: 快速排序算法 快速排序(QuickSort)是一种高效的排序算法,它采用分治策略,通过选择一个“基准”元素并将其他元素…

计算机网络面试真题总结(五)

文章收录在网站:http://hardyfish.top/ 文章收录在网站:http://hardyfish.top/ 文章收录在网站:http://hardyfish.top/ 文章收录在网站:http://hardyfish.top/ 说一说HTTP1.0,1.1,2.0 的区别 HTTP/1.0 H…

国际篮球联合会(FIBA)标准篮球比赛记录表

相关资源 下载地址>>https://download.csdn.net/download/boomcode/89675132 篮球比赛计时计分展示管理系统开发及使用手册>>

3D渐变的轮播图效果,有点儿意思!

阅读原文:原文地址 一、前言 在Web开发中,轮播图(Carousel)是一种非常常见的功能,用于展示图片或内容,通过自动或手动的方式切换不同的视图,在网页设计中扮演着重要的角色。 吸引注意力&…

用Python给英语单词批量划分音节

一、问题的缘起 最近,有网友在我的视频下面留言,问我可否把英语单词进行音节的划分?我以前也有同样的想法,但是始终没有得到解决。但是,我想使用python,学习英语的人都很多,说不定有人已经编写…

微信左滑删除聊天记录怎么恢复?记录找回秘籍,第一种更有效!

在日常的指尖滑动间,微信成为了我们生活中不可或缺的一部分,记录着与朋友、家人的温馨对话,以及工作中的重要信息。然而,当不小心的向左滑动,珍贵的聊天记录就会悄然消失。那么,微信左滑删除聊天记录怎么恢…

给儿童掏耳朵用什么工具好?2024四款精品合集汇总

在为儿童掏耳朵时,选择合适的工具非常重要。普通的金属挖耳勺太过坚硬,容易弄伤儿童脆弱的耳道,并不适合。柔软的小棉签虽然相对安全一些,但也只能清理外耳道比较浅处的耳垢,而且若使用不当同样存在风险。 相比之下&am…

大数据驱动的数字化营销策略,开启营销新征程

​在当今这个数字化时代,大数据正以崭新的大力量重塑着企业的营销策略。今天,就让我们一同深入探讨大数据驱动的数字化营销策略究竟有着怎样的魅力。用蚓链获数据资产,享大数据福利! 大数据,精准定位目标客户的神器。…

【FPGA】HDMI参数信息汇总

文章列举已知大部分个人电脑屏幕尺寸信息,主要包括720p 1080p 2k 1440p 4k 5k以及8k屏幕。屏幕水平一行包括同步脉冲、后沿间隔、活跃像素、前沿间隔;屏幕垂直包括同步脉冲、后沿间隔、活跃行数、前沿间隔。 1. 720p (1280x720) 水平总像素 (HSYNC): 16…

element-plus 新增一行合计。除了用summary-method还可以用append的插槽

:summary-method"getSummaries" <el-table:data"reformtableData"style"width: 100%"show-summary:summary-method"getSummaries"ref"reformtableRef" > <el-table-column label"序号" type"index…

ArcGIS中怎么批量计算多个点到线最近距离,以及这些点到线的纬度差?

最近&#xff0c;我接到了一个关于批量计算多个点到线最近距离&#xff0c;以及这些点到线的纬度差的咨询。 下面是我对这个问题的解决思路&#xff1a; 先解决的如何计算是纬度差的问题&#xff0c;因为纬度差直接在地理坐标系下计算即可。 1,第一步对线要素转折点 2.接着在…

AI赚钱秘籍:如何利用大模型在2024年轻松月入过万?

随着人工智能技术的飞速发展&#xff0c;大模型已成为推动行业革新的重要力量。2024年&#xff0c;利用大模型技术月入过万已不再是遥不可及的梦想。本文将揭示AI赚钱的秘籍&#xff0c;帮助您在新的一年里通过大模型技术轻松实现月入过万的目标。 一、大模型技术概述 大模型技…

录屏怎么把声音录进去?三个方法让你告别无声录屏!

在数字化交流日益频繁的今天&#xff0c;录屏已经成为我们工作、学习及娱乐中不可或缺的一部分。然而&#xff0c;许多人在录屏时常常发现&#xff0c;尽管画面清晰&#xff0c;但声音却未能同步录制&#xff0c;这极大地影响了视频的完整性和观赏性。别担心&#xff0c;今天我…

超易企业管理系统 ajax/Login.ashx SQL注入致RCE漏洞复现

0x01 产品简介 超易软件作为一家专业从事企业管理软件的高新技术企业,其核心产品超易企业管理系统覆盖了企业日常运营的多个方面,包括进销存管理、仓库管理、销售管理、固定资产管理、人事管理等多个模块。这些模块相互关联,共同构成了一个全面的企业管理解决方案。 0x02 …

示波器输出的csv文件如何转换为频谱图及其excel表格(频率与幅值)

示波器输出的CSV文件通常包含的是采样的时域信号数据&#xff0c;而不是直接的频率和幅度信息。这个文件一般包括时间&#xff08;Time&#xff09;和电压&#xff08;Voltage&#xff09;两列&#xff0c;记录了电压随时间变化的情况。 要从这些时域数据中得到频率和幅度的变…

chapter08-面向对象编程(super)day09

目录 298-super基本语法 299-super使用细节1 300-super使用细节2 301-super使用细节3 298-super基本语法 1、可以访问父类的属性&#xff0c;但是不能访问父类的private属性 2、可以访问父类的方法&#xff0c;但不能访问父类的private方法 3、访问父类的构造器&#xff1a;…

并联去耦电容的反谐振

1 串联谐振与并联谐振 并联谐振是一种电流谐振现象&#xff0c;其中电容器&#xff08;C&#xff09;和电感器&#xff08;L&#xff09;上的电流相互交换&#xff0c;形成谐振状态。在谐振时&#xff0c;电容器和电感器上的电流对外交换为零&#xff0c;电路呈现开路状态&…

文献阅读:Pathway Ensemble Tool癌症途径和治疗法的无偏发现

介绍 正确地识别生物途径的扰动是揭示基本疾病机制和发展急需的治疗策略的关键步骤。然而&#xff0c;目前的工具是否最优化用于无偏发现相关途径仍然不清楚。在这里&#xff0c;我们创建了“基准测试”&#xff08;Benchmark&#xff09;来严格评估现有工具&#xff0c;并发现…

如何禁止编辑PDF文件?推荐两种方法!

在日常工作中&#xff0c;我们经常会遇到需要分享重要的PDF文件的情况&#xff0c;但又希望文件内容不被随意更改。为此&#xff0c;设置PDF文件的修改限制是一个非常有效的措施。今天分享两种常见的禁止修改PDF的方法&#xff0c;一起来看看如何设置。 方法一&#xff1a;使用…