谷歌发布 HEAL 架构,4 步评估医学 AI 工具是否公平

news2024/12/23 22:27:07

如果把维持健康状态想象成一场赛跑,并不是所有人都能够站在统一起跑线上,有的人能够平稳的跑完全程,有的人即使跌倒也能够在第一时间获得帮助,但是有些人可能因为经济条件、居住地、教育水平、种族或其他因素而面临更多障碍。

「健康公平」意味着每个人都应该获得平等的健康医疗资源,才能够更加从容地完成这场赛跑,达到最佳的健康状态。 部分群体(如少数族裔、低社会经济地位人群或医疗保健获取能力有限的个体)在疾病预防、诊断和治疗方面受到不公平对待,会极大地影响其生活质量和生存机会。毫无疑问,提高对「健康公平」的关注度应该在全球范围在成为共识,从而进一步解决导致不平等的根本原因。

如今,虽然机器学习、深度学习等已经在医疗健康领域「有所建树」,甚至已经走出实验室、走向临床一线。感叹于 AI 的强大能力时,人们更应该关注,这一类新兴技术的落地应用,是否会加剧健康资源不平等现象呢?

图片

健康公平评估示意图

  • 浅蓝色条表示预先存在的健康结果

  • 深蓝色条形图说明了干预措施对预先存在的健康结果的影响

为此,Google 团队开发了 HEAL (The health equity framework) 框架,能够定量评估基于机器学习的医疗健康方案是否「公平」。 通过这种方法,研究团队试图确保新兴的健康技术能够有效地减少健康不平等,而不是无意中加剧这些不平等。

HEAL 架构:4 步评估皮肤科 AI 工具公平性

HEAL 框架包含 4 个步骤:

  1. 确定与卫生健康不公平有关的因素,并定义 AI 工具性能指标

  2. 明确并量化先前存在的健康差异 (disparities)

  3. AI 工具性能测试

  4. 衡量 AI 工具优先考虑健康公平差距的可能性

图片

HEAL 架构,以皮肤科疾病诊疗 AI 工具为例

第一步:确定皮肤科中与健康不公平有关的因素,明确评估 AI 工具性能的指标

研究人员通过查阅文献并综合考虑数据可用性,选定以下因素——年龄、性别、种族/族裔和 Fitzpatrick skin type (FST)。

FST 是根据人体皮肤对紫外线 (UV) 辐射、特别是晒伤和晒黑的反应,对皮肤进行分类的系统。范围从 FST I 到 FST VI,每种类型代表皮肤、眼睛和头发黑色素生成的不同水平,以及对紫外线的敏感度。

此外,研究人员选择 top-3 agreement 作为评估 AI 工具性能的指标,其定义是,AI 建议的前 3 项条件中至少有一项与皮肤科专家小组的参考诊断相匹配的病例比例。

第二步:确定皮肤科现存的「健康差异」

健康差异指标是用来量化、描述不同群体之间的健康状态不平等的具体量度。这些群体根据种族、经济状况、地理位置、性别、年龄、残疾状况或其他社会决定因素进行区分。

以下是一些常见的健康差异指标:

失能调整生命年 (disability-adjusted life years, DALYs) :反映由于疾病、伤残或早逝造成的健康生命损失年数。DALY 是一种综合指标,是寿命损失年数 (years of potential life lost, YLLs) 和带疾病生活的年数 (years lived with disability, YLDs) 的加总。

生命损失年数(YLLs) :由于早逝而损失的预期健康年数。

同时,研究人员还对皮肤癌进行了子分析 (sub-analysis),以理解 AI 工具的性能在高风险条件下的变化。研究使用 Global Burden of Disease (GBD) 的「非黑色素瘤皮肤癌」和「恶性皮肤黑色素瘤」类别来估计所有癌症的健康结果,以及「皮肤和皮下疾病」类别用于所有非癌症条件。

第三步:测量 AI 工具的性能

通过比较 AI 预测的排名病状与评估数据集上的参考诊断(根据年龄、性别、种族/族裔和eFST分层的亚群体)来测量 top-3 agreement 一致性。

第四步:检测 AI 工具在考虑健康差异方面的性能

量化皮肤疾病 AI 工具的 HEAL 指标,具体方法如下:

对每个亚群体 (subpopulations),需要两个输入:预先存在的健康差异的量化度量,以及 AI 工具性能。

计算给定不平等因素(例如种族/族裔)中,所有亚群体之间的健康结果和 AI 性能之间的反相关性 R,R 正值越大,对健康公平的考虑越全面。

将 AI 工具的 HEAL 指标定义为:p(R > 0),通过 9,999 个样本的 R 分布估算出 AI 优先考虑预先存在的健康差异的可能性。HEAL 指标超过 50% 则意味着有更高的可能性实现健康公平;低于 50% 则意味着实现公平性能的可能性较低。

皮肤病 AI 工具测评:某些子群体仍需提高

种族/族裔:HEAL 指标为 80.5%,表明对这些子群体中存在的健康差异有较高的优先级。

性别:HEAL 指标为 92.1%,表明性别在 AI 工具性能考虑健康差异方面有很高的优先级。

年龄:HEAL 指标为 0.0%,表明在不同年龄组中优先考虑健康差异的可能性低。对于癌症条件,HEAL 指标为 73.8%,而非癌症条件的 HEAL 指标为 0.0%。

图片

不同年龄段、是否有癌症群体的 HEAL 指标

研究人员进行了逻辑回归分析,结果表明,年龄和某些皮肤病条件(例如基底细胞癌和鳞状细胞癌)对 AI 性能有显著影响,而对于其他条件(例如囊肿)的表现则不够准确。

此外,研究人员还进行了交叉性分析,通过细分的 GBD 健康结果测量工具,进行了年龄、性别和种族/族裔交叉的扩展 HEAL 分析,整体 HEAL 指标为 17.0%。特别关注在健康结果和 AI 性能两方面排名较低的交叉点,识别了需要提高 AI 工具性能的子群体,其中包括 50 岁以上的西班牙裔女性、50 岁以上的黑人女性、50 岁以上的白人女性、20-49 岁的白人男性以及 50 岁以上的亚太裔男性。

也就是说,提高针对这些群体的 AI 工具性能对于实现健康公平至关重要。

不只是健康公平:AI 公平性的广大蓝图

显而易见,健康不平等现象在不同的种族/族裔、性别和年龄群体中显著存在,尤其是在高科技医疗技术飞速发展之下,健康资源的倾斜甚至有所加剧。在解决相关问题的过程中,AI 任重道远。但值得注意的是,由科技进步所带来的不公平现象其实广泛存在于人们生活的方方面面,如数字鸿沟导致的信息获取、在线教育和数字服务的不平等。

Google AI 负责人、「程序员大神」Jeff Dean 曾表示,Google 对于 AI 公平性非常重视,在数据、算法、传播分析、模型可解释性、文化差异性研究以及大模型隐私保护等方面做了大量工作。例如:

2019 年,谷歌云的负责任 AI 产品审查委员会、谷歌云负责任 AI 交易审查委员会,为避免加重算法不公平或偏见,暂停开发与信贷有关的人工智能产品。2021 年,先进技术审查委员会对涉及大型语言模型的研究进行审查,认为其可以谨慎地继续,但在进行全面的人工智能原则审查之前,此模型不能被正式推出。Google DeepMind 团队曾发布论文,探讨「如何将人类价值观融入 AI 系统」,将哲学思想融入 AI, 帮助其建立社会公平性。

未来,为了保证 AI 技术的公平性, 需要从多个角度进行干预与治理,如:

公平的数据收集与处理: 确保训练数据覆盖多样性,包括不同性别、年龄、种族、文化和社会经济背景的人群。同时,要避免因偏见而导致的数据选择,确保数据集的代表性和平衡性。

消除算法偏见: 在模型设计阶段,要主动识别和消除可能导致不公平结果的算法偏见。这可能涉及到对模型的输入特征进行仔细选择,或者使用特定的技术来减少或消除偏见。

公平性评估: 在模型部署前后,都应进行公平性评估。这包括使用各种公平性度量标准来评估模型对不同群体的影响,并根据评估结果进行必要的调整。

持续监控与迭代改进: AI 系统部署后,应持续监控其在实际环境中的表现,及时发现并解决可能出现的不公平问题。这可能需要定期迭代模型,以适应环境变化和新的社会规范。

随着 AI 技术的发展,相关的伦理准则和法律法规也将得到进一步的完善,让 AI 技术在更加公平的框架内发展。同时将更加注重多样性和包容性。而这就需要在数据收集、算法设计、产品开发等各个环节都考虑到不同群体的需求和特点。

长远来看,AI 改变生活的真谛应该是更好地服务于不同性别、年龄、种族、文化和社会经济背景的人群,减少因技术应用而产生的不公平现象。随着公众认知水平不断提高,是否能够让更多人参与到 AI 发展的规划中,对 AI 技术的发展提出建议,从而确保技术的发展符合社会的整体利益。

AI 技术公平性的广大蓝图需要技术、社会、法律等多个领域的共同努力,不要令先进技术成为「马太效应」的推手。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1648041.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AHB---数据总线

1. 数据总线 为了实现AHB系统,需要独立的读写数据总线。虽然推荐的最小数据总线宽度被指定为32位,但这可以根据数据总线宽度进行更改。 数据总线包含以下部分: HWDATAHRDATAEndianness(字节序) 1.1 HWDATA 在写传输…

2024年最新 CKA 导航页

1. Dokcer 基础相关 Docker 、 Docker-Compose 安装教程Docker基础知识、相关概念以及基本使用命令Docker 一句话删除所有镜像/容器 2. CKA 相关学习 CKA(Certified Kubernetes Administrator)是由 Cloud Native Computing Foundation(CNC…

嵌入式C语言教程:实现声音监测系统

声音监测在许多应用中都十分重要,如噪声控制、安全系统、和智能家居控制。 本教程将介绍如何在STM32微控制器上使用模数转换器(ADC)和声音传感器实现实时声音监测系统。 一、开发环境准备 硬件要求 微控制器:STM32F746NG&…

美国站群服务器在站群管理中的防护和数据安全保障?

美国站群服务器在站群管理中的防护和数据安全保障? 美国站群服务器的防护和数据安全保障是站群管理中的关键问题。站群服务器位于美国,通常由专业的服务器提供商管理和维护,其安全性受到多方面因素的影响。 美国站群服务器在站群管理中的防护和数据安全…

《深入解析WIndows操作系统》第10章读书笔记

1、大页面和小页面:虚拟地址空间被划分成以页面为单位,这是因为硬件内存管理单元在页面的粒度上,将虚拟地址转译为物理地址。Windows支持两种页面尺寸:大页面和小页面,根据处理器体系结构不同,实际尺寸值有…

Springai入门

一、概述 1.1发展历史 1.2大模型 大模型,是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。其设计目的在于提高模型的表达能力和预测性能,以应对更加复杂的任务和数据&…

Guer完成对Gallium Semi的GaN产品组合的收购

预计到2024年6月,完整的射频氮化镓产品组合将完成整合 总部位于美国的Guerrilla RF (GUER)已完成对镓半导体公司GaN功率放大器和前端模块的全部收购。 自2024年4月26日起,GUER收购了Gallium Semiconductor先前发布的所有组件以及正在开发的新内核。此外…

2024蓝桥杯RSA-Theorem

方法1:直接使用工具yafu解题 yafu的使用方法 安装:解压后直接使用即可,在文件包内,执行命令终端,输入命令行 1、如果数比较小,进入该文件的目录后可以直接使用: yafu-x64 factor(n) 如果是powershell&…

本地存储和cookie之间的区别是什么?

本地存储和cookie是两种在web开发中常用的客户端存储技术,它们都可以用来在用户的浏览器中存储数据,但是它们之间有一些重要的区别。 本地存储是HTML5引入的一种客户端存储技术,它允许开发者在用户的浏览器中存储大量的数据,包括…

MySQL 中的HASH详解

MySQL中的哈希索引(Hash Index)是一种特殊的数据库索引类型,它利用哈希表(Hash Table)的数据结构来存储索引项。哈希表通过哈希函数(Hash Function)将索引列的值转化为一个固定长度的哈希码&…

【资源分享】Origin2022Pro免费安装下载

::: block-1 “时问桫椤”是一个致力于为本科生到研究生教育阶段提供帮助的不太正式的公众号。我们旨在在大家感到困惑、痛苦或面临困难时伸出援手。通过总结广大研究生的经验,帮助大家尽早适应研究生生活,尽快了解科研的本质。祝一切顺利!—…

机器人系统ros2-开发实践06-将静态坐标系广播到 tf2(Python)-定义机器人底座与其传感器或非移动部件之间的关系

发布静态变换对于定义机器人底座与其传感器或非移动部件之间的关系非常有用。例如,最容易推断激光扫描仪中心框架中的激光扫描测量结果。 1. 创建包 首先,我们将创建一个用于本教程和后续教程的包。调用的包learning_tf2_py将依赖于geometry_msgs、pyth…

Advanced RAG 06:生成结果的相关性低? 快用 Query Rewriting 优化技术

编者按:在现实生活中,普通用户很难编写合适的提示词(prompt)来指示 LLM 完成期望任务。用户提出的 queries 往往存在词汇不准确、缺乏语义信息等问题,导致 LLM 难以理解并生成相关的模型响应。因此,如何优化…

关于二手车系统学习--登录模块

1.样式1-17行 <div class"cheader"><div style"width: 80%;margin: 0 auto;line-height: 50px;padding-top: 10px"><el-row><el-col:span"5"style"font-size: 20px;cursor: pointer;color: #00ae66;font-weight: bold…

sqlserver中替换空格和换行

sqlserver 中换行符&#xff0c;如下&#xff1a; sql语句如下&#xff1a; //替换换行-使用char(10) select REPLACE(F_CNKITitle ,char(10),) title from tzkj_CNKIContent tc where --F_CnkiContentID ffdc7412-41e1-4d42-8693-cc79d0cf2dd3and len(REPLACE(F_CNKITitle ,…

K邻算法:在风险传导中的创新应用与实践价值

程序员的实用神器 ⛳️ 写在前面参与规则&#xff01;&#xff01;&#xff01; ✅参与方式&#xff1a;关注博主、点赞、收藏、评论&#xff0c;任意评论&#xff08;每人最多评论三次&#xff09; ⛳️本次送书1~4本【取决于阅读量&#xff0c;阅读量越多&#xff0c;送的越…

如何应对Android面试官 -> PKMS 权限管理

前言 本章我们继续上一章节&#xff0c;讲解 PKMS 相关知识点&#xff1b; 静默安装 静默安装说的就是&#xff1a;在用户无感知的情况下&#xff0c;给用户的手机安装了某个 app&#xff0c;或者是用户触发安装之后&#xff0c;不需要额外的任何操作即可以安装目标 app 到手机…

软件测试经理工作日常随记【2】-接口自动化

软件测试主管工作日常随记【2】-接口自动化 1.接口自动化 jmeter-反电诈项目 这个我做过的一个非常有意义的项目&#xff0c;和腾讯合作的&#xff0c;主要为用户拦截并提示所有可能涉及到的诈骗类型&#xff0c;并以裂变的形式扩展用户&#xff0c;这个项目前期后端先完成&…

Linux 二十一章

&#x1f436;博主主页&#xff1a;ᰔᩚ. 一怀明月ꦿ ❤️‍&#x1f525;专栏系列&#xff1a;线性代数&#xff0c;C初学者入门训练&#xff0c;题解C&#xff0c;C的使用文章&#xff0c;「初学」C&#xff0c;linux &#x1f525;座右铭&#xff1a;“不要等到什么都没有了…

1000公里清晰可见,光纤资源管理新方案——记录与查询

01传统模式光纤资源管理下 记录难 不止有手工记录与CAD记录&#xff0c;还有Excel、PPT、Visio、JPG、PNG、老师傅经验记... 查询难 需要大量翻查CAD、Excel、PPT、Visio、JPG、PNG才能得到完整光缆的信息&#xff0c;可是老师傅记录怎么查询&…