大模型-人类病理学的语言视觉AI助手

news2024/10/5 20:25:16

论文摘要翻译与评论

论文标题:

A Multimodal Generative AI Copilot for Human Pathology

摘要翻译:

计算病理学领域已经在任务特定的预测模型和任务无关的自监督视觉编码器的发展方面取得了显著进展。然而,尽管生成性人工智能快速增长,针对病理学定制的通用多模态AI助手和副驾驶的研究却很有限。在此,我们提出了PathChat,这是一个面向人类病理学的视觉-语言通用AI助手。我们通过将病理学基础视觉编码器与预训练的大型语言模型结合,并在超过45.6万个多样化的视觉语言指令上进行微调,构建了PathChat。我们将PathChat与几种多模态视觉语言AI助手和商用的GPT4V(支持ChatGPT-4的多模态通用AI助手)进行了比较。PathChat在来自不同组织起源和疾病模型的多项选择诊断问题中表现出最先进的性能。此外,使用开放式问题和人类专家评估,我们发现PathChat对与病理学相关的多样化查询产生了更准确和病理学家更喜欢的回答。作为一个可以灵活处理视觉和自然语言输入的交互式通用视觉-语言AI副驾驶,PathChat有望在病理学教育、研究和人机协作临床决策中找到有影响力的应用。

实验图

image.png
image.png

主要方法:
  1. 模型构建
  • 使用基于病理学的视觉编码器,并结合预训练的大型语言模型,形成完整的多模态大型语言模型(MLLM)。
  • 在超过45.6万个多样化的视觉语言指令上进行微调,包括99.9万个问答回合。
  1. 数据集
  • 微调数据集包含超过45.6万条指令和99.9万次问答回合。
  • 使用TCGA和内部病理学档案中的全片诊断图像(WSIs)进行模型评估。
  1. 模型评估
  • 对比了PathChat与几种多模态视觉语言AI助手和GPT4V在多项选择诊断问题和开放式问题回答中的性能。
  • 采用了包括图像和临床背景在内的多种评估策略。
主要贡献:
  1. PathChat的提出
  • PathChat作为一个通用的视觉-语言AI助手,展示了在多项病理学任务中的强大性能,特别是在诊断问题上的准确性。
  1. 高质量数据集的构建
  • 构建了一个包含45.6万条指令和99.9万次问答回合的高质量训练数据集,为模型提供了丰富的训练素材。
  1. 全面的模型评估
  • 通过对比多种先进模型,证明了PathChat在多项病理学任务中的优越性。
创新性:
  1. 多模态模型的集成
  • 将视觉编码器与预训练的大型语言模型结合,形成了一个强大的多模态模型。
  1. 广泛的训练和评估数据
  • 使用了大量的多样化数据进行微调和评估,确保了模型的广泛适用性和高性能。
方法的长强点和弱点:
  • 优势
    • 多模态结合:同时处理视觉和语言输入,提高了模型的灵活性和适用性。
    • 高性能:在多个病理学任务中表现出色,尤其是在诊断问题上。
    • 广泛应用:在病理学教育、研究和临床决策中有潜在的广泛应用。
  • 弱点
    • 数据依赖:模型的性能高度依赖于训练数据的质量和多样性。
    • 实时应用:虽然性能优越,但在实际临床应用中,实时处理和响应速度可能需要进一步优化。

通过以上分析,PathChat展示了在病理学领域中的巨大潜力,特别是在教育和临床决策支持方面。然而,未来的研究需要继续优化模型,特别是在实时应用和数据多样性方面,以确保其在更广泛的临床环境中能够有效应用。

论文下载链接

链接:https://pan.quark.cn/s/078e11dcaf9e

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1831183.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DBA常用论坛

1.ITPUB ITPUB技术论坛_专业的IT技术社区 2.ASKTOM Ask TOM

APP IOS

APP IOS苹果源生应用程序 APP Android-CSDN博客

编写乘法器求解算法表达式

描述 编写一个4bit乘法器模块,并例化该乘法器求解c12*a5*b,其中输入信号a,b为4bit无符号数,c为输出。注意请不要直接使用*符号实现乘法功能。 模块的信号接口图如下: 要求使用Verilog HDL语言实现以上功能,并编写tes…

scrapy模块的基础使用

scrapy模块是爬虫工作者最常用的一个模块之一,因它有许多好用的模板,和丰富的中间件,深受欢迎。 一,scrapy的安装 可以通过pypi的指引进行安装 在终端内输入以下代码: pip install scrapy 二,项目的建…

【学习笔记】MySQL(Ⅱ)

MySQL(Ⅱ) 7、 进阶篇 —— 存储引擎 7.1、MySQL 体系结构 7.2、存储引擎 7.2.1 InnoDB 7.2.2 MyISAM 7.2.3 Memory 7.2.4 InnoDB、MyISAM、Memory 的比较8、 拓展篇 —— 在 Linux 上安装数据库9、进阶篇 —— 索引 …

SmartEDA、Multisim、Proteus大比拼:电路设计王者之争?

在电路设计领域,SmartEDA、Multisim和Proteus无疑是三款备受瞩目的软件工具。它们各自拥有独特的功能和优势,但在这场电路设计王者的竞争中,谁才是真正的领跑者?让我们深入探究这三款软件的异同,揭示它们各自的魅力所在…

rabbitMQ的简单使用

rabbitMQ的介绍 RabbitMQ是一个开源的消息代理和队列服务器,主要用于在不同的应用程序之间传递消息。它基于AMQP(Advanced Message Queuing Protocol)协议,提供了一种可靠的方式来处理异步通信。RabbitMQ使用Erlang语言编写&…

【VUE3学习手札】

VUE3学习手札 vue3成长之路学习笔记 文章目录 VUE3学习手札前言一、markRaw1.1 代码示例1.2 应用场景1.3 拓展(toRaw)1.4 实际应用 前言 主要用于自己的一个备忘,对知识点的查缺补漏 一、markRaw 将一个对象标记为不可被转为代理。返回该对象…

北京大学数字普惠金融指数(2011-2022年)

北京大学数字普惠金融指数(2011-2022年),包含省市县三级数据 数据年限:省级、地级市(2011-2022年);区县(2014-2022年) 数据格式:excel、pdf 数据来源&#xf…

java-数据结构与算法-02-数据结构-01-数组

文章目录 1. 概述2. 动态数组3. 二维数组4. 局部性原理5. 越界检查6. 习题 1. 概述 定义 在计算机科学中,数组是由一组元素(值或变量)组成的数据结构,每个元素有至少一个索引或键来标识 In computer science, an array is a dat…

subversion

subversion Install # CentOS安装Subversion yum install subversion mkdir /var/svn/ systemctl restart svnserve# Docker安装Subversion(参考:https://github.com/garethflowers/docker-svn-server) docker run \--name my-svn-server \…

气体传感器的工作原理探究

气体传感器的工作原理主要基于其内部的感应元件与目标气体之间的相互作用。不同的气体传感器可能采用不同的工作原理,但其核心目的都是将气体的浓度或成分转化为可测量和处理的电信号。 PID气体传感器 以常见的电化学式气体传感器为例,其工作原理涉及气体…

T113 Tina5.0 添加板级支持包

文章目录 环境介绍Tina5.0 SDK说明添加buildroot板级支持包添加板级支持包修改配置文件验证 添加openwrt板级支持包添加板级支持包修改配置文件验证其它 总结 环境介绍 硬件:韦东山T113工业板 软件:全志Tina 5.0 Tina5.0 SDK说明 需要明确的是&#x…

深度解析量水堰:结构、分类与设计要点

量水堰,作为水工测量中的关键设施,其精确度和多样性对于水位和流量的测量至关重要。其工作原理基于通过堰顶断面上的进水口,将水位引导至堰体内部,从而实现水位和流量的平衡。量水堰通常采用高强度、耐久的材料构建,如…

算法:分治(快排)题目练习

目录 题目一:颜色分类 题目二:排序数组 题目三:数组中的第k个最大元素 题目四:库存管理III 题目一:颜色分类 给定一个包含红色、白色和蓝色、共 n 个元素的数组 nums ,原地对它们进行排序,…

Linux_应用篇(19) V4L2 摄像头应用编程

ALPHA/Mini I.MX6U 开发板配套支持多种不同的摄像头,包括正点原子的 ov5640(500W 像素)、ov2640(200W 像素)以及 ov7725(不带 FIFO、 30W 像素)这三款摄像头,在开发板出厂系统上&…

Jupyter Notebook简介

目录 1.概述 2.诞生背景 3.历史版本 4.安装 5.卸载 6.如何使用 7.菜单和菜单项 8.示例 9.未来展望 10.总结 1.概述 Jupyter Notebook是一种基于Web的交互式计算环境,主要用于数据分析、数据科学、机器学习以及探索性编程等领域。允许用户在单个文档中编写…

3.华为trunk和access接口配置

目的:PC1 连通三层交换机LSW1 LSW1配置 [Huawei]vlan batch 10 [Huawei]interface Vlanif 10 [Huawei-Vlanif10]ip address 10.10.10.10 24 [Huawei]int g0/0/1 [Huawei-GigabitEthernet0/0/1]port link-type trunk [Huawei-GigabitEthernet0/0/1]port trunk allow…

嵌入式操作系统_2.嵌入式操作系统的一般架构

1.嵌入式操作系统的概念 嵌入式操作系统通常由硬件驱动程序、调式代理、操作系统内核、文件系统和可配置组件等功能组成,并为应用软件提供标准的API(Application Programming Interface)接口服务。 2.一般嵌入式操作系统的体系结构 从嵌入…

C#|Maui|BootstrapBlazor|Bootstrap Blazor 组件库改模板 | Bootstrap Blazor 组件库改布局,该怎么改?

先copy一个项目下来:Bootstrap Blazor 组件库 一套基于 Bootstrap 和 Blazor 的企业级组件库 发现不是很满足我的需求,我要把右下角的admin移动到左边去,该怎么移动? 先改代码 点进去到Layout.razor 文档,改成如下&am…