GPT人工智能在医疗文档中的应用

news2024/12/26 20:55:45

 应用场景

用于文档的整理。主要是针对医疗方面的文档整理。病人在打官司或者办理其他业务时,需要把很多文档整理成册并添加目录、编写概要(Summary)。这些文档有电子版本的,有纸质的扫描件,还有拍照(一般是事故或者车祸现场)等等。一些复杂的病人,一个病人有超过7万8千页的文档。现在每年有超过2.1亿页业务量进行处理。目前主要是靠人工处理。为了提高效率、降低成本,引入了GPT进行自动编写目录、生成概要。

设计

主要由3个服务组成

  • JobPoster
  • JobAI
  • JobGPT

JobPoster: 把PDF、Json、TCF等文件提交到系统中,将业务数据保存到数据库中,并将GIF、PDF、XML等文件存储到云存储(这部分在2020年上线,承载着目前的也业务)。 现在对这个服务进行了扩展。根据WorkFlow的设置,将一部分病人的数据分配到JobAI上。

JobAI: 新开发的服务,用于对文档内容进行OCR,并根据病人的类型、WorkFlow的设置,形成一系列的提问(Prompt),然后把内容和提问 发送给JobGPT。

JobGPT: 调用GPT,对每页的内容进行分类,并生成概要。

实现


JobAI部分

这一部分主要的功能就两个:

  1. 对每一页的文档内容进行OCR,
  2. 针对设置形成每一页内容的提问。

OCR部分通过配置可以选择三种不同的识别引擎:Tesseract、Azure、PaddleOCR

分类提问(Prompt)是多级的(Tree)、不同类型的病人的设置也是不一样的。

分类提问(Prompt)

分类提问一般先给出分类目录 ,例如下面这个提问:

category list:
1  Injury Reports
2  Job Description/Job Analy
3  Application for Benefits
4  Accident/Police Reports
5  Phones
6  Damage Estimates
7  Recorded Statements
8  Prior IME Reports
9  Legal Documents
10  Surveillance
11  Social Media
12  HCFA Billing Summary
13  Records
14  Billing
15  Miscellaneous
16  Illegible documents
17  Removed
18  Unused Images

Your task is to find the category of the document given below:
9/1/2023 1:52 PM EDT

。。。。。(文档内容)

GPT会返回这样的结果:

Category: Records

再根据分类的结果进行数据提问

数据提问(Prompt)

field list:
Date
Facility
Type of Document
Default Text
Type of Test


Your task is to find the field value of the document given below:
9/1/2023 1:52 PM EDT

。。。。。(文档内容)

 JobGPT部分

这部分主要是调用GPT,将提问(Prompt)和每一页的内容发送给GPT,根据GPT返回的结果进行编写目录和生成概要。使用了Azure Key和GPT进行通讯。

        public static string  CallAI( string deploymentName,  string inputToAI, string uri, string AzureKey)
        {
            OpenAIClient client = GetOpenAIClient(uri, AzureKey);
            ChatCompletionsOptions chatcompletionOptions = new ChatCompletionsOptions
                {
                    MaxTokens = 1300,
                    Temperature = 0.0f,
                    FrequencyPenalty = 0,
                    PresencePenalty = 0,
                };
                chatcompletionOptions.Messages.Add(new ChatMessage(ChatRole.System, inputToAI));
                Task<Response<ChatCompletions>> task=   client.GetChatCompletionsAsync(deploymentName, chatcompletionOptions);
                 task.Wait();

            Response<ChatCompletions> completionsResponse = task.Result;
            ChatMessage completion = completionsResponse.Value.Choices[0].Message; 
            return completion.Content;

        }
        public static OpenAIClient GetOpenAIClient(string uri, string AzureKey)
        { 

             OpenAIClient client = new OpenAIClient (new System.Uri(uri),new AzureKeyCredential(AzureKey)); 

            return client;
        }

namespace JobGPT
{
    public class JobAIInfoPage
    {
        public string PageNum = "";
        public string Text = "";
        public List<string> Classify = new List<string>();
        public Dictionary<string, string> Field = new Dictionary<string, string>();
    }
    public class ClassifyInfo
    {
        public string TOC = "";
        public List<string> SegmentTag = new List<string>();
        public List<ClassifyInfo> Nodes = new List<ClassifyInfo>();
    }
    public class JobAIInfo
    {
        public string JobNo = "";
        public List<ClassifyInfo> ClassifyTOC = new List<ClassifyInfo>();
        public List<JobAIInfoPage> Pages = new List<JobAIInfoPage>();

        public string Medsum = "";
        public bool GPTResult = false;
    }
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2266022.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

unity 打包出来的所有执行文件内容打包成一个exe程序

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、使用Enigma Virtual Box1.下载安装包&#xff08;根据需要32位还是64位。一般是64位&#xff09;2.改个语言&#xff0c;方便使用&#xff08;改了后重启才…

vtie项目中使用到了TailwindCSS,如何打包成一个单独的CSS文件(优化、压缩)

在不依赖 Vite 或其他构建工具的情况下&#xff0c;使用 TailwindCSS CLI 快速生成独立的 CSS 文件是一种简单高效的方法&#xff0c;适合需要纯样式文件的场景。 这个项目中&#xff0c;使用到了tailwindCss, 需要把里面的样式打包出来&#xff0c;给其他项目用。 使用命令生…

物联网网络中的设备认证方法

论文标题&#xff1a;DEVICE AUTHENTICATION METHOD IN INTERNET OF THINGS NETWORKS&#xff08;物联网网络中的设备认证方法&#xff09; 作者信息&#xff1a; A.Ya. Davletova&#xff0c;West Ukrainian National University, 11, Lvivska Str. Ternopil, 46009, Ukraine…

重温设计模式--迭代器模式

文章目录 迭代器模式&#xff08;Iterator Pattern&#xff09;概述迭代器模式的结构迭代器模式UML图C 代码示例应用场景 迭代器模式&#xff08;Iterator Pattern&#xff09;概述 定义&#xff1a; 迭代器模式是一种行为型设计模式&#xff0c;它提供了一种方法来顺序访问一个…

大数据机器学习算法和计算机视觉应用07:机器学习

Machine Learning Goal of Machine LearningLinear ClassificationSolutionNumerical output example: linear regressionStochastic Gradient DescentMatrix Acceleration Goal of Machine Learning 机器学习的目标 假设现在有一组数据 x i , y i {x_i,y_i} xi​,yi​&…

华院计算参与项目再次被《新闻联播》报道

12月17日&#xff0c;央视《新闻联播》播出我国推进乡村振兴取得积极进展。其中&#xff0c;华院计算参与的江西省防止返贫监测帮扶大数据系统被报道&#xff0c;该系统实现了由原来的“人找人”向“数据找人”的转变&#xff0c;有效提升监测帮扶及时性和有效性&#xff0c;守…

【视觉惯性SLAM:相机成像模型】

相机成像模型介绍 相机成像模型是计算机视觉和图像处理中的核心内容&#xff0c;它描述了真实三维世界如何通过相机映射到二维图像平面。相机成像模型通常包括针孔相机的基本成像原理、数学模型&#xff0c;以及在实际应用中如何处理相机的各种畸变现象。 一、针孔相机成像原…

使用RTP 协议 对 H264 封包和解包,h264的avpacket和NAL的关系

学习内容&#xff1a; 本章探讨如何将h264的 avpacket的视频 数据&#xff0c;通过RTP协议发送到 流媒体 服务器 或者 对端接受者。 前提 我们在将 YUV数据变成avframe后&#xff0c;通过h264 编码变成AVPacket&#xff0c;例如&#xff0c;在安防项目中&#xff0c;或者直播…

python 随笔80%核心笔记(一)

目录 一、海龟 二、pygame 三、函数 四、类与对象 五、列表与元组 六、其他 1、格式化输出 2、最大公约数、最小公倍数 3、print、多变量一起定义赋值、end以及列表的方法 4、序列重复、字符串方法、其他列表方法、input 5、字典的方法、ASCII码转换、返回值、修改私人…

MySQL数据库函数——字符函数

目录 引言 常用字符函数表 举例 例子一——工号前加0凑够5位 引言 字符函数&#xff0c;顾名思义就是运用在字符串的函数&#xff0c;下列是一些较为常用的字符函数。 常用字符函数表 函数功能concat&#xff08;S1,S2,.....Sn&#xff09;字符串拼接&#xff0c;将S1&…

算法练习——位运算

前言&#xff1a;位运算的方法大多比较抽象&#xff0c;很难想到。 一&#xff1a;判断字符是否唯一 题目要求&#xff1a; 解题思路&#xff1a; 法一&#xff1a;使用hash的思想&#xff0c;统计每一个字母出现的次数&#xff0c;再通过一次循环遍历查询是否有超过1的字母&…

TCN-Transformer+LSTM多变量回归预测(Matlab)添加气泡图、散点密度图

TCN-TransformerLSTM多变量回归预测&#xff08;Matlab&#xff09;添加气泡图、散点密度图 目录 TCN-TransformerLSTM多变量回归预测&#xff08;Matlab&#xff09;添加气泡图、散点密度图预测效果基本介绍程序设计参考资料 预测效果 基本介绍 基本介绍 1.双路创新&#xff…

【免费分享】mysql笔记,涵盖查询、缓存、存储过程、索引,优化。

概括 本篇笔记涵盖基础查询、视图、存储过程、函数、索引、优化、分库分表。适合在学完mysql后进行时常观看。下面展示部分内容。如果需要可以在文章底部的链接进行下载查看。 简介 数据库 数据库&#xff1a;DataBase&#xff0c;简称 DB&#xff0c;存储和管理数据的仓库…

DataSourceClosedException_ dataSource already closed

修改了项目中kafka相关配置&#xff0c;准备上线&#xff0c;控制台一直报错&#xff1a; 一直不停的在刷数据库连接池已关闭&#xff1f;&#xff1f;&#xff1f; 只改了kafka相关的配置&#xff0c;为什么数据库连接池一直在报错&#xff1f;即使kafka配置写错了&#xff…

SpringCloudAlibaba技术栈-Nacos

1、什么是Nacos&#xff1f; Nacos是个服务中心&#xff0c;就是你项目每个功能模块都会有个名字&#xff0c;比如支付模块,我们先给这个模块起个名字就叫paymentService,然后将这个名字和这个模块的配置放到Nacos中&#xff0c;其他模块也是这样的。好处是这样能更好地管理项…

Java中使用四叶天动态代理IP构建ip代理池,实现httpClient和Jsoup代理ip爬虫

在本次爬虫项目中&#xff0c;关于应用IP代理池方面&#xff0c;具体完成以下功能&#xff1a; 从指定API地址提取IP到ip池中&#xff08;一次提取的IP数量可以自定义更改&#xff09; 每次开始爬虫前&#xff08;多条爬虫线程并发执行&#xff09;&#xff0c;从ip池中获取一…

MySQL 数据库优化详解【Java数据库调优】

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c; 忍不住分享一下给大家。点击跳转到网站 学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……&#xff09; 2、学会Oracle数据库入门到入土用法(创作中……&#xff09; 3、手把…

工业大数据分析算法实战-day15

文章目录 day15特定数据类型的算法工业分析中的数据预处理工况划分数据缺失时间数据不连续强噪声大惯性系统趋势项消除 day15 今天是第15天&#xff0c;昨日是针对最优化算法、规则推理算法、系统辨识算法进行了阐述&#xff0c;今日主要是针对其他算法中的特定数据类型的算法…

定时任务——定时任务技术选型

摘要 本文深入探讨了定时任务调度系统的核心问题、技术选型&#xff0c;并对Quartz、Elastic-Job、XXL-Job、Spring Task/ScheduledExecutor、Apache Airflow和Kubernetes CronJob等开源定时任务框架进行了比较分析&#xff0c;包括它们的特点、适用场景和技术栈。文章还讨论了…

前端遇见AI:打造智能应用的新时代

随着技术的发展&#xff0c;AI&#xff08;人工智能&#xff09;不再局限于后端服务器上运行的复杂算法&#xff0c;而是逐渐渗透到前端领域&#xff0c;成为提升用户体验和应用智能水平的关键因素。本文将探讨前端与AI结合的趋势&#xff0c;以及如何利用前端技术实现AI功能&a…