问诊住院医疗业务数仓建模实操案例

news2024/11/25 8:15:03

一、数仓建模实超案例

(一)前言
医疗业务系统比较复杂,有HIS:医院信息管理系统( Hospital Information System)、CIS:临床信息系统(Clinical Information System)、LIS:实验室信息管理系统(Laboratory Information Management System)、EMR:电子病历(EMR,Electronic Medical Record)、PACS:影像归档和通信系统、RIS:放射科信息系统(Radiology Information System)、GMIS:区域信息系统、HRP:医院资源管理系统(Hospital Resource Planning )等,每个模块又包含很多其子系统。
在这里插入图片描述
在进行数仓模型建设的时候,先从整体来看,划分业务模块,再根据大的业务模块划分小的业务模块,然后再根据业务系统进行划分,梳理出整个业务划分情况,再梳理出每个系统的划分情况和依赖情况。
(二)本次建模情况介绍
本次建模只针对问诊、住院业务模块进行数仓建模。
1、问诊、住院系统涉及到的系统和表结构
一个业务系统里面,不仅仅有业务表,还有一些数据统计的表,我们要区分出来哪些业务表,而且后面做指标计算的时候,也可以根据业务数据统计表去验证我们的指标体系设计是否正确和合理。
本次模型设计,是用了天津的一个HIS系统厂商的门诊系统的数据结构。其中系统中表有324张,从业务角度和表信息了解来看,大概分为预约、挂号、叫号、诊断、开方、缴费、检查、检验、开药、煎药、拿药、复诊、退费、评价14个业务过程。
涉及维度有医院、医生、科室、药品、耗材、诊疗、时间、地区、患者、疾病、手术、检查检验项目12个大维度。
his系统表结构请私聊。因his系统涉及保密性,不能对外展示。但是医院的业务基本差不多,涉及维度基本一致,(无则添加)因此不影响最终模型的应用。(业务系统的任何一个业务操作都应该设计时间字段)
在这里插入图片描述

2、数据域划分
数仓数据域就是公司业务中联系较为密切的的数据主题的集合,一般可以根据业务过程、业务部门、业务系统来划分(比如医疗服务域、费用域、用户域),一个数据域包含多个主题。
数据域,通常根据业务部门、业务系统、业务过程划分数据域。一般情况下,每个公司的部分划分可能不同,而且公司调整架构业务部门会进行划分,但是业务过程差别不会特别大,且部门调整不会影响业务过程,因此此次划分主题域按照业务过程进行划分。
需要注意的是一个业务过程只能属于一个数据域。
数据域的划分要谨慎划分,一旦确定下来避免频繁变动,虽然数仓建设是迭代建设的,不能保证一次性初始化好,但我们的数据域划分和主题划分要尽可能地涵盖企业的所有业务,以及在新业务进来时能够无影响地被包含进来和可扩展数据域。

数据域业务过程
挂号域预约、挂号、取号、叫号、退号、过号
医疗过程域(医疗服务域)诊断、开方、检查、检验、手术、麻醉、输血、护理
费用域缴费、退费
用户域注册、登录
互动域评价、收藏
工具域优惠卷领取、优惠卷使用(下单)、优惠卷使用(支付)

业务总线矩阵
业务总线矩阵中包含维度模型所需的所有事实(业务过程)以及维度,以及各业务过程与各维度的关系。矩阵的行是一个个业务过程,矩阵的列是一个个的维度,行列的交点表示业务过程与维度的关系。
在这里插入图片描述

3、主题划分
主题域是对实体的逻辑分组,我们以上帝视角去看企业的业务系统,梳理企业的业务实体,实体与实体之间的关系,将企业中的数据进行逻辑划分。相同主题域中的数据联系紧密,不同主题域之间的数据相互独立。所以主题域的划分没有任何的技术含义,只是一种概念,能帮助数据使用者快速找到数据的一种分类方法。就像图书馆的图书分类一样,图书分类共分为22个大类:分为军事、文学、艺术等,比如文学又包含:小说、散文、诗歌、戏剧等。这些就是图书的主题域。
数仓主题就是在较高层次上将企业生产上的各个系统中某一分析对象的数据进行整合(比如医生主题、药品主题、患者主题)、归纳并分析的一种范围,一个主题就是一个实体对象。
比如用户主题域包含医生主题、护士主题、行政人员主题、患者主题。
药品主题域包含西药主题、中药主题、中草药主题、中药饮片主题。

主题域主题
用户主题域医生、护士、行政人员、患者
三目录主题域药品、诊疗项目、医用材料
地点主题域医院、科室、省份、城市、家庭住址
时间主题域日期、时间
号源主题域号源

在这里插入图片描述

4、业务表梳理

  1. 挂号域涉及到的业务表
    app_register_record:预约业务表
    outp_Register:挂号业务表
    outp_RegLock:挂号锁号表
    sys_QueueNo:叫号序列表
    call_queue_list:叫号队列表
    call_screen_config:叫号终端屏配置表

  2. 医疗过程域涉及到的业务表
    outp_OutpatientDiag:门诊信息——诊断
    outp_OutPatientDrug:门诊信息——用药
    outp_OutPatientSymp:门诊信息——症状
    outp_OutPatientTest:门诊信息——检查检验
    outp_OperRecord:手术记录

  3. 费用域涉及到的业务表
    outp_OutPatientFee:门诊信息——费用

  4. 用户域涉及到的业务表
    yb_user:医保用户表

  5. 互动域涉及到的业务表
    ys_evaluate:医生评价表
    ys_holdings:医生收藏表

  6. 工具域涉及到的业务表
    ts_coupon:特殊优惠卷使用表

4、维度提取
维度模型的设计参照上述得到的业务总线矩阵即可。事实表存储在DWD层,维度表存储在DIM层。
维度表包含:时间:时间、场:医院、科室、人:医生、护士、患者、行政人员、货:号源、三目录(药品、诊疗、医用材料)、疾病、手术、护理信息表(输液、灌肠、消毒等)、优惠卷。

5、事实表提取(业务梳理提取)
在这里插入图片描述

6、维度表设计
在这里插入图片描述
无法完全展示,有需要可以咨询附件。

7、事实表设计
挂号域-明细事实表
在这里插入图片描述
医疗过程域-明细事实表
在这里插入图片描述
费用域-明细事实表

在这里插入图片描述
用户域-明细事实表
在这里插入图片描述

互动域-明细事实表

在这里插入图片描述
工具域-明细事实表

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/718845.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

临床数据 1. 临床基因突变数据如何发高分?

桓峰基因公众号的粉丝中医学类科研偏多,因此对于临床数据的分析需求还是很多的,因此我们再次推出临床数据相关的一些文献以及对应的分析方法,那么临床数据大概哪几类呢? 临床信息 患者的个人信息包括性别、年龄、家族遗传史、吸烟…

微众区块链开源分布式数据协作管理解决方案,建数据要素高效流通桥梁

数据要素已成为数字经济时代最核心的生产要素,为助力全行业伙伴提升区块链数据协作管理效率、保障数据要素高效有序流通,微众区块链在多年技术研究和应用实践的基础上,积极分析总结行业需求,研发了分布式数据协作管理解决方案DDCM…

css文字图标(阿里图标)使用及引入方式

首先打开 iconfont图标 网页 选择素材库中的单色图标库 选择自己需要用的图标 这里简绍四种类型的引入方式,其中是网页上的三种引入方式: 1. Unicode 使用方式 复制代码 引入样式 (这里是线上引入 通过网址引入的) 引入样式注意路径完整性 标签中间放入…

如何在Forlinx OK3588-C EVK上安装OpenCV?

OpenCV(开源计算机视觉库)是一个开源计算机视觉和机器学习软件库。 OpenCV 广泛应用于计算机视觉、机器人、智能交通、医学成像、安全等领域。 Forlinx RK3588 EVK 是一款高性能嵌入式计算机,结合 OpenCV,可进行高效的图像和视频处…

七牛云面试复盘-实习后端Java开发 一面复盘 【已通过】

💪💪💪欢迎订阅本专栏,持续更新,本专栏内容为我参加的各个公司面试的复盘专栏。将完整记录面试细节问题。 七牛云面试 实习后端Java开发 一面 [视频面试] 首先自我介绍 我是XXX,来自XXX,XXXX。 面试官提问: 1.先问几个基础题,循序渐进的来哈,谈谈Java⾃动装箱…

IM6ull LCD 驱动

一 LCD 简介 LCD(Liquid Crystal Display),液晶显示器。LCD的构造是在两片平行的玻璃基板中放置液晶盒,下基板玻璃上设置TFT(薄膜晶体管),上基板玻璃上设置彩色滤光片,通过TFT上的…

IDEA 集成 GIT

文章目录 16.IDEA中使用GIT-基本操作-add与commit 掌握目标内容 17.IDEA中使用GIT-基本操作-差异化比较目标内容 18.IDEA中使用GIT-基本操作-版本回退及撤消目标内容 19.IDEA中使用GIT-远程仓库-创建与关联远程仓库学习目标: 20.GitLab使用介绍_项目、用户和组介绍(…

Spark环境搭建与使用

第4关:使用Maven对Java独立应用程序进行编译打包 目录 第4关:使用Maven对Java独立应用程序进行编译打包 任务描述 相关知识 Maven安装 编程要求 任务描述 本关任务:编写一个简单的应用程序simpleApp2(实现spark自带文件REA…

Git使用入门

文章目录 简介安装linux离线安装windows安装 用户配置简单使用设置用户名提交至暂存区提交delete变更git add . 与 git add * 向远程库pushpush -f 分支建空白分支分支合并分支冲突 从远程库pull当远程库版本跟本地仓库不一致直接pull尚未pull 暂存区文件移除gitignoregitignor…

DuDuTalk:人工智能时代,AI技术如何赋能销售?

在数字化时代,人工智能(AI)正悄然改变着我们的生活和工作方式。销售领域作为商业运营的核心,自然也不能幸免于AI技术的影响。通过应用人工智能,销售团队能够在客户关系管理、销售预测、个性化营销等方面获得巨大的优势…

保姆级AT32F437 配置RT-Thread 以太网(UDP/TCP Server)

好记性不如烂笔头,既然不够聪明,就乖乖的做笔记,温故而知新。 本文档用于本人对知识点的梳理和记录。 一、前言 ENV版本:v1.3.5 rt-thread版本:V5 开发板:雅特力AT32F437 AT-START-F437 二、ENV配置 E…

回顾 | Let's Learn .NET - Web 开发实战

点击蓝字 关注我们 编辑:Alan Wang 排版:Rani Sun Lets Learn .NET 系列 “Lets Learn .NET” 是面向全球的 .NET 初学者学习系列,旨在通过不同语言,帮助不同地区的开发者掌握最新的 .NET 开发知识与技能。 “Lets Learn .NET”系…

【云原生架构模式】库(Library ) vs 服务(Service ) vs Sidecar(边车)

所有软件应用程序都由可重用的元素组成。这些可重用元素的目标和功能从基础设施级别到安全级别到业务能力各不相同。本文的目的是比较用于构建和部署这些可重用元素的不同方法。 1. 库 这是重用代码的最广泛使用的方法。可重用代码作为库开发和发布。在这种方法中,客…

web前端开发工程师工作的岗位职责(合集)

web前端开发工程师工作的岗位职责1 职责: 1、根据设计图进行前端页面开发并设计编写业务交互脚本 2、优化前端页面,保证良好的用户体验以及不同浏览器的兼容性 3、web前沿技术研究和新技术调研,将主流的特效应用到业务场景中 4、配合后台…

政府关注 | 国家人社部报道盖雅工场以云服务助力劳动者灵活就业

党的二十大报告提出,「加强灵活就业和新就业形态劳动者权益保障」,为促进新就业形态规范健康发展指明了方向。近年来,随着数字经济快速发展,依托互联网平台的新就业形态脱颖而出,成为吸纳就业、提高劳动参与率、增加劳…

FFmpeg从入门到入魔(2):保存流到本地MP4

1 . FFmpeg裁剪移植 之前我们简单地讲解了下如何在Linux系统中编译FFmpeg,但是编译出来的so体积太大,而且得到的多个so不便于使用。本节在此基础上,将详细讲解在编译FFmpeg时如何对相关模块作裁剪以精简so的体积,并且编译只生成一…

【Flutter 组件】005-基础组件:单选、开关和复选框

【Flutter 组件】005-基础组件:单选、开关和复选框 文章目录 【Flutter 组件】005-基础组件:单选、开关和复选框一、概述二、基本使用1、开关代码示例运行结果 2、复选框代码示例运行结果 3、多个选项单选代码示例运行结果 4、多个选项多选代码示例运行结…

一次源码编译安装PostgreSql失败

需要perl;之前博文已提到;之前有一种编程语言叫perl,此perl应该不是那个;可到其官网下载,Perl Download - www.perl.org 安装时添加到环境变量; 可能是一个东西;有编程语言和工具;大…

怎样愉快的使用串口发送16进制数据并读取串口内容

像雷达 imu 陀螺仪一类的传感器,一般都是用的usb转串口和主机连接,然后通过串口读取传感器数据,串口是我们绕不过的一道坎,那我们就来继续手撕串口。 串口连接主机问题看上篇: 怎样愉快的连接使用usb转串口设备_JT_B…

WalxPlugin免Root框架使用详解和示例代码

2023年7月4日首发 WalxPlugin框架(以下简称WP框架)是一个不需要root权限就能使用的插件化模块,能够轻松实现在非root设备hook其它应用的调用和访问进程数据等功能。目前该框架已发布测试版。 一.WP框架工具包提供了以下几个模块&#xff1a…