深度学习的舌象诊断:从舌头上了解系统性疾病!

news2024/12/24 6:05:26

首先

深度学习算法能否解决东方医学中依靠医生经验的诊断问题?而要实现这个目标,需要什么呢?

用舌头诊断被称为口腔健康的指标,但在东方医学中,舌头也被用来评估全身的状况。换句话说,通过分析舌头的图像,不仅可以发现特定的疾病,还可以同时发现多种疾病。因此,通过提取医生的经验作为特征和学习模型来普及非语言知识的深度学习的引入备受关注。另一方面,有人指出,这些舌象存在一个问题,就是这些舌象有冗余,无法从图像中把握整体特征。

在这项工作中,使用高方差和局部响应归一化来实现多尺度特征分析。所提出的方法可以学习高层次的特征,提供更多的分类信息。因此,它达到了很高的分类性能。

什么是东方医学、中医和舌诊?

东方医学是以中药、针灸为主的东方传统医学。西医是直接用药物或手术治疗身体不好的部分,而东方医学的目的是着眼于整个身体,而不是只治疗不好的部分,方法有针灸、中医等。此外,它还有自己的"密约"概念。"密约"的意思是还没有生病,但还没有健康,目的是防止因疲劳和积累的抵抗力而引起的疾病。

东方医学的诊断方法有"四诊",其中"望闻问切"是从面部表情、外貌等外在特征来把握身体状态的。其中,舌诊可以从舌头的状态中把握身体的状态,以无创的方式高准确度地找出病症点。千百年来,中医通过观察舌头的颜色、形状和质地来判断患者的健康状况。

但是,这种诊断方法主要是根据医生的经验,有主观的一面,所以很难向陌生人推广诊断方法。在此背景下,利用深度学习积累舌头图像并提取特征以简化诊断方法,受到了人们的关注。

传统方法的问题

虽然已经提出了很多基于颜色、形状、纹理等单一特征的模型,并取得了很好的效果,但这些模型只使用了低级特征,很难获得一定的表现力。特别是在舌头图像的异常检测中,需要整个图像的特征来获得高性能。因此,在检测舌头图像的异常时,提取多方面的综合特征,并将这些特征进行高精度整合的方法被认为是有效的。在我们之前的研究-PCANet中,我们从舌头图像中提取了这样复杂的特征。它基于PCA算法和CNN,可以适用于各种数据和任务,微调所需参数少。此外,据报道,当与机器学习分类算法相结合时,它在分类任务中表现良好。据报道,当与机器学习分类算法如K-最近邻(KNN)、SVM和随机森林(RF)相结合时,它的表现也很好。

另一方面,这种方法有两个问题:“数据处理的冗余"和"处理有偏差的样本时不准确”。关于前者,由于PCA的特性,特征值容易膨胀,导致复杂特征图的数据冗余。此外,PCANet假设样本的分布是很均衡的,数据集中的样本数量很大,所以它可能不能很好地应对不均衡的样本。

本研究的目的

在这项工作中,我们解决了这些问题,并提出CHDNet从舌头图像中提取合适的复合整体特征。它是一种监督学习模型,从无监督的临床数据中学习有用的特征,并利用获得的特征学习如何将患者的健康状态分为正常和异常。

本文提出的探索正常和异常舌头图像特征表示的方法采用了四个关键要素:非线性变换、多尺度特征分析、高方差和局部归一化。该方法可以为预测具有偏态分布的健康状况提供稳健的特征表示。

技巧

建议的方法

对于每张图像,我们从图像中去除背景,提取舌体,并应用CHDNet学习图1中正常和异常舌体的特征。然后将图像归一化为一定的高度和重量。

然后将舌头图像分为训练轮和测试轮,并训练卷积核来生成特征表示,将舌头样本分为正常或异常,并对k-folds交叉验证进行评估,对相应的k轮得到的结果进行平均。

本建议有四个重要内容高分散处理实现了每个特征图中的特征分布无冗余的特性。在对局部响应进行归一化和高分散处理后,不同特征图中同一位置的特征仍有冗余。这样我们就可以解决这个问题。

非线性变换层,主成分分析主要集中在线性分类上,所以存在因冗余而降低精度的问题。特别是当它们被用作不平衡数据的异常检测特征时,这个问题就会出现。为了解决这一问题,引入非线性分析,采用多尺度特征分析,提取精度较高的特征。此外,为了提高对变形的响应,在高方差和局部响应归一化之前,引入多尺度特征分析。

CHDNet由三部分组成:PCA滤波器卷积层、非线性变换层和特征池层,如图2所示。

非线性变换

在这一层,除了传统的批量转换过程和PCA转换外,还进行了非线性转换,以减少PCA分类中出现的冗余。在这个PCA过程中,对每幅图像应用非线性,以消除以下方程线性变换中的检测精度的粗糙。

其中T为图像,C1为第一主成分,a和ε为超参数。

此外,由于tanh(x)用于特征的卷积层,存在负值,这与视觉系统的原理相矛盾。因此,在每个卷积层后增加一个非线性变换层,其效果是将这个负值作为噪声处理。

功能池

除上述非线性变换外,该层的其他功能还包括"直方图–将像素转换为[0,255]的整数"、“多尺度特征分析–将每个直方图中的图像按分辨率汇总为特征”、“高方差–避免退化状态,增加特征间的竞争”、“局部响应归一化–不同的特征。在地图中同一位置的每个特征之间进行归一化处理,以防止冗余”。通过对输入图像进行这一系列处理,正常和异常特征比以前的方法更加突出。转化公式请参考论文。

实验准备

共收集医院267名胃炎患者和48名健康志愿者的315张图片。在特征提取步骤的训练阶段,随机选取40个正常对象和44个异常对象作为训练集,约占总图像的26.67%,用于训练卷积核和确定参数。然后,学习的内核和参数被用于提取其余231个样本的特征。结果平均为10次,交叉验证运行5次。为了评价所提出的方法和传统方法的性能,几个评价指标(精度。灵敏度、特异性、准确性和回收率)。

结果

与传统方法的比较

本次评估的目的是确定所提出的方法与之前的方法PCANet相比是否提高了性能。在本次评估中,我们使用LIBLINEAR SVM作为分类器。

结果表明,提出的高分散(HD)、局部响应归一化(LRN)、多尺度特征分析(MFA)和非线性变换(NT)的组合与PCANet相比,提高了识别率:从84.77%提高到91.44%(约7%)。另外,在样品不平衡方面,所提出的方法使灵敏度略有下降,但特异性有所提高。

分类器的比较

本次评估的目的是确定哪个分类器在检测异常图像时表现最好。

我们比较了使用LIBLINEAR SVM和其他分类器–LDA、KNN、CART、GBDT和RF作为分类器代替LIBSVM的CHDNet的性能–当样本数远小于特征数时,LIBLINEAR SVM的性能优于LIBSVM。比特征数更多–当样本数远小于特征数时,LIBLINEAR SVM的表现比LIBSVM更好。样本数为315个,每个样本中的特征数为43008个,说明LIBLINEAR SVM表现较好。

从精度、特异性、准确度、召回率和F1得分来看,LIBLINEAR SVM的整体性能在下表6种分类器中是最好的,精度91.14%–比LDA高6.24%。同时,与基于距离的模型和树形结构模型相比,特异性从3%提高到25%。通过对比可以看出,参数最优的SVM分类器的性能优于其他方法.LIBLINEAR SVM方法的性能准确率提高到91.14%,在其他分类器中是最好的。

考虑

舌象是东方医学的诊断标准之一,曾有可能无创评估整体身体状况,识别身体疾病。然而,传统模型存在着冗余性和对有偏差样本的检测精度低的问题(特别是在检测异常图像时)。在本研究中,我们提出了一种利用CHDNet这种高度分布式的模型,提取适当的特征进行图像异常检测的模型。评价结果表明,该模型的性能高于传统模型。

但我对此事的看法是这样的。

首先,不清楚为什么选择Linear SVM作为分类器,SVM通常使用RBF内核,但当需要快速计算处理海量数据时,就会使用Linear。作者解释说,原因是特征数远大于样本数,发现Linear的精度高于SVM-RBF内核的精度。不过,造成这一结果的原因没有告诉大家,也不清楚原因。

引入所提出的方法特有的非线性变换的下一个原因是卷积层的tanh(x)中存在负值,但不清楚是否考虑了其他方法,例如,使用ReLU激活函数。在图像分析领域,可以想象,激活函数可以用来剔除负值。在图像分析领域,可以设想使用激活函数:ReLU来处理负值的噪声,但没有明确说明不使用它的原因(或不能引入它),有人认为应该明确说明像现在这样的非线性变换比ReLU函数更有意义这一点。

结论

在本文中,我们提出了一种使用无监督特征学习方法进行舌头图像分类的新型框架。它使用CHDNet通过学习特征来训练一个加权的LIBLINEAR SVM分类器来检测异常患者。实验结果表明,与其他方法相比,我们的新框架和加权LIBLINEAR SVM的组合具有最好的预测性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1801084.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

人工智能的统治:会是人类的终结吗?

使用ChatGPT运行/请求一系列提示以探索完全人工智能(AI)控制关键基础设施、自动化工厂 ( Tesla )、社交媒体 ( Meta )、SCADA和其他常见用途 (ModBUS?) 可能产生的后果后,我们进行了分析…… 以下是我们的考虑: 数据、提示和响应应被视为说明性的&…

通过影刀RPA,创建定时任务,自动获取图片验证码登录平台;

1.下载下载影刀客户端-影刀RPA - 影刀官网 2.安装,登录 3.应用创建->PC自动化应用 4.按照流程-创建【可双击或拖动】 5.保存 6.右击【创建的应用】->发版 7.选择触发器->【定时触发器】 根据提示配置 8.完成,每天平台会自动打开;…

算法学习笔记(7.7)-贪心算法(Dijkstra算法-最短路径问题)

目录 1.最短路径问题 2.Dijkstra算法介绍 3.Dijkstra算法演示 4.Dijkstra算法的代码示例 1.最短路径问题 图论中的一个经典问题,通常是指在一个加权图中找到从一个起始顶点到目标顶点的最短路径。 单源最短路径问题:给定一个加权图和一个起始顶点&…

http协议,tomcat的作用

HTTP 概念:Hyper Text Transfer Protocol,超文本传输协议,规定了浏览器和服务器之间数据传输的规则。 特点: 1.基于TCP协议:面向连接,安全 2. 基于请求-响应模型的:一次请求对应一次响应 3HTTP协议是无状态的协议:对于事务处理没有记忆能…

react学习-高阶组件

1.简介 react高阶组件是一个函数,接收一个组件作为参数,返回一个新的组件,可以用来进行组件封装,将一些公共逻辑提取到高阶组件内部。 2.基本实现 以下案例为利用高阶组件来增强props import React, { Component } from "re…

10.dockerfile自动构建镜像

dockerfile自动构建镜像 类似ansible剧本,大小几kb 手动做镜像:大小几百M 首先创建一个dockerfile的路径,便于在路径下存在多个路径每个路径下都是dockerfile命名的脚本 注释:文件必须为:dockerfile或者Dockerfile …

解决linux系统求前N月月份的bug

日常工作中,需要获取某个日期(20240531)的前N个月,通常会写命令 date -d "20240531 last-month" %Y%m 我期望得到202404 但是很意外: 经过几轮测试,发现只要月内天数超过30天,即所有…

基于Zero-shot实现LLM信息抽取

基于Zero-shot方式实现LLM信息抽取 在当今这个信息爆炸的时代,从海量的文本数据中高效地抽取关键信息显得尤为重要。随着自然语言处理(NLP)技术的不断进步,信息抽取任务也迎来了新的突破。近年来,基于Zero-shot&#x…

代码随想录——修建二叉搜素树(Leetcode669)

题目链接 递归 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNode right) {* …

【算法每日一练】新月轩就餐

思路: 其实很容易想到是双指针或者双端队列。 我们设置一个type表示当前区间已经有了多少种厨师,同时还需要记录区间中每个元素出现的次数,然后比较棘手的是移动问题了,什么时候移动呢? 我们可以发现当区间当队头元…

AI数据分析:用deepseek根据Excel数据绘制分裂饼形图

工作任务:要绘制下面表格中月活用户占比的分裂饼形图 在deepseek中输入提示词: 你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下: 读取Excel文件"F:\AI自媒体内容\AI行业数据分析\poetop5…

Polar Web 【简单】- 被黑掉的站

Polar Web 【简单】- 被黑掉的站 Contents Polar Web 【简单】- 被黑掉的站思路EXP运行&总结 思路 如题目所述,这是一个被黑掉的站点,由此不禁要了解该黑客发现了哪些可以入手的路径,或是留下了什么样的文件供持续访问。 目录扫描该站点发…

软件测试--Linux快速入门

文章目录 软件测试-需要掌握的Linux指令Linux命令操作技巧Linx命令的基本组成常用命令 软件测试-需要掌握的Linux指令 Linux命令操作技巧 使用Tab键自动补全上下键进行翻找之前输入的命令命令执行后无法停止使用CtrC,结束屏幕输出 Linx命令的基本组成 命令 [-选项] [参数] …

Attention注意力机制:理论基础、核心架构、应用领域及最新研究动态

Attention机制源于对序列建模中长期依赖关系的有效捕获需求,其理论基础在于让模型动态分配权重以聚焦于输入序列中与当前任务相关的关键部分。核心架构包括Query-Key-Value三元组计算、Softmax归一化的注意力得分、加权求和生成上下文向量,以及扩展至多头…

Unity3d简单对话系统的实现——使用Dialogue editor完成对话系统

目录 前言 使用方法 1.下载dialogue editor 2.新建空物体 3.对对话内容进行编辑 4.对话画布建立 5.触发对话框代码 结束语 前言 今天是坚持写博客的第21天,很高兴自己可以坚持,也希望能与大家一起进步。我们今天来看unity3d当中的一个可以轻松实…

Python易错点总结

目录 多分支选择结构 嵌套选择 用match模式识别 match与if的对比 案例:闰年判断 三角形的判断 用whlie循环 高斯求和 死循环 用for循环 ​编辑continue​编辑 whlie与else结合 pass 序列 列表(有序) 元组(有序&…

高防CDN是如何应对DDoS和CC攻击的

高防CDN(内容分发网络)主要通过分布式的网络架构来帮助网站抵御DDoS(分布式拒绝服务)和CC(挑战碰撞)攻击。 下面是高防CDN如何应对这些攻击的详细描述: 1. DDoS攻击防护 DDoS攻击通过大量的恶…

数智融通 创新发展|亚信科技携AntDB、Data OS与隐私计算产品,赋能企业高质量发展

5月21日,亚信科技在云端举办了一场别开生面的研讨会——“数智融通 创新发展”,聚焦企业数智化升级的前沿话题。资深产品经理和技术架构师们面对面深入交流,分享创新成果与实战案例,共同探索企业数智化转型的新路径。 图1&#xf…

2024华为数通HCIP-datacom最新题库(变题更新③)

请注意,华为HCIP-Datacom考试831已变题 请注意,华为HCIP-Datacom考试831已变题 请注意,华为HCIP-Datacom考试831已变题 近期打算考HCIP的朋友注意了,如果你准备去考试,还是用的之前的题库,切记暂缓。 1、…

Erlang

官网地址: Index - Erlang/OTP windows环境变量配置 创建新系统变量 ERLANG_HOME 在path加入上述配置