基于python实现的医疗领域用户问答的意图识别算法研究(django)
-
开发语言:Python语言
- 数据库:MySQL,Neo4j
- 知识:深度学习,知识图谱
- 工具:pycharm、Navicat、Maven
系统的实现
系统登录界面
医疗领域用户问答识别系统主要通过浏览器端实现系统平台的访问,通过首页登录名及密码信息的录入实现系统平台的登录使用,对于没有系统账号的用户可以通过注册页面实现在线的用户注册,系统界面的内容呈现相对简洁,具体界面呈现内容如下
系统首页界面
进入到识别系统后台,系统首页界面主要介绍了知识图谱的概述,同时通过首页导航意图识别、问句管理以及问句分析功能模块的内容实现在线问答,结合医疗领域的问句管理及问句分析可以对系统端的问句内容进行整理和数据统计,系统用户可以通过修改密码以及用户管理实现识别系统登录及个人信息的维护,具体系统首页内容呈现如下图所
意图识别界面
此次医疗领域用户问答意图识别系统的主要功能模块为意图识别模块,用户可以通过该功能模块实现在线问答,通过界面下方的输入栏实现医疗领域相关问题的录入,通过点击发送实现在线提问,系统会结合用户端的问题进行意图分析并反馈问题答复内容,具体意图识别界面的主要功能栏内容呈现如下
问句管理界面
问句管理是对系统用户提出的问题信息进行统一的管理和查询,主要呈现了系统用户提出的问题信息、答案信息以及提出问题用户的个人信息及提问时间等内容,可以对于重复的问题内容进行在线的删除操作,同时也可以结合问题内容进行搜索和查找,具体问句管理界面内容呈现如下图所示
问句分析界面
问句分析主要是对于系统平台的问题内容进行关键字及查询次数内容的统计,通过该界面呈现了医疗领域问题的内容以及提出问题的次数,结合问句分析对高频词的问题内容进行分析和统计,具体问句分析界面呈现如下
修改密码界面
用户可以通过修改密码模块实现登录密码的修改,通过录入新密码和复核录入来实现密码的修改,具体密码修改页面内容如下
用户管理界面
通过用户管理界面可以实现用户的新增以及用户基本信息的修改,只需要录入用户姓名、密码以及手机号就可以实现在线用户新增,这里手机号必须为11位数字,具体用户新增界面信息内容录入如下图所示
摘 要
计算机的应用越来越智能化,通过不断地对计算机进行训练,现在计算机正在朝向人工智能的领域大力发展。而在智能应用的过程中,自动问答系统成为了人机互动的一种新的趋势,计算机可以通过在知识图谱中寻找答案来为人们提出的问题进行精准回复。而这一应用在医疗健康领域中有着很好的应用场景,但是应用效果却并没有达到预期。我国对于智慧医疗的建设支持力度很大,国家卫健委对于智能化的在线问诊、人机对话、智慧医疗等项目的需求较大,急需在该领域中寻求更大的发展。本次为了响应国家在智慧医疗领域的开发需求,满足民众在线就医、在线问诊的需求,本次通过医疗领域的用户问答系统的搭建来进行相关知识图谱的搭建,通过构建医疗领域的知识图谱来实现计算机的深度学习,并且能够实现自动问答的功能。本次的内容研究主要是通过以Python技术来对医疗相关内容进行数据的爬取,通过爬取足量的数据来进行知识图谱的的搭建,通过Neo4j来实现知识图谱的可视化。通过智慧问答的方式构建出以bert+lstm+crf的识别模型,从而完成对医疗问句主体的识别,构建出数据集以及实现文本的训练。通过django来进行web网页的开发,通过面向用户的网页端开发使用来满足用户医疗问答的需要
绪论
研究背景
在信息化的时代下,人们的日常生活中离不来计算机、移动设备等能够传递电子信息的智能设备。随着我国的三大产业的快速发展,我国的经济实力正在不断的增强,而在信息化的建设上也投入了更多的资金形成了更成熟的网络应用。当下的时代中,各行各业都与互联网、大数据有密切的合作联系,通过网络可以实现信息搜索、智慧城市、电子支付等多种不同的功能,而在医疗领域中,医疗的信息化建设也日趋成熟,现在通过线上问诊、线上挂号预约等基础功能都已应用成熟,我国的医疗发展正在朝向智慧医疗的方向大步前进。现在的计算机技术已经形成了较为成熟和广泛的应用体系,但是计算机朝向人工智能领域的发展是全球科学最为前端的研究领地,如何将人工智能与人们的日常工作、生活更加紧密的结合,也是全球都在持续研究的一个重要课题。
在当下的人工智能领域中,深度学习、智慧图谱等概念被发明并且不断的被广泛应用,成为了一种最为基础的人工智能工具,在大数据环境下支撑着很多应用工具的稳定运行。而在医疗的行业中,本身医学就持续走在科学的前沿,历史积累的医学素材也非常的丰富,海量的医疗信息中所蕴藏的价值巨大,怎样才能够保证在有效的提升医疗相关信息的利用率,有效的整合医疗资源,更好的为患者提供高质量的服务是现在医疗领域科技化发展所必须要解决的一大难题。特别是随着现代人们的生活节奏快,给人们的身体所带来的负担也在不断的增加,就医难、住院难成为了普通老百姓最为关注的问题之一,医院虽然不断的扩大经营面积但是仍然难易满足人们的日常就医需求。实际上,在人们的就医需求中,有很多轻症是可以通过对症下药而快速康复的,所以通过便捷的在线问诊方式,可以有效的解决一些简单的病历,从而减轻医院的就医负担,提高人们疾病的康复速度。在国家大力加强智慧医疗的发展政策的指引下,医院应当通过结合互联网、大数据以及云计算等功能来快速实现智慧医疗系统搭建,完善医院就医体系
国内外研究现状
知识图谱
谷歌公司最早提出了知识图谱的概念,最早知识图谱是用户对搜索引擎的升级优化,是一种数据的结构形式,通过将实体-关系-实体的方式来进行数据的组合,从而更好的将实体之间的关系进行有效的梳理,按组来进行数据节点的管理。知识图谱需要大量的数据信息,通过为知识进行建模、将知识进行融合和存储来实现有着丰富内容的数据库的搭建。知识图谱的出现可以在任何一个学科中形成较为广泛的知识存储和应用,形成一个全新的能够实现智能问答的信息检索平台。知识图谱在我国的发展相对较短,在我国互联网巨头百度的带动下,建立了“百度知心”项目,从此我国的知识图谱的普及便逐步的展开,上海交大在融合了维基百科、百度百科等多种数据库的知识内容后建立了zhishi.me项目,为我国的大规模知识图谱的搭建提供了内容借鉴,打开了知识图谱建设的新格局。
而在医疗领域中,知识图谱的建设是通过在半结构化或者非结构化的学习策略下实现的数据抽取,在对调取的数据进行融合,最终形成医学类的知识图谱。这种知识图谱的应用范围很广,可以在中药方面、在慢性病方面等进行有效的数据库搭建,并且在传统模型的使用越来越成熟的当下,在深度学习的基础上进行知识抽取、知识融合来降低开发成本,实现更加经济实用的业务推进。
问答系统
当下的计算机界认定最早的问答系统是“图灵测试”,在该测试的基础上通过以计算机语言的编译与人工智能大数据的结合来推动该行业的快速发展。在国外有baseball系统可以通过该系统来对美国职业篮球联赛中的相关问题进行特定领域的问答,ELIZA聊天机器人可以对人们提出的心理学相关问题进行回答。这些系统都是在特定的领域下所形成的专业化的问答平台,能够很好的服务于某一个专业化的领域。而在医疗问答系统中,我国学者张芳芳等人对于国内外的医疗领域问答系统进行了对比分析,对于其应用现状进行了阐述,认为当下的医疗问答系统仍然需要进一步的改进。刘芳等人通过B/S结构搭建了一个关于甲状腺结节的知识图谱,并且实现了自动问答的功能,但是受限于图谱的知识储备,问答能力相对有限。类似于医疗领域某一专业的问答系统开发,国内有非常多的案例,都是基于深度学习以及卷积神经网络所搭建的系统,能够实现正常运行,但还需要计算机对于专业化的内容进行更加深入的训练。
研究的意义
伴随着我国的人口老龄化,人们日常就医在资源紧张的医疗环境下成为了社会的主要矛盾之一,会对医患双方均造成较大的压力,而为了缓解这种压力,基于人工智能的在线文中能够是解决医疗问题的一个必须要进行建设与规划的方向。目前,我国的在线问答系统非常的多,特别是在最近火爆的ChatGPT出现后,应用市场涌现出了非常多的类似软件,但是在该领域中还存在一些问题如下:
- 当下的知识图谱偏向于通用领域的非常多,应用也非常广泛,能够进行流畅的问答,而在医疗专业的相关图谱搭建研究相对偏少;
- 医疗领域的问答有着复杂性和多样性,因此在图谱的搭建过程中需要训练的资源获取难度大,资源供给不足;
- 医疗问答系统的应用相对较少,并且普及率相对较低,使得用户的医疗请求难易被满足。
综上,本次通过利用Python技术结合Django框架来搭建一款web端的医疗领域用户问答系统可以为用户提供一个医疗领域的专业化问答平台,通过利用Neo4j来实现知识图谱的可视化。通过智慧问答的方式构建出以bert+lstm+crf的识别模型,为医疗专业形成一款可实现在线问答的系统,能够更好地为解决就医难提供智慧化的解决方案,提高我国居民的问诊效率,提高居民生活幸福指数
需要源代码或者二次开发的,请联系