文章目录
- 公共安全
- 数字经济
- 金融科技
- 资源优化
- 科学研究
- 制造业转型
- 公共健康
- 人文发展
公共安全
公共安全领域信息化以现代通信、网络、数据库技术为基础,将所研究对象各要素汇总至数据库,并针对各个业务领域进行定制化开发,以满足公共安全实战需求。虽然我国公安信息化发展较快,但受传统观念、资金投入、工作机制等影响,公安信息化建设仍有较大发展空间,而且由于公共安全相关信息中实体关系重要性较高,对知识图谱的需求凸显。
违法犯罪活动呈现复杂化、动态化、智能化的特征。公安机关为提升整体效能,在打击违法犯罪活动中占据信息主导权,能够充分利用现代信息技术和信息资源,对现有的警务组织、机制、模式、装备等警务实践进行信息化改造。当前社会组成要素的人流、物流、信息流激增,在社会生产力日益提升的背景下逐步使犯罪活动呈现出复杂化、动态化、智能化的特征,针对这些特征,公安机关能够基于已有的结构化及非结构化数据,通过知识图谱技术从少量已知信息中获取和挖掘出图谱的潜在网络拓扑信息及行为信息,并构建一系列基于知识图谱的应用工具提升公安面对犯罪类型多变等挑战的能力,有效应对新型犯罪活动及多类型、多渠道的犯罪模式。
这些数量巨大的公安信息能够通过知识图谱海量的概念实体、丰富的属性信息、多样化的关联关系进行直观准确的描述,同时能够从时间序列维度、类别维度对图谱知识进行统计分析,能够根据公安业务需求实现定制化的智能应用,为公共安全部门提供准确、高效的技术工具和辅助决策支撑。
随着公共安全数据规模、案件关系复杂程度的增加,传统数据检索功能已经无法满足当前的公安业务需求,同时海量公安数据难以实现语义化理解和知识化转化。知识图谱技术为公安大数据环境下的人员分析方法提供了一种有效技术手段,知识图谱通过从海量公安数据中获取与融合丰富的语义知识,形成庞大、相互关联的公安知识网络,实现潜在隐藏信息的自动挖掘与推理,满足海量公安数据的语义理解与快速准确检索。
数字经济
数字经济是指以使用数字化的知识和信息作为关键生产要素、以现代信息网络作为重要载体、以信息通信技术的有效使用作为重要推动力的一系列经济活动。数字经济是继农业经济、工业经济之后的一种新的经济社会发展形态,更容易实现规模经济和范围经济,日益成为全球经济发展的新动能。数字经济占我国经济发展规模的比重接近三分之一,对经济增长具有显著拉动效应。数字经济不仅是我国经济增长的主要动力源泉和转型升级的重要驱动力,同时也是全球新一轮产业竞争的制高点。我国数字经济发展情况如下图所示。
数字经济可被认作为一个经济系统,在这个系统中,数字技术被用户广泛使用,使得整个经济环境和经济活动都发生了根本变化。同时数字经济也是一个全新的社会政治与经济系统,其中所有的信息和商务活动是以数字化的方式进行,企业、消费者和政府之间进行的网络交易量迅速增长。当前信息流蓬勃增长的浪潮中,我国发展数字经济具有良好机遇的同时,也面临着诸多挑战,知识图谱可以为数字经济背景下所面临的一些具体问题提供有效的解决方案。
数字经济的发展离不开大规模有效数据的关联。在数字经济时代,数据是最重要的生产要素,大数据时代的数据资源虽然规模庞大,但在数据的关联使用上仍有不足。在知识驱动的数字经济中,需掌握数据的“萃取”技术,方能“提炼”知识。未来的数据资源会越来越开放,知识谱图绘制和深度学习的能力极有可能超越数据本身,并成为核心竞争力。大数据之“大”并非只强调上数据量之大,也指数据的汇聚、关联和使用之宽广。数据本身需要通过理解,分析才能够有效利用,从而服务于人类,而构建知识图谱即是把数据提炼为有效知识的重要途径之一。
将“数据中心”向“知识中心”过渡是数字经济升级发展的重要需求。在互联网背景下,知识图谱技术推动数字经济向数据知识化方向升级发展。互联网与数字经济一同在不断地蓬勃发展,深刻且全面地改变了世界和人类本身。从“流量变现”到“数据变现”使互联网发展的转变为以技术和数据为核心,而数字经济知识化的发展需求将推动知识图谱作为数据知识化的重要工具深入发展,数字经济中的数据知识化汇集领域知识库、专家系统、机器学习等核心技术动能,将大大提升生产效率和自动化水平,因此将“数据中心”向“知识中心”过渡是数字经济升级发展的重要需求。
知识图谱成为推动数字经济创新场景下智能应用的重要力量。随着数字经济与大数据的不断发展,传统经济模式和应用场景持续变革,以新零售场景为例,由于顾客需求的变迁,新型零售方式不断出现,线上线下渠道融合趋势日益明显,零售渠道从单一结构演变为多渠道与全渠道结构,在这样的应用背景下,数据的搜集与挖掘便是一个很大的难题,需要把线下和线上的数据汇总起来,形成以商品为中心的知识图谱,把不同类型的数据,按照既定模型组合在一起,最终形成商品与商品之间、商品与门店之间、商品与消费者之间的关系网络,最终实现新零售场景下的智能化推荐和资源优化配置,因此知识图谱技术将成为推动数字经济创新场景下智能应用的重要力量。
金融科技
全球范围内伴随着云计算、大数据、人工智能等新兴技术的落地,互联网的数据量每两年翻一番,基于数据的生产变革和业务模式创新正驱动着全球范围内经济社会各个领域的数字化与智能化转型,实现了数字经济在数字化程度高的行业中赋能,加快了其数字化转型进程。金融行业首当其冲,成为人工智能最先应用的行业之一。金融生态的数字化、智能化转型过程中,业务应用场景化、数据垄断化特征成为金融科技不断优化金融生态环境的必要条件。如下图所示,金融科技作为更为开放的信息技术知识领域渗透金融行业的技术载体,深刻地影响着金融的业务场景、机构与金融监管构成的金融生态系统。
知识图谱在金融科技领域是语义理解和知识搜索基础,可以为金融行业的风险评估、预测、反欺诈、精准营销、智能搜索等提供技术支撑。越来越多的金融机构及企业在探索构建金融领域知识图谱,为金融领域应用决策提供更精准可靠的依据。
知识图谱能促进金融科技信息技术与开放知识领域的融合,国家对人工智能发展的重点规划(国办发2017﹝35﹞号)中,智能金融作为高端智能经济发展的重点领域。智能金融存在的数据碎片化、业务数据质量问题约束了智能推送功能,大数据时代的数据多源异构特征加剧了智能金融的建设过程中的数据质量问题。金融业务知识图谱的建设为决上述问题创造了条件,如金融知识图谱在政府数据、商业数据(社交、电商)等海量、多元维度数据的基础上,建立金融业务的元数据,并以图谱节点与关联关系,实现了大数据与人工智能知识图谱的融合,为金融机构的数据治理提供了设计思路。
知识图谱为金融科技服务于实体经济提供了深度技术,基于知识图谱的应用能够提高金融行业、金融机构与金融业务的微观、中观与宏观全产业链数据治理能力,以数据为核心构建的金融知识图谱,梳理不同业务模块的业务知识、融合海量外部领域数据,形成以金融科技为中心的全维知识网络,加强各知识领域多维度数据的关联性。金融领域知识图谱在一定程度上能够通过信息精准识别,解决长尾信贷中小企业客户的信贷供给不足问题,优化与引导金融资源配置服务于中小企业实体,增大为实体经济中的活跃主体“输血”规模,为实体经济作贡献。2019年由国家信息中心牵头,工商银行在重庆两江新区践行的“信易贷”将大数据与人工智能技术融合,通过中小企业信用的业务知识图谱底层建设,通过一站式授信平台实现了中小微企业融资服务,实现了传统金融产品与服务的边界扩展。
金融生态的业务、技术、监管、资源配置在金融科技的支撑下,金融风险的复杂性与多样化使风险监管的知识图谱建设迫在眉睫。如宏观审慎管理中系统性风险的实体对象,不在局限于“大而不倒”的系统性金融机构,互联网金融所拓展的金融产品与业务边界,因网络效应而更具传染性风险的“网而不倒”产品与服务,也应当纳入风险管理的实体对象之中;另外,基于网络的相关利益者关联关系,更大范围的金融产品与服务的消费者、金融科技平台以及各类非正规金融机构,拓展了风险管理的主体对象,2018年证监会关于企业知识图谱的建设,广泛应用于中央监管信息平台的上市公司画像、拟上市公司画像和中央监管私募机构画像,则是通过关联关系(KYC:充分了解你的客户、AML:反洗钱)识别面向企业层面的风险防范,如非法集资、财务管理风险等,使金融风险管理适应于金融科技产品、服务、行业的发展,成为了可能。
资源优化
面对新的经济形势和市场竞争格局,许多大型集团都提出了“主动拥抱产业变革调整带来的新模式、新机遇,积极应对市场竞争呈现的新变化、新挑战”的数字化需求,其核心在于利用“大数据、云计算和人工智能”等相关新型数字化技术,从市场需求出发,优化整个资源配置,快速适应市场变化,促进降本增效,提升服务水平。此外,当前农业资源、电力资源等重要社会资源持续紧张。以农业为例,我国农业人口比例大,耕地面积不足,而且近年来随着农业用地面积的逐渐减少,耕地面积更加紧张,据数据显示,1996年中国耕地面积约1.3亿hm2,而2016年统计为1.2亿hm2,下降了0.1亿hm2。而且,耕地面积分布不均衡,而且随着生态环境逐渐恶化,土壤退化严重,耕地难以得到休整,化肥和农药的施用使水污染加剧,我国农业现代化发展面临着资源和环境的双重压力。同时,我国农业劳动力文化水平相对较低,如何在多重限制条件下提升农业资源的利用效率一直是推进我国农业现代化建设的一大难点。
大型集团企业倒三角支撑,“将问题甩单,让一线更简单”,用移动互联网手段推进全公司倒三角支撑。重点通过一线问题甩单,打造跨流程、跨部门、跨层级的扁平化透明化快速响应协调机制,实现全业务、全流程、全渠道覆盖,高效解决一线日常生产问题。一线人员需要的业务知识遍布在许多垂直类的系统中,这类系统之间彼此相对独立,形成了一个个“烟囱”,知识信息很难流通,形成 “企业知识孤岛”。利用知识图谱技术,透过纷繁复杂的海量文本和结构化数据,可以实现有效的语义化数据治理和知识获取。同时,知识图谱可以作为企业中各个业务系统的数据源,为业务系统提供知识和可计算服务。
农业资源、电力资源作为紧缺且重要的社会资源,具有重要的代表性,如何快速、准确获取知识,并能够提供应用指导对于农业从业者、电力企业员工等资源领域的从业者有着重要的意义。在农业资源优化方面,以往受限于人员分布广泛、高质量知识获取难度大、数据积累多以非结构化为主等因素,从业者通常以经验作为重要的操作考虑因素,存在部分情况下误操作、漏操作等风险。如由于农业从业者对病虫害缺乏了解,往往凭借经验诊断已发作的农作物病虫害进行盲目用药,造成防治用药难以有的放矢。通过建设病虫害知识图谱,搭建知识获取及应用、推广平台可以提供更加科学的用药和栽培辅导,进而提升整体农业土地资源的利用效率。电力设备运维、电网安全措施推荐、客户服务等方面也存在类似需求。
科学研究
随着数字时代向数据时代演进,科学研究进入“第四范式”,无论是研究个体还是科学共同体都在渴求能够获得更深入全面、更高效便捷的数据服务。科学研究需要主动推进知识服务升级,帮助用户扩展资源发现,揭示资源中蕴含的知识,构筑知识间的关联。如今学术搜索引擎使得科研人员能够高效便捷地查阅文献和相关资源,它已经成为当前科研工作者不可或缺的一项技能。科研社交网络有效地提升了科技成果的传播速度,降低了科研人员之间交流的时间成本,扩大了研究人员之间的合作机会。尽管搜索引擎和社交网络等平台给科学研究带来了极大的方便,但是由于科学研究数据量的急速增长,相关平台并没有很好的组织和挖掘这些信息,这也给科研人员带来了很大的不便。如何有效的组织和管理这些科学研究相关的信息是科研工作者迫切的需求。
传统基于文本形式综述分析的学科研究方法存在难以揭示学科间相似性、学科发展继承性等问题,致使科研人员难以客观、高效理解学科静态结构、动态演化及发展趋势。在这种形势下,伴随文本挖掘和知识图谱技术发展,学科领域知识图谱的构建为该问题解决提供了可能性,其用可视图的方式高效立体揭示学科发展特征。学科知识图谱基于引文分析和可视化,将知识作为研究对象,直观地显示出知识的发展进程及其之间结构关系的图谱,并作为知识可视化的重要载体,描述了学科知识的内部结构及知识节点间的联系。
随着科学研究的飞速发展,越来越多的学者在各个学术领域间进行交流合作。学术合作可以交换学者之间的学术知识、提高工作效率,已经成为学术领域的发展趋势。学者们之间通过合作进行课题研究,共同发表文献,从而形成了复杂的科研合作关系网络,这种科研合作关系网络,包含了学者和学者之间、学者和科学研究领域之间、各个科学研究领域之间等多种类型的复杂关系。如何在这种复杂的学术关系网络中展现知识演化、发现隐含的关联知识是目前众多学者关注的问题。知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,构成一张巨大的语义网络图,因此,利用知识图谱可以较好地描述学术关系网络中的各种复杂关系,并利用知识图谱强大的语义处理能力去实现学者的影响力分析、领域研究热点之间的关联关系发现、未来研究热点的趋势预测等多类应用。
如何快速识别前沿问题并把握技术发展的方向,是当前很多科研机构和学者迫切的需求。通过知识图谱技术,在上亿篇文献信息中对技术来源、热度、发展趋势进行研究进行深入挖掘,进而实现技术发展趋势的准确预测。同时分析技术的出现、变迁和消亡的全过程,可以帮助研究人员理解领域的研究历史和现状,快速识别研究的前沿热点问题,把握技术的发展趋势。使用各领域科学知识图谱,通过对各领域研究的主要学者、重点文章、最新成果等信息加以分析,发现了研究的核心论文及知识谱系,建立专业方向和技术发展的知识图谱,并在最新的研究现状梳理的基础上对各个领域的前沿热点问题和技术研究的发展趋势进行了预测。
制造业转型
近几十年来,随着产业的不断发展和技术水平的进步,在人工红利、政策引导和市场需求的大力推动下,我国的制造业充分发挥成本、规模以及制度上的优势迅速发展,在体量和覆盖面上均位居世界前列。然而,相比较发达国家而言,我国制造业竞争力还有较大差距,如缺乏发达的产业分工体系、未形成强大的产业链、自主创新能力弱、产业结构不合理等尤其是高端装备制造业和生产性服务业发展滞后,部分企业还是建立在高能耗、高污染、高投入、低效益的基础之上,发展理念亟待转变。随着资源、环境和成本压力的加大,一方面,部分中、低端制造业已出现外流的趋势,另一方面在ICT技术的快速发展的驱动下,制造技术和信息技术融合带来新的工业革命,全球主要的制造大国均提出了制造业转型升级的战略方向,我国制造业从资源密集型和劳动密集型向技术密集型、数字密集型转型升级的任务已非常紧迫。
现阶段大部分企业普遍信息化、自动化基础都较为薄弱,受限于成本压力、技术风险及人才缺口等因素,目前对于数据积累和知识理解都处于初级阶端。而现阶段提供智能制造转型服务的多为软件或硬件服务商,对制造业行业知识和数据信息理解有限,而知识图谱技术可能为精益的数字化智能化升级提供解决方案。
随着竞争加剧,知识密集型行业的人力成本逐渐提高。同时,人才的培养需要管理、技术等多方面人才的密切配合,人员流动率的增大也会导致企业流失掉员工的经验,培训成本也随之增大。因此,企业也希望用知识图谱技术去沉淀经验,培训和赋能员工。
传统的制造业领域经历了几十年的发展,基础理论、材料、工艺等已经到了发展的瓶颈期,另一方面在金融、IT等行业的冲击下,制造业人才流失和断层十分严重,再者受制于技术壁垒、市场竞争、成本压力,这些都是导致制造业整体创新能力不足的因素。因此,加强知识图谱建设,增强技术流通,将有助于减缓人力和研发成本压力,提升行业创新能力,从而赋能制造业转型升级。
公共健康
目前,国内有280万注册执业医生,每天有2000万门诊量,特别是进入老龄化社会之后,对医生的需求量有增无减。《2016年中国卫生和计划生育事业发展统计公报》显示,医院卫生技术人员数同比增长5.57%,低于诊疗人次6.17%的增速,医疗资源供给将会越来越紧张。面对医疗健康产业供需严重不平衡的大背景,以医疗知识图谱为支撑的知识系统,可以一定程度上将医生从繁重的重复性知识工作中解放出来,专注于治病救人和疑难病症突破,进而提升医疗服务的效率、扩大医疗服务的供给、提供基于知识服务的患者院内院外高效服务,所以医疗健康知识图谱技术可以在医学辅助诊疗、知识推荐、医院管理、医疗控费等环节体现出强大的降本增效能力。
在分级诊疗问题上,可以通过优化医疗资源的配置,让不同层级的医院形成有效的分工协作,从而实现缓解目前医疗服务供给不足的矛盾。然而基层的医疗服务水平的薄弱,导致患者对于基层医生的广泛不信任,造成分级诊疗难以落实。医疗知识图谱可以将顶尖医学专家的知识和诊治经验进行快速复制,以医疗知识图谱为基础搭建的各类应用系统可以为基层医生提供实效、实时的决策支持,提高广大经验不足的医疗工作者的工作能力。借助医疗知识图谱海量、结构化的医学知识体,有望实现计算机辅助下的医疗辅助诊疗赋能,提高基层医院医生的诊疗能力,实现智能化的分诊导诊,配合并推动实现国家的分级诊疗制度和愿景规划,提升患者就医效率。
2006年,国家卫生部、国家中医药管理局、总后卫生部三家联合委托中华医学会,由其各医学分会制定了相关的学科《临床诊疗指南》。迄今为止,《临床诊疗指南》已经出版发行47分册,涉及临床各主要学科。但在《临床诊疗指南》之外,由中华医学各专业分会制定了大量的指南、专家意见、专家共识、指导原则等,这些资源对于临床实践具有重要意义。而基于医疗知识图谱构建的各类应用系统可以有效的加速诊疗规范的形成与验证,并且通过及时的诊疗知识推送和推广,更好的普及诊疗规范,同时可以实时发现诊疗违规,全面规范诊疗过程,降低误诊率和漏诊率,提升患者就医体验、降低就医成本。
在美国,每年在医疗上的开支接近3万亿美元,占GDP比例超过18%,其中7500亿美元是可避免的开支。经常会出现病人在急诊室门口等待却无人医治,或者医护人员和病床资源空闲时,却无人可医的情况。通过构建医疗知识图谱,以知识图谱为支撑的智能问诊系统,可以实现院内的智能分诊问诊,减少不必要的事务性资源占用,优化医疗服务流程,进而实现优化国家医疗支出,使患者享受优质的医疗服务的目的。
通过临床海量病例结合医疗知识进行医疗保险监督知识图谱构建,借此辅助医保信息系统智能化,建立的一种更加科学的医疗保险监管体系,涵盖事前、事中、事后的诊疗全过程,管理对象包括参保人、医师、医院和药店,管理的处方内容包括药品、检验检查及医用材料,识别医保费用报销数据中的各种异常疑似情况,辅助医保监控,一方面减少了医保欺诈对医疗资源的浪费与冲击;另一方面也提高了医保监控的工作效率,降低国家医疗支出。
人文发展
随着我国居民生活水平的稳步提高和市场供给端的长足进步,我国消费市场取得较快发展,大众餐饮、文化娱乐、休闲旅游、教育培训等服务消费已成为新的消费热点。2018年中国教育市场规模达到人民币2.68万亿元,至2020年民办教育的总体规模将达到3.36万亿元,复合增速12%;在文化娱乐消费方面,相关市场建设不断完善和市场供给能力日益增强等因素带动文化消费持续增长;2018年社会消费品零售总额中餐饮收入超过4万亿元,是1952年的3029倍,年均增长12.9%,比社会消费品零售总额年均增速高1.3个百分点;我国餐饮市场保持较快增长,餐饮收入占社会消费品零售总额比重由1952年的5.1%提升至2018年的11.2%。然而随着文化、教育娱乐等人文领域市场规模的快速增长,社会面临一系列重要挑战,对于知识图谱等技术需求日益明显,主要表现在如下几个方面:
知识图谱有助于提升传统文化数据知识化治理水平,拓展传播渠道,在国家大剧院,一场演出最多能容纳2000多名观众观看,同样的演出进入网络直播间,观众会立刻变成几十万甚至上百万。网络直播技术的出现,大大拓展了文化艺术的传播边界,在它的“加持”下,京剧、昆曲、民乐、书法、泥塑等传统文化艺术,可以从各自的小天地飞向社会的大舞台。不仅如此,网络直播中,受众的年轻化以及审美的多元化,也反过来推动了传统文化表达方式的创新转型。以诗词为代表的传统文化领域作为数字人文研究者关注的重要领域之一,存在大量的数据资源。由于唐诗在用词、句式、语法、对仗等方面要求较高,有着特殊的文法和习惯,传统的文本挖掘技术难以处理这样的古文文本,唐诗知识图谱的构建能够统一表示和组织唐诗领域数据并进一步实现智能化唐诗知识服务。
知识图谱有助于提升休闲娱乐消费体验和发展水平,近年来,休闲娱乐消费市场总体规模持续扩大,第三产业增加值占国内生产总值的比重从1980年的20%左右增加到2018年的52.2%,居民对休闲娱乐方面的需求不断提升,而且需求不断朝个性化、差异化方向发展。深入挖掘客户需求、发现店铺特色及能力需求不断提升,知识图谱作为重要的客户画像及辅助决策工具正在得到注意,其中美团点评作为重要的在线本地生活服务平台之一,覆盖了餐饮娱乐领域的众多生活场景,连接了数亿用户和数千万商户,积累了宝贵的业务数据,蕴含着丰富的日常生活相关知识。通过这些海量的休闲娱乐业务数据,构建具有数十亿实体关系的用户休闲娱乐知识图谱(如美团大脑知识图谱),能够更好的为用户提供休闲娱乐服务推荐,提升休闲娱乐体验与消费质量。
教育信息化一方面是把提升信息素养纳入培养目标;另一方面是把信息技术手段有效应用于教学与科研,注重教育信息资源的开发和利用。人工智能在第二方面显示出了极大的优势,可以远程教育教学,完全可以解决教育师资不均衡的问题。知识图谱通过实现课程资源、教研内容、教学管理方案之间的链接,进而在课前、课中、课后推动以学生为中心的智慧课堂、个性化学习资源推荐、学习进度评估等,提升教学质量,降低学生学习压力。