知识图谱
在看影视剧或小说时,若其中的人物很多、人物关系复杂,我们一般会用画人物关系图谱来辅助理解人物关系。那什么是知识图谱呢?
知识是人类对信息进行处理之后的认识和理解;对数据和信息的凝练、总结后的成果。
图谱是一些事物与另一些事物之间相互连接的结构;图谱通常由一些结点和连接这些结点的边组成;实体(节点)指的是现实世界中的实物;关系(边)则表达不同实体之间的某种联系。
知识图谱把图形学、信息可视化技术等理论方法与计量学引文分析、共现分析等方法结合;是利用可视化的图谱形象地展示学科的整体知识架构,达到多学科融合目的的现代理论;本质上,是一种揭示实体之间关系的语义网络
搭建知识图谱的核心就在于对业务的理解以及对于知识图谱本身的设计;设计离不开对业务的深入理解以及对未来业务场景变化的预估;一个完整的知识图谱包含以下几个步骤:
- 应用示例——基于知识图谱的推荐系统
电商推荐系统- 基于知识图谱的推荐系统可以融合多源信息,包括商品的上架信息、用户的喜好因素、用户对某一商品的喜好程度等;
- 能够更加充分地挖掘用户和商品之间的潜在联系,将为用户的最终决策提供更有效地支持;
机器翻译
机器翻译是用计算机来实现不同语言之间翻译的技术;被翻译的语言通常称为源语言,翻译成的结果语言称为目标语言。
机器翻译即实现从源目标到目标语言转换的过程,是自然语言处理的重要研究领域之一。
机器翻译的三种常用功能:
- 文字翻译:最常见的应用功能,输入一段源语言文字,翻译并输出一段目标语言的文字。
- 语音翻译:先试用语音识别技术识别出语音素材中的内容,然后转换成文字,再翻译成目标语言。
- 回译技术:把被翻译成另一种文字的内容再转译成原文的过程和表述;回译可分为三种:检验性回译、研究性回译和机械性回译。
机器翻译的应用:图片翻译、语种识别等。
智能机器人
智能机器人是一个独特的进行自我控制的“活物”,智能机器人是具有感知、思维和行动能力的机器。
智能机器人的特点:
- 智能机器人至少具备三个要素:感觉要素、思考要素和反应要素;
- 智能机器人具备各种各样的内部信息传感器和外部信息传感器;
- 它有相当发达的“大脑”,在脑中起作用的是中央处理器;
- 智能机器人能够理解人类的语言,用人类语言与操作者对话。
智能机器人的分类
- 传感型
没有智能单元只有执行结构和感应结构;利用传感信息(包括视觉、听觉、激光等进行传感信息处理);实现控制和操作的能力。例如:自动化焊接机器人、搬运机器人等。 - 交互性
通过计算机系统和操作员或程序员进行“人机对话”;实现对机器人的控制与操作;具有部分处理的决策功能。例如:聊天机器人、机器人客服等。 - 自主型
无需人的干预,能够在各种环境下自主完成各项拟人任务,拥有自主性和适应性。例如:家庭服务机器人、酒店服务机器人等。
自动驾驶
自动驾驶就是车辆在无驾驶员操作的情况下自行实现驾驶,它是车辆的能力。
自动驾驶的基本实现原理
自动驾驶的等级
- L1级别
L1表示车辆自动完成横向(方向)或纵向(速度)操控中的一项;其余所有工作仍然需要人类来完成。 - L2级别
L2是对横向和纵向多项操作同时进行控制;驾驶员仍需要保持注意力,随时接管车辆。 - L3级别
L3的架势主体切换成了系统,驾驶员只是支援角色;功能开启时,系统完全负责操控和环境监测。 - L4级别
- L4级别的系统不再需要人类的支援;系统可以完全负责操控和环境检测。
自动驾驶的软硬件系统
自动驾驶的硬件系统部署在每一层里
- 感知层
硬件有摄像头、激光雷达、毫米波雷达、超声波雷达、GNSS/IMU等;为自动驾驶系统获取外部行驶道路环境数据并帮助系统进行车辆定位。 - 决策层
自动驾驶计算芯片是决策层最为重要的硬件;自动驾驶芯片处理数据保证系统及时作出正确的决策,控制车辆自动行驶并确保安全。 - 控制层
核心的硬件线控系统为线控油门、线控转向、线控制动;线控系统给取代机械等形式的连接,实现电子控制,不再需要驾驶员的力量或者扭矩的输入。
智能开放搜索
搜索引擎是根据用户的需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术;能够为用户提供快速的、高相关性的信息检索服务,核心模块一般包括爬虫、索引、检索和排序等。
智能搜索引擎提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能化信息过滤和推送等功能;以数据挖掘和知识发现为主要手段,加上自然语言理解、智能搜索代理、多媒体信息检索等技术的应用;相对于传统搜索引擎,进一步提高系统性能和检索的精度和效果。
智能搜索引擎的关键技术
- 全文搜索技术
搜索方式方便简捷,并容易获得所有相关信息;得到的信息过于庞杂。 - 元搜索技术
有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。 - 目录搜索技术
对网站内的信息整合处理并分目录呈现给用户;适应的范围非常有限。 - 分布式搜索技术
适用于有明确搜索意图的情况下检索;能够准确获取相关信息。
智能推荐
- 需求背景(为什么越来越多产品需要搭载智能推荐系统?)
- 信息过载:互联网上每天都在产生海量的信息。用户感兴趣的内容或商品匹配度不高,导致用户体验或者粘性不高
- 流量分配:绝大多数用户的需求往往是关注主流内容或商品,而忽略相对冷门的大量产品信息。
智能推荐是人与信息的连接器,用已有的连接全区预测未来用户和物品之间会出现的连接;本质上处理的是信息,它的主要作用是在信息生产方和消费方之间搭建起桥梁,从而获取人的注意力。
智能推荐系统的实现流程
- 通过收集不同来源的数据汇聚成推荐算法需要的原始数据;
- 通过特征工程对原始数据处理生成最终特征;
- 再通过选择合适的推荐算法对特征进行训练获取最终的推荐模型;
- 最后根据某个用户的特征,将特征输入至推荐服务系统获得该用户的推荐结果。
智能推荐系统的关键技术——数据管理
哪个用户在什么时间点对什么内容发生了什么行为以及这个行为的内容是什么;
数据的类型:物料类数据、用户类数据、静态身份数据、用户行为数据。
智能推荐系统的关键技术——推荐算法
基于关联规则的智能推荐算法在电商领域应用较为广泛;关联规则的目的是挖掘数据之间的联系。