人工智能导论
时间:2022年10月19日下午 班级:2022级人工智能应用技术1班
作业问题:
Python安装注意事项
1.下载Python3.X的版本,如:3.10, 3.9, 3.8,不推荐下载2.7版本(已经不使用)
2.在命令行中,无法运行path->添加,需要知道安装的路径;
Pycharm安装注意:
1.官网下载,推荐下载免费(社区办)版本;
作业文件命名规范:学号_姓名.文件类型
人工智能应用方向
一、智能制造
二、智能家居
智能家具不等于智能家居 、华为鸿蒙系统
1.智能家居定义
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0Ur1zxgP-1670990144431)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221019142826087.png)]
2.智能家居组成:
2.1灯光开关控制原理:
单片机(通讯模块(WiFi))、继电器(开、关)、AI(语音控制)
2.2智能电气控制
传统家电控制,红外遥控方式
2.3电动窗帘控制
单片机(通讯模块(WiFi))、电动机(正反转)
2.4背景音乐控制
智能音箱、智能灯光的联动,场景
2.5安防系统
智能视频监控、智能门禁、智能预警系统(防盗、环境安全)
3.发展过程
1、有线连接阶段
RS-232串口、以太网、其他网络
交互方式:控制主机
2、无线连接阶段
WiFi、ZigBee NB-IoT(窄带物联网)、5G(第五代移动通讯技术)
交互方式:移动终端
3、智能语音交互阶段
交互方式:AI(语音识别)
交互方式:智能移动终端(智能音箱)
4、智能家居企业
小米、华为、海尔、格力
三、智慧医疗
1、智慧医疗定义:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cobaqTx9-1670990144432)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221019155041938.png)]
2、智慧医疗的技术支撑
可穿戴设备:智能眼镜、智能手表、
医疗物联网:
医疗云平台:医生和患者沟通
电子健康档案:慢性病、地方性的疾病
电子病历:共享
3、智慧医疗组成:
智慧医院
区域医疗
互联网医疗
四、智能物流
1、物流定义:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-t3EA3vYA-1670990144433)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221019162449825.png)]
智能物流定义:
通过系统平台实现,数字化信息系统管理的物流,包含物流、信息流;
2、智能物流的基本功能:
感知功能:车辆定位(GPS),RFID
整体功能:
智能分析功能:大数据应用
优化决策功能:
系统支持功能:
自动修正功能:
及时回馈功能:
物联网、大数据、人工智能关系
物联网:IT基础设施,生产数据(手动生产、自动生产);
大数据:IT数据存储、处理平台,分析处理,使用数据;
人工智能:IT高层应用、智能识别、智能管理、决策辅助;
五、智能城市
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UaXVrYbR-1670990144434)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221019165737531.png)]
泛在技术能力:分布式技术(云计算),边缘技术(物联网、雾计算)
作业:预习智能农业、智慧政务部分;
时间:2022年10月26日 应到:37人 实到:36
六、智慧农业
国家战略层面:智慧农业 是农业中的智慧经济,智慧经济形态在农业中的具体表现。智慧农业是智慧经济重要的组成部分;对于发展中国家而言,智慧农业是智慧经济主要的组成部分,是发展中国家消除贫困、实现后发优势、经济发展后来居上、实现赶超战略的主要途径。
1、定义
智慧农业 是指现代科学技术与农业种植相结合,从而实现无人化、自动化、智能化管理。
应用:智慧大棚、智慧养殖、立体农业(农业工厂)
释义
智慧农业就是将物联网技术运用到传统农业中去,运用传感器和软件通过移动平台或者电脑平台对农业生产进行控制,使传统农业更具有“智慧”。除了精准感知、控制与决策管理外,从广泛意义上讲,智慧农业还包括农业电子商务、食品溯源防伪、农业休闲旅游、农业信息服务等方面的内容。
所谓“智慧农业”就是充分应用现代信息技术成果,集成应用计算机与网络技术、物联网技术、音视频技术、3S技术、无线通信技术及专家智慧与知识,实现农业可视化远程诊断、远程控制、灾变预警等智能管理。
智慧农业是农业生产的高级阶段,是集新兴的互联网、移动互联网、云计算和物联网技术为一体,依托部署在农业生产现场的各种传感节点(环境温湿度、土壤水分、二氧化碳、图像等)和无线通信网络实现农业生产环境的智能感知、智能预警、智能决策、智能分析、专家在线指导,为农业生产提供精准化种植、可视化管理、智能化决策。
“智慧农业”是云计算、传感网、3S等多种信息技术在农业中综合、全面的应用,实现更完备的信息化基础支撑、更透彻的农业信息感知、更集中的数据资源、更广泛的互联互通、更深入的智能控制、更贴心的公众服务。“智慧农业”与现代生物技术、种植技术等科学技术融合于一体,对建设世界水平农业具有重要意义。
2、智能农业整体架构
-
感知层:传感器设备、执行器设备
-
传输层:互联网、移动互联网(3/4/5G)、局域网(以太网、Wifi、ZigBee、)、NB-IoT等;
-
平台层:云计算、大数据、云存储平台、物联网云平台等;
-
应用层:智慧农业、灾害预警平台等;
3、智能农业系统技术特点
智慧农业是物联网技术在现代农业领域的应用,主要有监控功能系统、监测功能系统、实时图像与视频监控功能。
-
监控功能系统:土壤温度、空间温湿度、土壤养分等;
-
监测功能系统:实现自动信息检测,根据做农作物生长需求实现控制管理;目的为了预警;
-
实时图像与视频监控功能:远程可视化、图像信息进行预警(AI);
4、智能农业应用场景
智慧大田、智能植物工厂、智能灌溉、智能水产、智能牧场、智能野生动物保护;
5、智能农业技术
智能图像识别、智能机器人(无人农机)、卫星云图(遥感技术)、智能终端设备;
七、智慧政务
单子政务:政府网站、政府在线、移动端政务业务APP
1、发展过程:信息发布、单项沟通、双向互动、全方位网上事务处理;
2、存在的问题:信息孤岛、缺乏电子政务有关法律和国家标准、信息安全、不同地区平台建设部平衡;
信创(IT设备的国产化)、CPU
单元3 运作平台与支撑
3.1云计算
信息技术的基础设施
1、定义
云计算(cloud computing)是分布式计算的一种,指的是通过网络**“云”**将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。
云计算指的是使用者按实际使用量付费的定价模式,在云服务平台中经由互联网按需提供计算能力、数据库存储、应用程序及其他 IT 资源。
2、互联网数据中心:
(Internet Data Center,简称IDC)是指一种拥有完善的设备(包括高速互联网接入带宽、高性能局域网络、安全可靠的机房环境等)、专业化的管理、完善的应用服务平台。在这个平台基础上,IDC服务商为客户提供互联网基础平台服务(服务器托管、虚拟主机、邮件缓存、虚拟邮件等)以及各种增值服务(场地的租用服务、域名系统服务、负载均衡系统、数据库系统、数据备份服务等)。
3、为什么使用云计算
给用户降低使用成本;(机房、硬件、软件、互联网专线、IT运维人员、安全设备、其他等)
总体拥有成本 (Total Cost of Ownership) 是一项财务估算值,可帮助确定系统的直接和间接成本。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QOSEFVyk-1670990144436)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221026171055961.png)]
3.1云计算优势考虑因素
硬性优势
•减少计算、存储、联网、 安全的开支
•避免采购软件和硬件(资本支出)
•减少运营成本、备份和灾难恢复
•减少运营人员
软性优势
•重复使用服务和应用程序,使您可以使用相同的云服务来定义和重新定义解决方案
•提高开发人员的生产力
•提高客户满意度
•提高员工士气
•敏捷的业务流程能够快速响应新的和新兴的机会
•增加全球覆盖面
4、云计算的特征
- 按需服务(计算资源可定制)
- 泛在接入(随时随地可连接)用户角色的接入、管理员的接入
- 资源池化(虚拟化技术:多个物理的服务器,可以虚拟出多个可以服务器)计算资源(CPU、内存)
- 弹性服务 (随时可以扩展)
- 计费服务(按需计费)
5、云计算的部署模型
- 私有云:企业中搭建
- 社区云:
- 公有云:基于互联网
- 混合云:
6、云计算的服务方式
-
基础设施即服务(IaaS):硬件资源、网络资源(带宽)、自己安装软件资源;
-
平台即服务(PaaS):实现了虚拟化,已经安装了操作系统(OS)、最多的是租用云主机;
-
软件即服务(SaaS):开箱即用
作业:你用过那些SaaS平台?
什么是CRM?
什么是REP?
同学们使用过那些云计算服务或者具体产品?
在线音乐、在线视频、在线游戏、云盘(百度云盘)、邮件(webmail)等;
基于客户/服务器模式使用
总体拥有成本 (Total Cost of Ownership) 是一项财务估算值,可帮助确定系统的直接和间接成本。
7、在“云”中做什么?
•应用程序托管、网站、微信公众号、微信小程序、内容分发:
•备份与存储、数据备份、云盘、数据库;
•企业 IT(开发测试、代码托管 gitee、github、CRM、REP)
8、重要的云术语
•超大规模
•虚拟化(资源的池化)
•高可用性(高度可用):
•通用性
•廉价
•安全
•方便:需要时可访问、
•容错能力(容错):能够承受一定量的故障,且仍然能够运行
•可扩展性(可扩展):需要时能够轻松增加规模、容量和/或范围、扩展(通常)基于需求
•弹性(有弹性):需要时能够增长(扩展),而不再需要资源时可以减小规模
3.2大数据
大数据新的信息处理模式;目的:发掘信息的价值,“炼数成金” 、“数据实现增值”;
EMC 信创产品
1.定义
对于“大数据”(Big data)研究机构Gartner(高德纳,又译顾能公司,NYSE: IT and ITB全球最具权威的IT研究与顾问咨询公司,成立于1979年,总部设在美国康涅狄克州斯坦福。)给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。 [3]
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
2.数据的计量单位
计算机存储的最小单位:位(二进制 0 、1) 8位二进制=1字节(Bytes) 1024(2的10次方)字节=1MegaBytes (MB) 1024MB=1GB 1024GB=1TB
大数据的计量单位:1000进行计算的
1000B=1KB 1000Kb=1Mb 1000Mb=1Gb 1000Gb=1Tb 1000Tb=1Pb
3.大数据的特征
大数据的特点主要分为以下四点(4V):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)。
4.大数据处理流程
-
收集:获取数据:非常重要、专业机构进行收集;例如:网络爬虫、设备获取日志、智能物联网终端
-
存储:存储介质:硬盘(1GB-8TB)->硬盘阵列(RAID)->网络存储设备(PB)->分布式存储集群
例如:FAT32、NTFS、GFS、HDFS、Hadoop 应用:网盘
-
管理:数据的读取和访问:NoSQL非关系型数据库例如:Redis、Memcache、MongoDb
-
处理:处理方式分为实时处理(流式处理)、离线处理(脱机计算)
离线处理:Hadoop(MapReduce) 、Spark
流式处理:Storm、Spark、Streaming
-
分析:查询:Hive、SparkSQL 消息队列:StormMQ
-
可视化:数据展示功能,通过表格、图、数据大屏;
前端开发工程师岗位:(HTML、CSS、JavaScript、bootstrap、VUE)
后端开发工程师岗位:(C/C++、Java、Python…)
数据管理工程师岗位:(DB、SQL、noSQL…)、AI(数据的收集、标注)
5.大数据的应用
1、数据产品;
2、行业大数据;
3、终端数据应用;
3.3智慧感知与移动互联
1.智能物联网(AIoT)架构:
-
智能感知:GPS、PDA、RFID、传感器、智能设备 感知层
-
网络构建:互联网、无线个/城/广域网 (移动互联网) 网络层
-
信息处理:数据中心、搜索引擎、数据挖掘 平台层
-
综合应用:智慧交通、智慧医疗、智慧物流 应用层
感知层:“让物品说话、发布信息” 、最底层的、上层结构的基础;
位置标识、ID标识(条形码、二维码、RFID)
网络层:数据的通信
3G、WiFi、Bluetooth、LoRa
平台层:数据存储、数据查询、数据处理、
物联网云平台(终端的接入)、MQTT
**应用层:**手机APP
智能家居、智能农业…
3.4 边缘计算(雾计算)
定义:一种分布式计算架构,计算下放到终端
特点:加快数据的处理和传输速度;减少延时;
架构:计算节点、连接运算、业务、智能服务
挑战:编程可行性、服务管理、优化指标、安全
3.5智能芯片
1.分类:
- 通用型芯片 :CPU、GPU
- 半定制化芯片: FPGA
- 全定制化芯片:ASIC
- 类脑芯片: NPU
2.应用场景:
- 安防监控:
- 家电和移动终端
- 无人驾驶汽车
- 云计算
- 智能硬件
3.国内芯片企业:
- 紫光集团、华为海思、长电科技、中芯国际、太极实业、中环股份、振华科技、纳斯达、中兴微电以及华天科技。
- 寒武纪
3.6人工智能平台
1、国际人工智能平台
- 亚马逊人工智能平台
- Microsoft Azure
- Google cloud
2、国内人工智能平台
-
百度AI:基于AI API接口应用开发、基于计算的能力(Paas)
百度大脑:https://ai.baidu.com/
开源深度学习平台:https://www.paddlepaddle.org.cn/
-
阿里AI
-
腾讯AI
网址:https://ai.qq.com/
- 华为AI
作业:
1、阿里AI、腾讯AI、华为AI三大平台各提供那些能力、访问网址;
编制文档、添加截图;
单元4 人工智能关键技术
目标:了解关键技术的概念
理解应用场景
规划学习的方向
背景:
人工智能的三大流派:
•逻辑主义(符号主义),用符号表达的方式来研究智能、研究推理,奠基人是西蒙(CMU),应用有几何定理证明机、聊天机器人;第一次浪潮
•行为主义:推崇控制、自适应与进化计算,奠基人是维纳(MIT),早期的人工智能对它的期望值是比较高,但是近年来行为主义没有发展起来;
•连接主义:模仿人的神经系统,把人的神经系统的模型用计算的方式呈现,奠基人是明斯基(MIT),神经网络以及新一波人工智能背后的技术深度学习就属于这一流派;第三次浪潮
4.1机器学习(课程)
4.1.1 机器学习的发展过程
第一阶段:第一个15年是符号主义和连接主义,符号主义为主;
第二阶段:第二个15年统计学习方法占据主流;
第三阶段:近期10多年神经网络为主导深度学习方法成为了具有压倒性地位的最新技术;
4.1.2 什么是机器学习
人类学习的目的获取知识、解决实际问题;
机器学习(Machine Learning)ML:是通过给定的数据和样本,构建模型和算法(程序),完成对新数据的预测;
一般来说,机器学习就是通过计算手段(算法),利用经验(数据/样本)来进行学习系统的性能;
机器学习就是从数据中训练模型,然后使用模型实现预测
4.1.3 机器学习的分类
人类学习过程是在指导者的指导下:
监督学习:有数据、加标注/标签; ->数据集
无监督学习:数据无标注 ,由于每个特征数据没有标签,学习过程中只能依赖这些特征数据之间的内在联系和相似性
半监督学习:
4.1.4 机器学习的经典案例
机器视觉-》图像识别-》图像分类
1.鸢尾花识别
2.手写数字识别
3.目标检测-》YOLO V7(1-7)-》交通标志的识别
4.农业、医学、…
4.1.5机器学习的流程
- 数据集:数据集除了提供数据,通常还需要对数据进行标注
- 分类算法(模型):
- 训练(提取特征):
- 预测:
作业1:如何获取数据集?
公共数据集(下载)、自定义数据集(采集、网络爬虫、程序生成)
作业2:数据集标注的目的是什么?
分类,可参照,预测、推理
2022年11月23日
4.1.6 回归
有监督机器学习有两类:回归问题和分类问题
回归问题预测连续结果;分类问题预测离****散结果
工资 、年龄、职业 贷款 y = x*w1 + w2
线性回归的目的是实现准确预测;
4.1.7分类
数据集分为训练集、测试集
分类问题预测离散值,这些离散值定义为不同的类别
例如:
对收到的邮件判断为垃圾邮件或正常邮件(二分类)
根据病人的检查结果判断病人有没有肿瘤(二分类)
鸢尾花数据集有3个类别的鸢尾花
MNIST数据集有10个类别,即0~9手写体图像
ImageNet数据集包括1000个类别的物体图像
常用分类算法:
逻辑回归分类法:如何利用回归函数预测离散值,实现分类
最大似然估计法求解分类:
发现问题,好奇 、思考
分析问题,知识储备
解决问题:理论研究-》实际
(职业类院校)理论研究(理解)-》实现(编程实现)-》0到1(关键)
高等数学 计算机语言
4.1.7支持向量机
•距离超平面最近的点到超平面的距离称为间隔(margin)
•间隔越大,分类效果越好
•支持向量机训练目标是:尽可能增大间隔
4.1.8决策树
决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别
4.1.9 k-均值聚类算法
•无监督学习方法有k-均值(k-means)聚类算法、高斯混合模型等
•k-均值聚类把相似对象归到同一簇,簇内对象越相似,聚类效果越好
4.2人工神经网络
•生物神经元;
•建立人工神经网络模拟大脑,首先要建立人工神经元模拟生物神经元
•激励函数
•人工神经网络既可以解决回归问题,也可以解决分类问题
•输入层 若干个隐藏层 输出层
4.3.1 感知机
4.3.2 神经网络的训练
2022年11月23日作业
作业1:例举生活中有哪些回归问题?(股票预测分类)
作业2:例举生活中有哪些分类问题?(垃圾分类)
作业3:学习https://playground.tensorflow.org/
4.3深度学习(课程)
4.3.1深度学习的概念
深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。
输入数据:图片、文本、数值
特征提取:特征工程
•从图像中识别物体或者从语音中识别语义需要首先提取简单特征,再从简单特征中依次提取更加抽象的特征
训练模型:
4.3.2卷积运算
CNN的全称是"Convolutional Neural Network"(卷积神经网络)。而神经网络是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)结构和功能的数学模型或计算模型。
图片中如何提取?
有别于普通神经网络的全联通结构,深度学习的特点是对输入矩阵的局部区域执行卷积运算实现特征提取。因此,深度网络也称为卷积神经网络(Convolutional Neural Networks,简称CNN) ?
卷积:
卷积核:
图片宽高-图片-像素-颜色表示:RGB -》255,0,0 -》 RGB A
卷积运算特点:
•与传统神经网络通过矩阵乘法建立输入和输出之间的连接关系相比,卷积运算具有稀疏连接的特点
•对于全联通神经网络,每一个输出单元与每个输入单元相关。对于卷积网络,每个输出单元只与卷积核大小的图像区域相关
•卷积核可以看作特征提取器,卷积运算从局部区域提取特征
•卷积运算的另一个特点是参数共享。对于全联通网络,权重矩阵的每个元素只使用一次,当它乘输入元素后就再也用不到了。而卷积核的每个参数在每次卷积中都会反复用到。参数共享确保我们只需要学习一个很少的参数集合
•CNN的卷积运算类似于图像处理中的滤波,但是滤波中的卷积核是给定的,而CNN卷积核是通过使用训练数据训练出来的
4.3.3卷积神经网络(CNN)架构
•https://zhuanlan.zhihu.com/p/67206089
4.3.4 深度学习的应用
1.物体分类
ImageNet有22,000种类别物体的1500万个图像,ILSVRC数据集使用其中1000个类别物体的图像
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gn4hxg03-1670990144438)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221130101201180.png)]
2.物体检测/目标检测
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V1VXATDV-1670990144438)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221130102200843.png)]
3.自然语言处理NLP
语音识别
文本处理:
4.人脸检测和识别
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cPVoDvne-1670990144439)(C:\Users\ThinkPad\AppData\Roaming\Typora\typora-user-images\image-20221130102701546.png)]
5.图像合成
美颜相机、视频直播
6.AI游戏
围棋:Alpha GO
7.其他
4.4机器学习工具
4.4.1深度学习框架
1、TensorFlow 简介:
•Google公司推出的用于机器学习的开源软件工具
•Tensor是张量的意思,即矩阵,Flow是流动的意思,两者合起来形象地说明了深度学习逐层提取特征的过程
•TensorFlow网站 https://tensorflow.google.cn/
•Tensorflow2.0包括Tensorflow核心库,JavaScript , Lite,Extended,有一个完整的生态系统
•Tensorflow的高级API基于Keras API,可以快速创建神经网络
2、TensorFlow安装
参考官方文档:https://tensorflow.google.cn/install
-
安装python
-
pip install tensorflow==2.8.3
pip install tensorflow==2.8.3 -i https://pypi.doubanio.com/simple
3.验证
import tensorflow as tf
print("TensorFlow version: {}".format(tf.__version__))
print("Keras version: {}".format(tf.keras.__version__))
4.热门应用:
AI绘画、AI音乐
4.5计算机视觉(课程)
1、概述:
•计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学,如何使人工系统从图像中“感知”的科学、三维场景的重建
软件产品:OpenCV(C++、Python)
发展:1970开始
•21世纪前10年,计算机视觉与图形学进一步深度融合
•还产生了计算摄影学(Computational photography),这一技术通过结合计算、传感器、光学器件、以及智能光照等技术改进成像机理,把软件计算能力融合到相机硬件中,全方位捕捉真实世界的场景信息;
用于物体识别的基于特征的技术,例如兴趣点(Interest point)特征。这一技术也成了场景识别和位置识别的主流方法。除了提取特征外,轮廓和区域分隔也被用于物体识别;
•图像分类的精度已经非常接近甚至超过了人类,除了分类,深度学习还应用到物体检测、人脸识别、图像分割以及视频信息处理;
主要技术:
- 特征检测和匹配
- 图像分割
- 三维重构
2、数字图像处理
•相机成像过程是一个三维世界投影到二维场景的过程
•彩色图像有RGB(红绿蓝)三个通道 (1024 768 3) BMP格式
•为了节省存储空间,相机成像后还要对图像进行压缩,压缩后的图像有JPEG、GIF、PNG等格式
- 几何变换
•图像可以在二维平面内做整体变换,例如平移、旋转、放大或缩小、仿射、投影等
-
滤波
-
图像金字塔
-
形态学处理
4.6自然语言处理(课程)
1、智能语音处理
- 语音识别(Speech to Text)、语音翻译、语言输入:(语音 转 文本)
- 语音合成(Text to Speech)语音播报、朗读:(文本 转 语音)
2、智能对话系统
- Turing Test
- Chatbot**:**Chat Robot
- 对话机器人 ICR
3、智能文本处理
人工智能领域里的其中一项重要分支,也是人工智能发展的一大关键技术。
自然语言处理技术企图让计算机处理、分析、理解及运用人类的语言,以实现人与计算器之间用自然语言进行有效通信的诸多应用;
4.7人机互动与设计(课程)
1、语音互动
•语音采集:完成音频的接收、采样及编码
•语音识别:完成语音信息到机器可识别的文本信息的转化
•语意理解:根据语音识别转换后的文本字符或命令完成相应的操作
•语音合成:完成文本信息到声音信息的转换
•较为成熟,且广泛应用
•智能手机、智能家电与智能音箱
•智能音箱
•通过语音互动功能与人工智能,智能音箱不仅能操控家电,还能询问各种信息,也能要求讲故事、叫车、订披萨等等,取代人类双手迈向智慧家庭
•国外
•Amazon Echo
•Sonos Play 1
•Google Home
Apple HomePod
•国内
•阿里天猫精灵
•百度小度音箱
•小米小爱同学
•科大迅飞叮咚音箱
•腾讯听听音箱
未来发展
•嵌入于更多装置:车载系统、居家照护系统
•「语音」商务:将品牌个性化、让体验更个性化
•英文体系已成形,中文体系急起直追:众多厂商投入AI语音领域
作业:
1、例举计算机视觉的应用产品有哪些?
2、例举自然处理的应用有哪些?
2、体感互动
-
体感方式
- 惯性感测
- 光学感测
- 光学联合感测
-
现况
•体感游戏
•谷歌:空间感知和手势控制
•微软::Kinect、手势识别追踪技术Handpose
•亚马逊:无人商店Amazon Go
未来发展
•行为能够反馈到人的身体
•AR VR MR结合体感互动
•游戏
•教育
•观光旅游
•电子商务
•医疗
3、情感互动
技术原理
•机器人“精神层面”的研究
•对人类的情感进行侦测、分类、组织和响应
•通过各种传感器获取由人的情感所引起的生理及行为特征信号
•最终使计算机像人一样能进行自然、亲切和生动的交互
研究内容
•情感机理的研究
•情感信号的获取
•情感信号的分析、建模与识别
•情感理解
•情感表达
•情感生成
发展现况
标准
2017年3月举办的ISO/IECJTC1/SC35德国柏林会议上,由中国科学院软件研究所、中国电子技术标准化研究院、小i机器人三家中国科研机构和企业共同提出的“信息技术-情感计算用户界面—框架”提案获得正式立项
情感互动的应用
交互界面设计
人机接口设计
情感互动的行业发展现状
未来发展
•情感的来源与本质特征的表示
•多模态条件下的情感互动计算
•情感的个性化度量
•基于细微情感表示的情感互动算法持续改进
4.8虚拟现实与增强现实(课程)
1.虚拟现实
什么是虚拟现实:
•虚拟现实是利用计算机模拟产生一个三维空间的虚拟世界。
•提供用户关于视觉感官等的模拟,让使用者身临其境,可以实时、没有限制地观察和操控三维空间内的事物。
•用户进行位置移动或操作手持设备时,计算机可以立即进行复杂的运算,传回精确的三维世界中的互动影像,产生临场感。
虚拟现实系统具有下面三个基本特征:沉浸—互动—构想
-
人能够沉浸到计算机系统所建立的虚拟环境中,例如看电影
-
人能够通过传感器与虚拟环境发生互动,例如在虚拟世界驾驶赛车
-
人有可能从虚拟环境中得到感知和理性的认识,从而深化概念和萌发新意,例如产品设计
虚拟现实的应用
•虚拟现实与计算机视觉和计算机图形学相结合产生了3D电影
•赛车模拟器,模拟生物,模拟机械拆装
•音乐演奏-互动体验
•产品设计- 激发构想
•产品宣传
2.增强现实
什么是增强现实
•增强现实技术是一种将虚拟信息与真实世界巧妙融合的技术,将计算机生成的文字、图像、三维模型、音乐、视频等虚拟信息模拟仿真后,应用到真实世界中,两种信息互为补充,从而实现对真实世界的“增强”
•增强现实包括三个方面:
1. 虚拟物与现实结合
2. 即时交互
3. 三维
•增强现实有三大技术要点:三维注册、融合显示和人机交互
•三维注册就是通过摄像头对真实场景进行数据采集,并传入处理器进行分析和重构,将虚拟信息与现实场景信息进行对位匹配
•融合显示就是通过摄像头、传感器等配件实时更新现实环境中的空间位置变化,实现虚拟场景和真实场景坐标系的对齐并进行融合计算,最后将其合成影像呈现给用户
•人机交互就是用户可通过交互配件,如话筒、眼动追踪器、红外感应器、摄像头、传感器等设备采集控制信号,并进行相应的人机交互及信息更新,实现增强现实的交互操作
增强现实的应用
•利用增强现实技术实现导航
•利用增强现实技术实现文物复原
•工业增强现实技术可以将数字内容叠加到现实工作环境中
•增强现实用于航空与军事
专业术语:
虚拟专用网络
VPN(Virtual Private Network):虚拟专用网络(VPN)的功能是:在公用网络上建立专用网络,进行加密通讯。在企业网络中有广泛应用。VPN网关通过对数据包的加密和数据包目标地址的转换实现远程访问。VPN可通过服务器、硬件、软件等多种方式实现。
客户关系管理系统
CRM:
企业资源计划
ERP:
磁盘阵列
磁盘阵列(Redundant Arrays of Independent Disks,RAID),有"数块独立磁盘构成具有冗余能力的阵列”之意。 [1]
磁盘阵列是由很多块独立的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。
数据库(作业)
DB:
DBS:
DBMS:
SQL:
NoSQL:
应用程序接口(API):
LoRa:
MQTT:(消息队列遥测传输)是ISO 标准(ISO/IEC PRF 20922)下基于发布/订阅范式的消息协议。它工作在 TCP/IP协议族上,是为硬件性能低下的远程设备以及网络状况糟糕的情况下而设计的发布/订阅型消息协议,为此,它需要一个[消息中间件 ](https://baike.baidu.com/item/消息中间件 /5899771?fromModule=lemma_inlink)。
MQTT是一个基于客户端-服务器的消息发布/订阅传输协议。MQTT协议是轻量、简单、开放****和易于实现的,这些特点使它适用范围非常广泛。在很多情况下,包括受限的环境中,如:机器与机器(M2M)通信和物联网(IoT)。其在,通过卫星链路通信传感器、偶尔拨号的医疗设备、智能家居、及一些小型化设备中已广泛使用
M2M:机器与机器
FPGA:(Field Programmable Gate Array)是在PAL (可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。 [1]
OCR:OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等
ASR:语音识别(Automatic Speech Recognition,ASR)
计的发布/订阅型消息协议,为此,它需要一个[消息中间件 ](https://baike.baidu.com/item/消息中间件 /5899771?fromModule=lemma_inlink)。
MQTT是一个基于客户端-服务器的消息发布/订阅传输协议。MQTT协议是轻量、简单、开放****和易于实现的,这些特点使它适用范围非常广泛。在很多情况下,包括受限的环境中,如:机器与机器(M2M)通信和物联网(IoT)。其在,通过卫星链路通信传感器、偶尔拨号的医疗设备、智能家居、及一些小型化设备中已广泛使用
M2M:机器与机器
FPGA:(Field Programmable Gate Array)是在PAL (可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。 [1]
OCR:OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等
ASR:语音识别(Automatic Speech Recognition,ASR)