1、人工智能的一个比较流行的定义,也是该领域较早的定义,是由约翰
·
麦卡锡(
John
McCarthy|
)在
1956
年的达特矛斯会议(
Dartmouth Conference
)上提出的:人工
智能就是要让机器的行为看起来就象是人所表现出的智能行为一样。但是这个定义似
乎忽略了强人工智能的可能性。另一个定义指人工智能是人造机器所表现出来的智能
性(弱人工智能)。
2、艾伦
·
图灵在论文《计算机器与智能》中讨论过“机器能思考吗”问题。
3、Howard Gardner加德纳教授提出多元智能理论,他指出了体现多元智能的八种能力:
语言
(Verbal/Linguistic)
逻辑
(Logical/Mathematical)
空间
(Visual/Spatial)
肢体动觉
(Bodily/Kinesthetic)
音乐
(Musical/Rhythmic)
人际
(Inter-personal/Social)
内省
(Intra-personal/Introspective)
自然(
Naturalist
)
对机器学习的认识可以从多个方面进行,有着“全球机器学习教父”之称的
Tom
Mitchell
则将机器学习定义为:对于某类任务
T
和性能度量
P,
如果计算机 程序在
T
上以
P
衡量的性能随着经验
E
而自我完善,就称这个计算机程序从经 验
E
学习。这些定义都
比较简单抽象,但是随着对机器学习了解的深入,我们会 发现随着时间的变迁,机
器学习的内涵和外延在不断的变化。因为涉及到的领域 和应用很广,发展和变化也
相当迅速,简单明了地给出“机器学习”这一概念的定义并不是那么容易。
普遍认为,机器学习(
Machine Learning
,常简称为
ML
)的处理系统和算法 是主要
通过找出数据里隐藏的模式进而做出预测的识别模式,它是人工智能 (
Artificial
Intelligence
,常简称为
AI
)的一个重要子领域,而人工智能又与更广 泛的数据挖掘
(
Data Mining
,常简称为
DM
)和知识发现(
Knowledge Discovery in Database
,
常简称为
KDD)
领域相交叉。为了更好的理解和区分人工智能
(Artificial Intelligence)
、
机器学习
(Machine Leaning)
、数据挖掘
(Data Mining)
、模式识别
(Pattern
Recognition)
、统计
(Statistics)
、神经计算
(Neuro Computing)
、
机器学习> 深度学习
多层感知机(MLP,Multilayer Perceptron)就是一种深度学习的结构。
深度学习通过底层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示
研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本等。
机器学习算法主要是基于
样本数据构建模型,以便做出预测
人工智能的主要学派
——
符号主义
符号主义(
Symbolicism
),又称为逻辑主义(
Logicism
)、心理学派(
Psychologism
)
或计算机学派(
Computerism
)。
符号主义认为人工智能源于数理逻辑。人类的认知基元是符号,人类认知的过
程是各种符号进行推理运算的过程,认为人是一个物理符号系统,计算机也是一个物理
符号系统
符号主义在
1956
年首先采用“人工智能”这个术语,并长期一枝独秀,为人工智能的发
展作出重要贡献,特别是专家系统的开发与应用落地。
1956
后,符号主义又发展了启发式算法
>
专家系统
>
知识工程理论与技术,并在
1980
年代取得重要发展。
专家系统的成功开发与应用,为人工智能走向工程应用和实现理论联系实际具有特别
重要的意义。
人工智能的主要学派
——
连接主义
连接主义(
Connection
),又称为仿生学派(
Bionicsism
)或生理学派(
Physiologism
)。
连接主义认为人工智能源于仿生学,特别是对人脑模型的研究。他们认为人类的思维基
元是神经元,而不是符号处理过程。从神经元开始进而研究神经网络模型和脑模型
连接主义的代表性成果是在
1943
年创立的脑模型即
MP
模型。
20
世纪
70~80
年代受限于生
物原型和软硬件技术限制人们对脑模型的研究一度陷入低潮。直到有专家提出用硬件模
拟神经网络后,连接主义才又重新抬头。
当下人们对人工神经网络(
ANN
)的研究热情仍然较高。
网络中的单元可以代表神经元,而连接可以代表突触,就像在人脑中一样。
1986
年,鲁梅尔哈特等人提出多层网络中的反向传播(
BP)算法。
人工智能的主要学派
——
行为主义
行为主义 (
Actionism
) , 又称为进化主义 (
Evolutionism
) 或 控 制 论 学 派
(
Cyberneticsism
)。
行为主义认为人工智能源于控制论。他们认为智能取决于感知和行动。认为智能不需要
知识、不需要表示、不需要推理。人工智能以像人类智能一样逐步进化。智能行为只能
在现实世界中与周围环境交互作用而表现出来。
行为主义在早期工作中主要是模拟人在控制过程中的智能行为和作用。到
20
世纪
80
年代
诞生了智能控制和智能机器人系统。
行为主义偏向于应用实践,从环境不断学习以不断修正动作。
学派代表作:布鲁克斯的六足机器人
——
一个基于感知
-
动作模式的模拟昆虫行
为的控制系统。
该学派有点类似自适应控制系统,基于传感器(环境)收集数据并对系统进行作用。
1956
年
8
月,在美国达特茅斯学院中,约翰
·
麦卡锡(
John McCarthy
,
LISP
语言创始
人)、马文
·
闵斯基(
Marvin Minsky
,人工智能与认知学专家)、克劳德
·
香农
(
Claude Shannon
,信息论的创始人)、艾伦
·
纽厄尔(
Allen Newell
,计算机科学
家)、赫伯特
·
西蒙(
Herbert Simon
,诺贝尔经济学奖得主)等科学家聚在一起,讨
论着一个不食人间烟火的主题:用机器来模仿人类学习以及其他方面的智能。
1956
年也就成为了人工智能元年
Diffusion Model
人工智能的一项重要指标是在没有任何先验知识的前提下,通过完全的
self-learning
,
也就是自我学习,在极具挑战的领域里边达到超人的境界,
强人工智能是指在各方面都能和人类比肩的人工智能, 因此强人工智能不是仅限于
某一领域, 而是让机器人全方位实现类人的能力。 强人工智能能够进行思考、 计划、
解决问题、 抽象思维、 理解复杂理念、 快速学习和从经验中学习。目前有一种认为
是, 如果能够模拟出人脑, 并把其中的神经元、 神经突触等全部同规模地仿制出来,
那么强人工智能就会自然产生。
•
当前我们正处于弱人工智能阶段。 弱人工智能的产生减轻了人类智力劳动, 类似于
高级仿生学。 无论是阿尔法狗, 还是能够撰写新闻稿和小说的机器人, 目前仍然还
只属于弱人工智能范围, 它们的能力仅在某些方面超过了人类。 数据和算力在弱人
工智能时代不言而喻, 其推动了人工智能的商业化发展, 在强人工智能时代以上两
个因素仍然是最重要的因素。 与此同时,以谷歌和
IBM
为代表的科技巨头在量子计算
上的研究也为人类进入强人工智能时代提供了强大助力。
•
技术层:通用技术,算法,技术框架
•
通用技术:自然语言处理,计算机视觉,语音识别,机器学习等
•
算法:机器学习,强化学习,深度学习等
•
技术框架:分布式存储,分布式计算等
舆情分析:通过关键词提取、文本聚类、主题挖掘等算法模型,挖掘突发事件、舆论
导向,进行话题发现、趋势发现、舆情分析等。多维度分析情绪、热点、趋势、传播
途径等,及时全面的掌握舆情动态;
•
情感分析:通过情感分析、观点抽取等相关技术从大量用户评论中提取出情感倾向以
及关键的观点信息
•
知识图谱:通过
NLP
技术辅助进行知识抽取。比如模型是中文的,机器翻译,对一些
医学材料从英文到中文。文本挖掘,一段话提炼中心思想等
2020
年第
1
季度开源
MindSpore
全场景
AI
计算框架。
•
全栈,是技术功能视角,是包括芯片、芯片使能、训练和推理框架和应用使能在内的
全堆栈方案;
•
全场景,是包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等
全场景的部署环境。
•
这其中,
Atlas
作为华为全栈全场景
AI
解决方案的基石,基于
昇
腾
AI
处理器提供了模
块、板卡、服务器等不同形态的产品,满足客户全场景的算力需求。
•
应用使能:
提供全流程服务(
ModelArts
)
,
分层
API
和预集成方案。
•
MindSpore
:
支持端、边、云独立的和协同的统一训练和推理框架。
•
CANN
:
芯片算子库和高度自动化算子开发工具。
•
Atlas
:
基于
Ascend
系列
AI
处理器,通过丰富的产品形态,打造面向“端、边、云”
的全场景
AI
基础设施方案。
•
华为的
AI
全场景包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终
端等端、边、云的部署环境。
•
基础这两个
AI
芯片的
Atlas
硬件有
•
推理系列:
Atlas200
加速模块,
Atlas500
智能小站,
Atlas300I Pro
推理卡,
Atlas
300I Duo
推理卡,
Atlas 500Pro
智能边缘服务器,
Atlas800
推理服务器,
Atlas 300V
Pro
视频解析卡
•
训练系列:
Atlas 300T Pro
训练卡,
Atlas 900Pod
,
Atlas 900T PoD Lite
,
Atlas 800
训练服务器,
Atlas 900AI
集群。
ModelArts
训练流程参考:
https://www.huaweicloud.com/product/modelarts.html
昇
腾主打胶片
• MindX DL
(
昇
腾深度学习组件)是支持
Atlas 800
训练服务器、
Atlas 800
推理服务
器的深度学习组件参考设计,提供
昇
腾
AI
处理器资源管理和监控、
昇
腾
AI
处理器优
化调度、分布式训练集合通信配置生成等基础功能,快速使能合作伙伴进行深度学习
平台开发。
• MindX Edge
:轻量化的边缘计算资源管理运维,使能行业客户快速搭建边云协同推
理平台。
• MindX SDK
:面向行业场景的完整
AI
开发套件,提供极简易用的
API
及图形界面,使
能开发者以极少代码快速开发行业
AI
应用。
•
ModelZoo
:
为开发者提供丰富的场景化优选预训练模型,为开发者解决了模型的选
型难、训练难、优化难等问题
以前的AI应用是单技术方向的,比如 图像识别和分类,声音识别和克隆等等,可以
算是AI+行业的应用探索
•
现状,随着 单模到多模的AI应用开发,从感知到认知的知识计算方案落地,AI开始
走进企业核心生产系统,深入企业的数字化工作中,形成智慧城市、工业互联网等系
统性的智能方案,开始创造更大的价值。
•
图像分类模型:EfficientNet,YOLO等。2019年
谷歌推出
EfficientNet
•
语音识别:
RNN-T (Recurrent Neural Network Transducer) RNN Transducer
•
基于联结时序分类
(CTC)
的声学模型不再需要对训练的音频序列和文本序列进行强制
对齐,实际上已经初步具备了端到端的声学模型建模能力。但是
CTC
模型进行声学建
模存在着两个严重的瓶颈,一是缺乏语言模型建模能力,不能整合语言模型进行联合
优化,二是不能建模模型输出之间的依赖关系。
RNN-Transducer
针对
CTC
的不足,
进行了改进,使得模型具有了端到端联合优化、具有语言建模能力、便于实现
Online
语音识别等突出的优点
,
更加适合语音任务。
https://blog.csdn.net/bbbeoy/article/details/108318480
学习参考:
• https://zhuanlan.zhihu.com/p/170475373
• https://gitee.com/mindspore/mindarmour
• https://mindspore.cn/mindarmour?version=/r1.5/
•
机密计算:指数据的
传输和计算过程
是机密的,其保护隐私的代价较大。
•
模型隐私保护:常用到的方法有如数据脱敏、差分隐私训练、模型加密、模型混淆等。
(差分隐私可以衡量和控制模型对训练数据的泄露)
•
联邦学习:通常是在
不共享数据
的情形下进行多方
联合机器学习
,本质上是一种数据
访问受限的分布式机器学习框架。计算节点间
只共享梯度
不共享原始数据。
美国人工智能战略与政策研究(
——
商汤智能产业报告)参考以下链接
•
https://www.federalregister.gov/documents/2019/02/14/2019-
02544/maintaining-american-leadership-in-artificial-intelligence
(14FEB2019)
https://www.nitrd.gov/nitrdgroups/images/c/c1/American-AI-Initiative-One-Year
Annual-Report.pdf
竞争法案 :
https://www.congress.gov/bill/117th-congress/senate-bill/1260
http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
数字政府:智慧城市、智慧政务、智慧应急、阳光厨房、智慧水利
……
譬如阳光厨房,
通过
AI
机器视觉识别餐盘上食物类别、核算出价格,卡路里等。通过智慧水利水务解
决
1
、黑水治理、排污监测(
AI
视频算法排污识别,卫星遥感监测,水泵水闸调度)
2
、
水库(四无增强视频,智能供电,“三免”水情一体化杆站)
3
、河胡(光谱水质分
析,
5G
接入无人机
/
船)
•
智慧矿山:井下
5G
,安全监测,违规检测等
•
智慧交通:机场(
IOC
排队管理
——
感知旅客超长排队等待:
AI+
视频分析,机位调
度:运筹优化
AI
算法
+
大数据
+IOT+GIS+
视频
+
仿真
……
),公路(全息路口,无人驾
驶
……
)
核心主要是在:可信
AI
,
AI
理论发展,
AI
应用发展,隐私保护,基础算力发展
……
ABCD