文章目录
前言
概念
算法
训练
性能
应用
参考资料
前言
见《初试人工智能》
概念
人工智能系统(artifieial intelligence system),针对人类定义的给定目标,产生诸如内容、预测、推荐或决策等输出的一类工程系统。该工程系统使用人工智能相关的多种技术和方法,开发表征数据、知识,过程等的模型,用于执行任务。
人工智能加速处理器(artifieial intelligence aecelerating processor),以及人工智能加速芯片(artifieial intelligenee accelerating chip),具备适配人工智能算法的运算微架构,能够完成人工智能应用运算处理的集成电路元件。
人工智能集群(artifieial intelligence eluster),遵循统一控制的,人工智能计算功能单元的集合。人工智能计算功能单元,可包含人工智能加速处理器、人工智能服务器、人工智能加速模型等。当由人工智能服务器组成时,人工智能集群可称为人工智能服务器集群,其中的人工智能服务器可称为节点。
机器学习(machine learning),通过计算技术,优化模型参数的过程,使模型的行为反映数据或经验。
机器学习模型(machinelearning model),一种基于输人数据或信息生成推理或预测的计算结构。示例:如果一个单变量线性方程(y= ax+b),经由线性回归训练,则结果模型为y=3x+7。一个机器学习模型,是基于机器学习算法训练的结果。
机器学习系统(machine learning system),能运行或用于开发机器学习模型、算法和相关应用的软件系统。包含机器学习运行时组件、机器学习框架、机器学习服务组件、工具和运维管理。提供机器学习应用的开发、训练、部署、运行和管理能力。机器学习系统框架如下图:
深度学习(deep learning),以及深度神经网络学习(deep neural network learning),深度学习是机器学习的一个子集。
算法
机器学习算法(machinelearning aleorithm),依据给定的准则,根据数据确定机器学习模型参数的算法。示例:考虑求解一个单变最线性函数y=ax+b,上的参数a和b,其中y是输出或结果,x是输人,b是截距(x=0时y的值),a是权重。在机器学习中,确定线性函数的截距和权重的过程称为线性回归。
神经网络(artificial neural network),由一层或多层神经元组成的网络,通过权值可调的加权连接,接收输入数据并产生输出。神经网络是连接主义方法的一个突出例子。虽然神经网络的设计最初是受生物神经元功能的启发,但大多数神经网络的研究已不再遵循这种启发。
前馈神经网络(feedforward neural network,FFNN),一种神经网络,其中信息仅单向从输入层传送到输出层。
卷积神经网络(convolutional neural network,CNN),以及深度卷积神经网络(deep convolutional neural network,DCNN),一种前馈神经网络,在其至少一层中使用卷积。
循环神经网络(recurrentneuralnetwork;RNN),一种神经网络,其中前一层和前一处理步骤的输出,都被传送到当前层。
训练
模型训练(model training),利用训练数据,基于机器学习算法,确定或改进机器学习模型参数的过程。
有监督机器学习(supervised machine learning),仅用标注数据进行训练的机器学习。数据标注(data labelling),给数据样本指定目标变量和赋值的过程。
无监督机器学习(unsupervised machine learning),仅用无标注数据实施训练的机器学习。
半监督机器学习(semi-supervisedmachine learning),在训练过程中,能够同时使用标注数据和无标注数据进行训练的一种机器学习任务。
强化学习(reinforcement learning:RL),一种通过与环境交互,学习最佳行动序列,使回报最大化的机器学习方法。
通过训练具有许多隐层的神经网络,来创建丰富层次表示的方法。
迁移学习(transfer learning),一种将旨在解决一个问题的模型应用到不同问题上的方法。
生成式对抗网络(generative adversarial network,GAN),一种由单个或多个生成器网络,和判别器网络组成的神经网络架构,两个神经网络用相互博弈的方式进行学习。生成器依据真实样本创建具有代表性数据集的样本,判别器用来区分生成的样本与真实样本。
模型优化(model optimization),提升模型执行速度,泛化能力,或改善利益相关方所关心的其他特性的方法。如神经网络模型优化的方式包含剪枝、量化、调整参数、调整模型深度和宽度、增减特征或根据硬件平台具体特性重新安排聚合算子等。
迭代(iteration),针对一批样本,重复地执行系列步骤直至完成训练的过程。一个(训)期中的选代数量等于该期中,训练样本的批数
性能
欠拟合(underfitting),由于训练数据不足或不充分,导致创建的模型在面向新数据时,性能表现不佳或不准确。欠拟合可能会发生的情况:特征选择不当,训练时间不足,或者因模型能力有限(如表现力),使模型过于简单而无法从大量训练数据中学习。
过拟合(overfitting),机器学习创建的模型,过于精确地拟合训练数据,对新数据缺乏泛化性。过拟合可能由以下原因造成:训练的模型从训练数据中,学习了非必要的特征(如,对有用输出无效的特征),训练数据中过多的噪声(例如,过多的离群点),训练数据与生产数据分布的显著不匹配,或模型复杂度过高而与训练数据不匹配。当在训练数据测量的误差与在独立的测试及验证数据测量的误差,之间存在显著差异时,过拟合能被识别。当训练数据和生产数据之间存在严重不匹配时,过拟合模型的性能尤其会受到影响。
鲁棒性(robustness),人工智能系统在任何情况下都保持其性能水平的特性。
韧性(resilience),人工智能系统在事故后,在符合期望的时间段内,恢复可操作条件的特性。
安全性(Security),人工智能系统应具备任务的鉴别能力,屏蔽非法输入。应具备加密通信能力,保护隐私信息。应提供抵御对抗样本攻击和噪声污染的能力,抵御外部对权重文件的篡改。
应用
回归模型(regression model),以给定数值为输入,预期的输出为连续变量的机器学习模型。
分类模型(classification model),一种对给定输入数据,输出其所属的一个或多个类别的机器学习模型。
机器翻译(machine translation:MT),使用计算机系统,将文本或语音从一种自然语言,自动翻译为另一种自然语言。
模式识别(pattern recognition),通过功能单元,对某一对象物理或抽象的模式以及结构和配置的辨识。
情绪识别(emotion recognition),通过计算识别和分类一段文本、语音、视频或图像,以及它们的组合中表达情绪的任务。情绪的例子包括幸褔、悲伤、愤怒和喜悦。
参考资料
GB/T 41867-2022 信息技术 人工智能 术语
GB/T 43782-2024 人工智能 机器学习系统技术要求