这篇文章对机器学习、深度学习、自然语言处理进行了简单的介绍,适合快速学习NLP与AI、ML和DL的关系。
机器学习、深度学习、自然语言处理的关系
机器学习、深度学习、自然语言处理的关系如图所示
1 机器学习(Machine Learning)
机器学习是在没有明确指令的情况下,学习如何在示例(又叫做“training data”,即训练集)上执行任务。这是通过创建训练数据的数字表示(即feature,特征值)并使用此表示来学习这些示例中的模式来完成的。机器学习被分为监督学习、无监督学习和强化学习。
1.1 监督学习(Supervised Learning)
监督学习在训练集上学习从输入到输出的映射方法,训练集的模式为input-output对子。outputs一般被称为labels或者ground truth。
在自然语言处理中,甄别垃圾邮件是使用监督学习的典型例子。
1.2 无监督学习 (Ubsupervised Learning)
无监督学习是通过机器学习方法从数据集中寻找的隐藏的模式,无监督学习没有可供参考的输出集,它试图从输入集中找出数据的规律,发现新的知识。
在自然语言处理中,主题建模(Topic Modeling)是使用无监督学习的典型例子,它从大量的文本中提取主题。
1.3 强化学习 (Reinforcement Learning)
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。
强化学习一般用于下棋、自动车辆或者机器人。
深度学习
深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。