本篇文章是博主在人工智能等领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对人工智能等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。
文章分类在学习摘录和笔记专栏:
学习摘录和笔记(2)---《人工智能的奥秘:机器学习的各大门派》
人工智能的奥秘:机器学习的各大门派
原文/论文出处:
题目:《人工智能的奥秘:机器学习各大门派华山论剑,谁能技高一筹,笑傲江湖?》
作者:朱利明
时间:2022-09-28 07:29
来源:发表于北京.
图灵奖得主,Meta人工智能负责人杨立昆(Yann LeCun)在2016年曾提出一个有名的蛋糕比喻:“如果智能是一块蛋糕,主体是自监督学习,表面的一糖霜是监督学习,点缀的樱桃是强化学习”
机器学习:
通过某种算法模型从数据中不断提升某种任务的性能的一种实现人工智能的方法,
更进一步,深度学习是使用神经网络模型从海量数据中进行学习的一种机器学习方式。
监督学习(Supervised Learning)
最常用的机器学习方式,它使用专家标注过的数据集来训练模型。
类似于:看图识字
无监督学习(Unsupervised Learning)
不需要对数据进行标注。无监督学习可以学习到数据本身蕴含的规律或者学到其内部表示方式,因此可以生成新的数据。准确度一般不如监督学习
自监督学习(Self-Supervised Learning)
用海量的未标注数据,通过数据本身包含的规律来对数据进行自动标注,从而把无监督学习转化成监督学习。
半监督学习(Semi-supervised learning)
综合使用监督学习和无监督学习的机器学习方式。它可以利用少量标注数据和大量未标注数据进行模型训练,因此又称为弱监督(weak-supervised)学习。
以上几种机器学习方式的区别主要在于训练数据集的标注数量。
监督学习是全部标注,半监督学习是少量标注,而无监督学习则完全无需标注,自监督学习则是从没有标注的数据中自己找出潜在的标注。
深度学习(Deep Learning)
强化学习(Reinforcement Learning)
不是从静态的数据集中学习,而是研究智能体如何在环境中做出最优连续决策(得到最大回报)
强化学习类似动物和人类通过和环境交互得到的奖励和惩罚来优化行为模式。
深度强化学习(Deep Reinforcement Learning)
强化学习和深度学习结合形成,在近几年已经取得了非常大的进展。
文章若有不当和不正确之处,还望理解与指出。由于部分文字、图片等来源于互联网,无法核实真实出处,如涉及相关争议,请联系博主删除。如有错误、疑问和侵权,欢迎评论留言联系作者,或者关注VX公众号:Rain21321,联系作者。