努力是为了不平庸~
学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。
目录
一、简介与应该明确的学习方法
1、学习方法
2、简介
二、学习机器学习的优势
三、机器学习的内核
1、学习术语
2、内核
四、机器学习的类别
五、机器学习的重要分支
六、深度学习的新热点
1、强化学习
2、强化学习和普通机器学习的差异
3、强化学习和监督学习的差异
七、机器学习的两大应用场景
1、回归
2、分类
一、简介与应该明确的学习方法
1、学习方法
在这类技术性的学习中,应该以“实践出真知”的心态去学习,不一味的停留在纸上。
2、简介
人工智能,即AI, 可以说成是把人类完成的智力任务自动化完成。而我们学习的机器学习是AI的分支技术,深度学习是机器学习的技术之一。人工智能、机器学习、深度学习是一种包含和被包含的关系。可达性和实用性才是机器学习和深度学习的真正价值。
二、学习机器学习的优势
1、机器学习中的数学公式重在理解而不是推导。所以就入门阶段而言,需要一点数学基础,但是总的来说对数学要求并不高。
2、学习机器学习学习的是各种模型、算法,重要的是模型的选择、整合、参数的调试。主要考验的是我们的逻辑分析与判断能力。有的人甚至把机器学习模型的过程比作搭积木。AI业界的分享精神使得很多实用的机器学习和深度学习的框架、库函数涌现出来,有很多东西我们都可以比对着学习,所以机器学习并不以编程水平和数学水平论高低。
三、机器学习的内核
1、学习术语
自变量x,在机器学习中叫做特征(feature),因变量y,在机器学习中叫做标签(label)
用于训练的数据集叫做训练数据集(training dataset),用来测试的数据集叫做测试数据集(test dataset)
2、内核
机器学习,就是在给出的已知数据集的基础上,反复进行计算,选择最贴切的函数描绘出自变量和因变量之间的关系。
也就是说坐标轴上的函数图像是已知的,我们甚至知道某一个点具体的坐标,我们现在要做的就是找出最贴近已知曲线的函数曲线,找到这一个函数。在我们生活中,我们往往完成的是通过给定的数据和规则推导出问题的答案;而现在机器需要做的是通过给定的数据和答案来推导出规则。
所谓机器学习,就是统计建模的过程。做出的机器学习模型越精准,对未来的预测也越准确。
四、机器学习的类别
机器学习类别很多,最常见的分类为监督学习、无监督学习、半监督学习。
简单来说,半监督学习就是监督学习和无监督学习结合起来,目的是为了解决有些时候标签数据成本太高的问题。
五、机器学习的重要分支
深度学习(deep learning),根据机器学习的或者训练机器时所采用的算法进行分类。监督学习和无监督学习的着眼点在于数据即问题本身,而传统机器学习和深度学习之间的区别在于是否着眼于解决问题的方法。
深度学习所采用的机器学习模型不同之处在于神经网络。人工神经网络(Artificial Neural Network,ANN) ,是数据结构和算法形成的机器学习模型,由大量的人工神经元相互联结组成,这些神经元都具有可以调整的参数,可以实现监督学习或者无监督学习。
我们把层数较多、结构比较复杂的神经网络的机器学习技术叫做深度学习。
神经网络本质上与其他机器学习方法一样,也是统计学方法的一种应用,只是其结构更深、参数更多。
深度学习的一大好处是对数据特征的要求降低了,自动地实现非结构化数据的结构化,无须手工获取特征,减少特征工程。简单来说,数据结构化就是把数据变得让计算机能够轻易识别。这个数据我们看起来可能很无厘头,但是对计算机却很友好,就像一串二进制数,计算机能轻松阅读但是人却不行。
所以说,深度学习的巨大优势就是减少了手工进行的特征工程任务。
六、深度学习的新热点
1、强化学习
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,是机器学习中很抢眼的一个热点,其研究目标是智能体(agent)如何基于环境而做出行动反应,以取得最大化的积累奖励。
2、强化学习和普通机器学习的差异
普通机器学习是在开放的环境中学习,新数据是永无止境的。
强化学习的环境是封闭的,就像下棋一样,每下一个棋子,棋盘中的空位就少了一个,棋盘永远不会增大或减小。在这样的封闭环境中,就很容易对机器刚才所采取的策略进行“奖惩”。
3、强化学习和监督学习的差异
监督学习是从数据中进行学习;强化学习是从环境给出的奖惩中进行学习。监督学习中数据的标签就是答案,有明确的对错;强化学习在受到惩罚(错了,比如下棋输了),没有标准答案可以参考,它只能自己思考。所以强化学习要求其智能更强,使得它能有广阔的思路。强化学习不一定每次选择都是最优解,但是它可以在探索未知的时候利用已知知识找到平衡。
七、机器学习的两大应用场景
1、回归
回归问题通常用来预测一个值(房价),其标签值是连续的。比较常见的回归算法是线性回归算法(Linear Regression)及深度学习中的神经网络等。
2、分类
分类问题是将事物标记一个类别标签,结果为离散值,也就是类别中的一个选项。