本专栏是网易云课堂人工智能课程《神经网络与深度学习》的学习笔记,视频由网易云课堂与 deeplearning.ai 联合出品,主讲人是吴恩达 Andrew Ng 教授。刚兴趣的网友可以观看网易云课堂的视频进行深入学习,视频的链接如下:https://mooc.study.163.com/learn/2001281002
也欢迎对神经网络与深度学习感兴趣的网友一起交流 ~
目录
1. 什么是神经网络?
2. 神经网络的应用
3. 结构化数据与非结构化数据
1. 什么是神经网络?
电能曾经引起了无数工业变革,例如交通、生产、医疗保障、通讯等等。人工智能(AI)将会引发一场同样巨大的变革。
我们从房价预测的实例开始介绍什么是神经网络。
已知房屋的面积和房屋的价格,我们想要找到一个函数,根据房屋面积,预测房价。如果你懂得线性回归,你可以用这些数据先拟合一条直线,但由于价格不能为负数,所以需要让直线在前面进行弯折。
把这里的房价拟合函数,看成是一个最简单的神经网络。房屋的面积看作神经网络的输入 ,通过一个节点(上图中的圆圈),最后输出价格 。这里的小圆圈,就是一个独立的神经元。这个神经元做了两件事情:对输入面积进行线性运算,然后取不小于 0 的值,最后输出预测价格。
当你有房屋的其他特征,比如卧室的数量、邮政编码(体现步行化程度),以及富裕程度(体现学校的质量),这时候就可以构建一个更大的神经网络。
在更大规模的神经网络中,我们把单个神经元堆叠起来,中间的神经元与每个输入 都存在连接。中间的神经元代表某些中间特征,然后这些中间特征进一步计算得出价格 。
在神经网络训练之前,中间的神经元并没有代表实际的特征。在给定足够的训练样本的条件下,由神经网络自己产生中间节点,最终从输入 映射到输出 。
2. 神经网络的应用
事实上,到目前为止,几乎所有由神经网络创造的经济价值,都基于其中一种被称为“监督学习”的机器学习。监督学习可以用于实时预测、广告推送、图像识别、语音识别、机器翻译、自动驾驶等场景。
实时预测和广告推送可以用标准神经网络(Standard NN)实现;图像识别需要用到卷积神经网络(Convolutional NN);语音识别和机器翻译使用序列化的输入数据,因此需要用循环神经网络(Recurrent NN)实现;自动驾驶则需要使用定制化或者混合神经网络(Customed/Hyper NN)。
经过监督学习的神经网络,可以作为一个组件,嵌入到更大型的系统中,比如无人驾驶。
3. 结构化数据与非结构化数据
结构化数据中每个数据都有明确的定义,例如房屋的大小,卧室的数量,用户的年龄等。而非结构化数据指音频、图像或者文本这类数据,图像中的每个像素、文本中的每个词,直接作为输入。
计算机擅长处理结构化数据,而人类更擅长理解非结构化数据。有了深度学习与神经网络,计算机现在可以更好地理解非结构化数据,例如识别图像中的物体,或者识别文本的含义。