作为近几年人工智能领域的主要研究方向之一,深度学习主要通过构建深度卷积神经网络和采用大量样本数据作为输入,最终得到-一个具有强大分析能力和识别能力的模型。深度学习可以是有监督的、半监督的或无监督的。深度学习架构(例如深度神经网络、深度信念网络、递归神经网络和卷积神经网络)已应用于计算机视觉、语音识别、自然语言处理、机器翻译等领域并取得初步成效。
随着深度学习的发展,了 解计算机编程语言以及掌握计算机组成原理等知识已成为必备技能。本书中的所有代码示例都是用Python编写的,因此读者需要有一定的 Python基础。此外,作者使用了TensorFlow 2.x框架,其中包含了Keras模型API。本书将详细介绍开创性深度学习模型的设计模式,并且将这些组件组合在一起, 以帮助读者深入理解深度学习模式。
本书的内容通俗易懂,对于从经典人工智能到狭义人工智能的进展以及机器学习的基本步骤均有介绍。希望本书的出版能为更多深度学习领域的从业者提供参考和借鉴。
在谷歌工作时,我的职责之一是指导软件工程师使用机器学习。对此,我已有很多经验,包括为私立编程学校和大学研究生创建在线教程、会议、研讨会展示、专题研讨会和课程作业,但我一直在寻找新的方法进行更有效的教学。
加入谷歌之前,我作为首席研究科学家在一家日本IT公司工作了20年,但从未从事过深度学习的工作。如今看到的几乎所有东西都是15年前我们在创新实验室里做的;不同的是,我们需要一个能容纳很多科学家的空间和庞大的预算。令人难以置信的是,经过深度学习,事情发生了飞速变化。
早在20世纪末,我就在使用小型结构化数据集,其中包含了来自世界各地的地理空间数据。同事们称我为数据科学家,但没人知道数据科学家到底是什么样的人。然后大数据出现了,但我不了解大数据工具和框架,为此不得不努力学习大数据背后的工具和概念。
之后机器学习出现在大数据集上,如线性/逻辑回归和CART分析。但自几十年前研究生毕业后,我就再也没有使用过统计学,因此不得不重新学习这门学科。紧接着深度学习出现了,我不知道神经网络的理论和框架,于是又开始努力学习深度学习的理论和其他框架。
节选自《深度学习模式与实践》译者序