从翻译应用、商品推荐、医疗诊断到自动驾驶汽车,机器学习 (ML) 作为一种技术,都有用武之地。机器学习提供了一种解决问题、回答复杂问题以及创建新内容的新方式。机器学习可以预测天气、估算行程时间、推荐歌曲、自动补全句子、汇总文章以及生成全新的图片。
从根本上来讲,机器学习是对一种软件(称为模型)进行训练的过程,用于进行实用的预测或生成内容。例如,假设我们要创建一个应用来预测降雨。我们可以使用传统方法或机器学习方法。我们使用传统的方法,创建基于地球的物理特性的表面和地球表面,并计算大量的流体动力方程式。这非常困难。
使用机器学习模型,我们将为机器学习模型提供大量天气数据,直到机器学习模型最终学习了产生不同降雨量的天气模式之间的数学关系。然后,我们会为模型提供当前天气数据,并预测雨量。
机器学习系统根据学习进行预测或生成内容的方式,分为以下一个或多个类别:
- 监督式学习
- 非监督式学习
- 强化学习
- 生成式 AI
目录
1.监督式学习
1.1 回归
1.2 分类
2.非监督式学习
3.强化学习
4.生成式 AI
5.参考文献
1.监督式学习
监督式学习(Supervised learning)模型基于包含正确答案大量数据,可以发现数据中的元素与正确答案之间的关联(数学联系),从而进行预测。举个例子,一位学生通过学习带有参考答案的学习资料(如黄冈密卷😂)。当学生完成足够多的训练后,就能应对新考试。 这类机器学习系统是“监督式的”,因为人类会为机器学习系统提供已知正确的结果。监督式学习最常见的两种使用场景是回归和分类。
1.1 回归
回归模型可预测数值。例如,用于预测降雨量(以英寸或毫米为单位)的天气模型就是回归模型。如需查看回归模型的更多示例,请参阅下表:
场景 | 可能的输入数据 | 数值预测 |
---|---|---|
未来房价 | 平方英尺、邮政编码、卧室和浴室数量、停车场规模、抵押贷款利率、房产税率、建筑费用以及该区域内的待售住宅数量。 | 住宅的价格。 |
未来的行程时间 | 历史路况信息(从智能手机、交通传感器、约车及其他导航应用收集)、到目的地的距离以及天气状况。 | 到达目的地的时间(以分钟和秒为单位)。 |
1.2 分类
分类模型可预测某个内容属于某个类别的可能性。与回归模型(其输出为数字)不同,分类模型输出的值会指明某个内容是否属于特定类别。例如,分类模型用于预测电子邮件是否为垃圾邮件或图片是否包含鲜花。
分类模型分为两组:二元分类和多类分类。二元分类模型会从仅包含两个值的类输出值,例如,输出 “下雨”
或 “不下雨” 的模型。多类分类模型从包含两个以上值的类输出值,例如,可输出 “下雨”、“下雪”
、“冰雹”
或 “雨夹雪” 的模型。
2.非监督式学习
非监督式学习(Unsupervised learning)模型可基于不包含任何正确答案的数据进行预测。非监督式学习模型的目标是从数据中找出有意义的模式。换言之,模型对如何为每条数据进行分类没有提示,而是必须推断出自己的规则。最常用的非监督式学习模型采用一种称为聚类(Clustering)的技术。该模型会找出界定自然分组的数据点,如图1所示。
图 1. 将类似数据点聚类的机器学习模型。
图 2. 具有自然分界的聚类组。
聚类与分类不同,因为类别不是由人预先定义的。例如,非监督式模型可能会根据温度对天气数据集进行聚类,从而显式定义季节的细分类别。然后,你需要根据自己对数据集的了解来命名这些集群。
图 3. 一个机器学习模型,对类似的天气模式进行聚类。
图 4. 标记为雪、雨夹雪、下雨和无雨的天气模式集群。
3.强化学习
强化学习(Reinforcement learning)模型根据在环境中执行的操作获得奖励或处罚来进行预测。强化学习系统会生成一项政策,用于定义获得最多奖励的最佳策略。强化学习用于训练机器人执行任务,例如在房间内走动,以及训练 Go 游戏等软件程序。
4.生成式 AI
生成式 AI(Generative AI) 是一类基于用户输入创建内容的模型。例如,生成式 AI 可以构建新颖的图片、乐曲和笑话;它可以汇总文章、说明如何执行任务或编辑照片。
生成式 AI 可以接受各种输入并创建各种输出,例如文本、图像、音频和视频。此过程还可以创建各种输出的组合,例如,模型可以将图片作为输入,并创建图片和文本作为输出,或者将图片和文本作为输入,并创建视频作为输出。
我们可以按输入和输出(通常写为“输入类型”到“输出类型”)来讨论生成模型。例如,下面列出了生成模型的部分输入和输出:
- 文字转文字
- 文字转图片
- 文字转视频
- 文本到代码
- 文本转语音
- 图片和文字转图片
下表列出了生成模型的示例、输入模型及其可能的输出示例:
模型 | 输入 | 输出示例 |
---|---|---|
文字转文字 | 谁发明了 Le Mans 比赛? | Le Mans 由 1906 年成立的汽车俱乐部 (ACO) 成立,为期 24 小时。首场比赛于 1923 年 5 月 26 日至 5 月 27 日在萨尔特赛道 (Sarthe Circuit) 举行,该赛道位于法国勒曼镇附近,全长 13.426 公里(8.345 英里)。 此比赛最初旨在宣传 ACO 和萨特地区。 |
文字转图片 | 一个外星章鱼漂浮在门户网站上看报纸。 |
|
文字转视频 | 一张逼真的泰迪熊在旧金山的海洋中游泳。 泰迪熊落在水下。泰迪熊和五颜六色的鱼不断在水下游泳。熊猫在水中游动。 |
|
文本到代码 | 编写 Python 循环以遍历数字列表并输出质数。 | for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) |
图片转文字 |
| 火烈鸟的景象。位于加勒比地区。 |
生成式 AI 的工作原理是什么?概括来讲,生成模型会学习数据中的模式,以生成全新但类似的数据。生成模型如下所示:
- 学习通过观察他人的行为和说话方式来模仿他人的喜剧演员
- 学习特定风格的绘画,以便绘制特定风格的绘画
- 翻唱乐队,听一听特定乐队的音乐,学习特定乐队的声音
为了生成独特且有创意的输出,生成模型最初是使用无监督方法进行训练的,其中,模型会学习模仿要训练的数据。有时,系统会通过监督或强化学习来学习与模型可能要求执行的任务相关的特定数据(例如,总结文章或修改照片)来进一步训练模型。
生成式 AI 是一项发展迅速的技术,经常有新的用例被发现。例如,生成模型通过自动移除分散注意力的背景或提高低分辨率图片的质量,帮助企业优化其电子商务产品图片。
5.参考文献
本文部分内容翻译自 监督式学习((https://developers.google.cn/machine-learning/intro-to-ml/what-is-ml),感兴趣的读者可以查看原文。