【2022吴恩达机器学习课程视频翻译笔记】2.2监督学习-part-2

news2025/1/4 20:27:39

B站上面那个翻译我有点看不懂,打算自己啃英文翻译了(有自己意译的部分),然后懒得做字幕,就丢在博客上面了,2.2之前的章节结合那个机翻字幕能看懂

2.2监督学习-part-2

So supervised learning algorithms learn to predict input, output or X to Y mapping. And in the last video you saw that regression algorithms, which is a type of supervised learning algorithm learns to predict numbers out of infinitely many possible numbers. There’s a second major type of supervised learning algorithm called a classification algorithm. Let’s take a look at what this means.
监督学习算法能够学习预测输入到输出或者X到Y的映射关系。在上一个视频中你看到的是回归算法,它是一种从无数个可能的数字中预测一个数字的监督学习算法。还有第二种主要类型的监督学习算法,它叫做分类算法。让我们看看分类算法是什么意思。

Take breast cancer detection as an example of a classification problem. Say you’re building a machine learning system so that doctors can have a diagnostic tool to detect breast cancer. This is important because early detection could potentially save a patient’s life.
举一个分类问题的例子:乳腺癌检测。假设你正在构建一个机器学习系统使得医生们能够拥有一个诊断工具去检测乳腺癌。这非常重要,因为早期检测有可能拯救病人的生命。

Using a patient’s medical records your machine learning system tries to figure out if a tumor that is a lump is malignant meaning cancerous or dangerous. Or if that tumor, that lump is benign, meaning that it’s just a lump that isn’t cancerous and isn’t that dangerous? Some of my friends have actually been working on this specific problem.
你的机器学习系统通过利用患者的医疗记录(病例)试图计算出当前患者的肿瘤是否是恶性肿瘤,也就是会癌变或者危及生命的。或者,判断那个肿块是否良性,也就是说它只是一个无害的肿块,不是癌性,也不太危险。我有一些朋友实际上一直在研究这个具体的问题。

So maybe your dataset has tumors of various sizes.
And these tumors are labeled as either benign, which I will designate in this example with a 0, or malignant, which will designate in this example with a 1. You can then plot your data on a graph like this where the horizontal axis represents the size of the tumor and the vertical axis takes on only two values 0 or 1 depending on whether the tumor is benign, 0 or malignant 1.
所以,也许你的数据集中有各种大小的肿瘤。在这个例子中,我们用0表示标记为良性的肿瘤,用1表示表示恶行肿瘤。然后,你可以将数据绘制成这样的图表,在这个图表中,横轴代表肿瘤的大小,纵轴只有两个取值,0或者1,即0代表良性,1代表恶性。

One reason that this is different from regression is that we’re trying to predict only a small number of possible outputs or categories. In this case two possible outputs 0 or 1, benign or malignant. This is different from regression which tries to predict any number, all of the infinitely many number of possible numbers.
与回归算法不同的是,在分类算法中,我们试图预测一小部分可能的输出或者类别。在这个例子中,只可能有两个类别(输出),即0或者1,亦即良性或者恶性。在这一点上,分类算法与回归算法完全不同,回归算法试图从无数个可能的数字中预测出一个数字。

And so the fact that there are only two possible outputs is what makes this classification. Because there are only two possible outputs or two possible categories in this example, you can also plot this data set on a line like this.
正因为在这个例子中只有两种可能的输出结果,所以这是一个分类问题。因为在这个例子中只有两个可能的输出结果或者说只有两种可能的类别,所以你可以可以像这样把数据画在一条线上。

Right now, I’m going to use two different symbols to denote the category using a circle an O to denote the benign examples and a cross to denote the malignant examples. And if new patients walks in for a diagnosis and they have a lump that is this size, then the question is, will your system classify this tumor as benign or malignant?
现在,我将使用两个不同的符合去标记类别,使用圆圈O表示良性案例,使用X代表恶性案例。如果新的病人们走进来寻求医学诊断并且他们有一个这个大小的肿块,那么问题是,你的系统会将这个肿瘤分类为良性还是恶性?

It turns out that in classification problems you can also have more than two possible output categories. Maybe you’re learning algorithm can output multiple types of cancer diagnosis if it turns out to be malignant. So let’s call two different types of cancer type 1 and type 2.
实际上,在分类问题中,可能的输出类别数是可以多于2个的。如果检测的结果是恶性,也许你的学习算法能够输出多种类型的癌症诊断。那么我们将不同的癌症类型称为类型1和类型2。

In this case the average would have three possible output categories it could predict. And by the way in classification, the terms output classes and output categories are often used interchangeably. So what I say class or category when referring to the output, it means the same thing.
在这种情况下就有了三个可以预测的类别。顺便说一下,在分类问题中,术语"output classes"和"output categories"(中文只有一个意思,就是输出类别)经常可以互换使用。所以当我提到上面两个单词的时候,它们表示一个意思。

So to summarize classification algorithms predict categories. Categories don’t have to be numbers. It could be non numeric for example, it can predict whether a picture is that of a cat or a dog. And it can predict if a tumor is benign or malignant. Categories can also be numbers like 0, 1 or 0, 1, 2. But what makes classification different from regression when you’re interpreting the numbers is that classification predicts a small finite limited set of possible output categories such as 0, 1 and 2 but not all possible numbers in between like 0.5 or 1.7.
所以,总结一下,分类算法用于预测类别。类别不一定是数字,可以是非数值的,例如,它可以预测一张图片的内容是猫还是狗。它也可以预测一个肿瘤是良性还是恶性。类别也可以是数字,比如0、1或者0、1、2。但分类问题与回归问题的不同之处在于,当你解释这些数字时,分类问题预测的是一组有限的可能输出类别,比如0、1和2,而不是介于之间的所有可能数字,如0.5或1.7

In the example of supervised learning that we’ve been looking at, we had only one input value the size of the tumor. But you can also use more than one input value to predict an output. Here’s an example, instead of just knowing the tumor size, say you also have each patient’s age in years.
在我们一直在研究的有监督学习示例中,只有一个输入值,即肿瘤的大小。但你也可以使用多个输入值来预测一个输出值。这里有一个例子,除了知道肿瘤的大小之外,假设你还知道每个患者的年龄,以年为单位。

Your new data set now has two inputs, age and tumor size. What in this new dataset we’re going to use circles to show patients whose tumors are benign and crosses to show the patients with a tumor that was malignant. So when a new patient comes in, the doctor can measure the patient’s tumor size and also record the patient’s age.
你的新数据集现在有两个输入值,即年龄和肿瘤大小。在这个新数据集中,我们将使用O表示肿瘤为良性的患者,使用X表示肿瘤为恶性的患者。因此,当一个新的患者来就诊时,医生可以测量患者的肿瘤大小并记录患者的年龄。

And so given this, how can we predict if this patient’s tumor is benign or malignant? Well, given the day said like this, what the learning algorithm might do is find some boundary that separates out the malignant tumors from the benign ones. So the learning algorithm has to decide how to fit a boundary line through this data. The boundary line found by the learning algorithm would help the doctor with the diagnosis.
根据上文,我们如何预测患者的肿瘤是恶性还是良性呢?根据之前所说的,学习算法可能会找到一些界限来区分恶性肿瘤和良性肿瘤。因此,学习算法需要决定如何通过这些数据拟合一个界限线。学习算法所找到的界限线将会帮助医生进行诊断。

In this case the tumor is more likely to be benign. From this example we have seen how to inputs the patient’s age and tumor size can be used. In other machine learning problems often many more input values are required. My friends who worked on breast cancer detection use many additional inputs, like the thickness of the tumor clump, uniformity of the cell size, uniformity of the cell shape and so on. So to recap supervised learning maps input x to output y, where the learning algorithm learns from the quote right answers.
在这个例子里,病人的肿瘤可能是良性的。通过这个例子,我们看到了如何使用患者的年龄和肿瘤大小这两个输入值。在其他机器学习问题中,通常需要更多的输入值。我有些朋友从事乳腺癌检测的研究,他们使用了很多额外的输入值,比如肿瘤团块的厚度、细胞大小的一致性、细胞形状的一致性等等。所以,回顾一下,监督学习将输入x映射到输出y,学习算法会从引用的正确答案(也就是提供给监督学习算法的示例,先提供包含输入x和正确的输出y的案例,监督算法才能学习)中学习。

The two major types of supervised learning our regression and classification. In a regression application like predicting prices of houses, the learning algorithm has to predict numbers from infinitely many possible output numbers. Whereas in classification the learning algorithm has to make a prediction of a category, all of a small set of possible outputs.
监督学习主要分为两类,即回归和分类。在回归算法的应用中,比如房价预测, 学习算法必须从无数个可能的输出结果的数字中预测数值。而在分类算法中,学习算法需要预测类别,分类算法输出的预测类别是极小的,是有限的。

So you now know what is supervised learning, including both regression and classification. I hope you’re having fun. Next there’s a second major type of machine learning called unsupervised learning. Let’s go on to the next video to see what that is.
现在你已经了解了监督学习的内容,包括回归和分类。希望你觉得很有趣。接下来,还有第二个主要类型的机器学习,称为无监督学习。让我们继续下一个视频,看看无监督学习是什么。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/694783.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【qiankun】前端微服务架构踩坑记录

目录 前言 1.Cannot GET /cooperation/board 场景: 分析 解决 2.Invalid options in vue.config.js:"css.requireModuleExtension" is not allowed 原因 解决 3.less版本升级导致除法写法未转换 原因 解决 4.主子应用样式隔离 场景 解决 5…

HOT23-反转链表

leetcode原题链接:反转链表 题目描述 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1]示例 2: 输入:head [1,2] 输…

Spring Boot 中的缓存注解

Spring Boot 中的缓存注解 在 Spring Boot 中,缓存是一个非常重要的话题。当我们需要频繁读取一些数据时,为了提高性能,可以将这些数据缓存起来,避免每次都从数据库中读取。为了实现缓存,Spring Boot 提供了一些缓存注…

电脑大文件夹怎么加密?大文件夹方法介绍

当我们把电脑中的各种数据分类存放在文件夹中时,可以方便我们使用和管理。但这些文件夹也会变得十分庞大,如果想要加密它们,就需要使用更快速、安全的方法。下面我们来了解一下电脑大文件夹的加密方法。 文件夹加密超级大师 文件夹加密超级大…

享元模式的学习与使用

1、享元模式的学习 当我们需要创建大量相似的对象时,享元模式(Flyweight Pattern)可以提供一种有效的解决方案。享元模式旨在通过共享对象来最小化内存使用和提高性能。它将对象分为可共享的内部状态(Intrinsic State)…

websocket前端的连接与接收数据

什么是websocket 1, WebSocket是一种用于在客户端和服务器之间进行全双工通信的网络协议。它使得在单个TCP连接上可以进行双向通信,允许服务器主动地发送数据给客户端,同时客户端也可以向服务器发送数据。与传统的HTTP请求-响应模型不同,Web…

百度排名代发收录怎么上百度

百度排名代发收录怎么上百度,如何提高百度排名,网站提高排名最新手册!#seo 今天来点不一样的,就是讲一下百度竞价里边最基础也是最容易踩的一个坑,就是我发现很多人很喜欢把自己推广的产品或者说业务直接作为关键词上…

OpenAI 发布的新语音系统Whisper能力到底有多强?

OpenAI 最近发布了一个名为Whisper 的自动语音识别系统,声称其在英语语音识别方面已经接近人类水平的鲁棒性和准确性。这个系统使用了68万小时多任务监督数据来进行训练,并且在处理口音、背景噪音和技术语言等复杂场景时表现出了很好的鲁棒性。那么&…

s3 删除事故?

起因 一次巡检s3备份查看时, 一回车手滑,出现了下面这种画面,生产事故?!!! 现象 aws s3 rm s3://gfai-hk/upload.cmd 证实的确被删除了,推断后面的生产数据也被全删, 尝试用s3命令恢复发现需要该对象开启版本控制, rm被删除才有可能找回,否则永久删除于是尝试下面的命令 先…

跟着李沐学AI(动手学深度学习 PyTorch版)学习笔记——02深度学习介绍

1.课程安排大概共34天的课-(计划7月底看完,争取做到最少两天一更) 2.动手学深度学习课本教材 3.课程谈论坛 4.pytorch论坛 一、 目标 二、内容 三、 学习目标: 四、简单了解深度学习 深度学习: 图片分类物体的检测和…

华为OD机试真题 Python 实现【区间连接器】【2023Q1 200分】,附详细解题思路

一、题目描述 有一组区间 [a0, b0], [a1, b1], … (a, b 表示起点, 终点),区间有可能重叠、相邻,重叠或相邻则可以合并为更大的区间; 给定一组连接器[x1, x2, x3, …](x 表示连接器的最大可连接长度,即 x>gap&…

python网络编程笔记(一)

一:Socket简介 套接字起源于20世纪70年代加利福尼亚大学伯克利分校版本的Unix,即人们所说的BSD Unix。因此,有时人们也把套接字称为“伯克利套接字"或"BSD套接字”。一开始,套接字被设计用在同 -台主机上多个应用程序之间的通讯BSD Socket接口是TCP/IP网…

ArcMap发布arcgis sever缓存瓦片服务

1.全能电子地图下载瓦片地图 2.地图拼接 acrgis sever缓存瓦片 下载完成的文件目录 3.arcMap添加数据 连接本地文件 这一步有坑,一定要加载到瓦片最外层目录,否则看不到图层文件。 找到图层数据,点击添加 添加数据完成,开始发布服…

数字化和物联网的发展如何改变我们的生活方式?

数字化和物联网 (IoT) 的发展已经给我们的生活方式带来了重大变化,而且这些变革将在未来继续发生。以下是数字化和物联网影响我们生活的一些方式: 连接设备和智能家居:物联网使日常物品能够连接到互联网并相互通信。这种连通性允许创建智能家…

记录一次oracle报错IMP-00058: 遇到 ORACLE 错误 904 ORA-00904: “xxx“: 标识符无效

错误原因:导入的表中缺少DATASRC字段 解决方法:在要导入的表中加上DATASRC字段

对 React 状态管理的理解及方案对比

1、React 状态、通信 React 为什么需要状态管理 React 特点: 专注 view 层:专注 view 层 的特点决定了它不是一个全能框架,相比 angular 这种全能框架,React 功能较简单,单一。UIrender(data)UIrender(data)&#x…

Keras-深度学习-神经网络-人脸识别模型

目录 模型搭建 模型训练 模型搭建 ①导入所需的库,导入了 Keras 和其他必要的库,用于构建和处理图像数据。 from keras.models import Sequential from keras.layers import Dense, Flatten, Conv2D, MaxPooling2D import os from PIL import Image …

《C++高级编程》读书笔记(十二:利用模板编写泛型代码)

1、参考引用 C高级编程(第4版,C17标准)马克葛瑞格尔 2、建议先看《21天学通C》 这本书入门,笔记链接如下 21天学通C读书笔记(文章链接汇总) 1. 模板概述 模板将参数化的概念推进了一步,不仅允许…

用Python搭建监控平台详解

概要 监控和运维,是互联网工业链上非常重要的一环。监控的目的就是防患于未然。通过监控,我们能够及时了解到企业网络的运行状态。一旦出现安全隐患,你就可以及时预警,或者是以其他方式通知运维人员,让运维监控人员有时…

oracle 自定义类型(type)的用法

emp表数据如下所示 定义object类型 create or replace type typeof_userinfo_row as object(user_id varchar2(50),user_name varchar2(50) )创建函数并将此类型作为返回值类型 create or replace function FUN_TEST return typeof_userinfo_row isFunctionResult typeof_use…