【2022吴恩达机器学习课程视频翻译笔记】2.3监督学习-part-2

news2024/10/5 18:28:19

B站上面那个翻译我有点看不懂,打算自己啃英文翻译了(有自己意译的部分),然后懒得做字幕,就丢在博客上面了,2.2之前的章节结合那个机翻字幕能看懂

2.3监督学习-part-2

So supervised learning algorithms learn to predict input, output or X to Y mapping. And in the last video you saw that regression algorithms, which is a type of supervised learning algorithm learns to predict numbers out of infinitely many possible numbers. There’s a second major type of supervised learning algorithm called a classification algorithm. Let’s take a look at what this means.
监督学习算法能够学习预测输入到输出或者X到Y的映射关系。在上一个视频中你看到的是回归算法,它是一种从无数个可能的数字中预测一个数字的监督学习算法。还有第二种主要类型的监督学习算法,它叫做分类算法。让我们看看分类算法是什么意思。

Take breast cancer detection as an example of a classification problem. Say you’re building a machine learning system so that doctors can have a diagnostic tool to detect breast cancer. This is important because early detection could potentially save a patient’s life.
举一个分类问题的例子:乳腺癌检测。假设你正在构建一个机器学习系统使得医生们能够拥有一个诊断工具去检测乳腺癌。这非常重要,因为早期检测有可能拯救病人的生命。

Using a patient’s medical records your machine learning system tries to figure out if a tumor that is a lump is malignant meaning cancerous or dangerous. Or if that tumor, that lump is benign, meaning that it’s just a lump that isn’t cancerous and isn’t that dangerous? Some of my friends have actually been working on this specific problem.
你的机器学习系统通过利用患者的医疗记录(病例)试图计算出当前患者的肿瘤是否是恶性肿瘤,也就是会癌变或者危及生命的。或者,判断那个肿块是否良性,也就是说它只是一个无害的肿块,不是癌性,也不太危险。我有一些朋友实际上一直在研究这个具体的问题。

So maybe your dataset has tumors of various sizes.
And these tumors are labeled as either benign, which I will designate in this example with a 0, or malignant, which will designate in this example with a 1. You can then plot your data on a graph like this where the horizontal axis represents the size of the tumor and the vertical axis takes on only two values 0 or 1 depending on whether the tumor is benign, 0 or malignant 1.
所以,也许你的数据集中有各种大小的肿瘤。在这个例子中,我们用0表示标记为良性的肿瘤,用1表示表示恶行肿瘤。然后,你可以将数据绘制成这样的图表,在这个图表中,横轴代表肿瘤的大小,纵轴只有两个取值,0或者1,即0代表良性,1代表恶性。

One reason that this is different from regression is that we’re trying to predict only a small number of possible outputs or categories. In this case two possible outputs 0 or 1, benign or malignant. This is different from regression which tries to predict any number, all of the infinitely many number of possible numbers.
与回归算法不同的是,在分类算法中,我们试图预测一小部分可能的输出或者类别。在这个例子中,只可能有两个类别(输出),即0或者1,亦即良性或者恶性。在这一点上,分类算法与回归算法完全不同,回归算法试图从无数个可能的数字中预测出一个数字。

And so the fact that there are only two possible outputs is what makes this classification. Because there are only two possible outputs or two possible categories in this example, you can also plot this data set on a line like this.
正因为在这个例子中只有两种可能的输出结果,所以这是一个分类问题。因为在这个例子中只有两个可能的输出结果或者说只有两种可能的类别,所以你可以可以像这样把数据画在一条线上。

Right now, I’m going to use two different symbols to denote the category using a circle an O to denote the benign examples and a cross to denote the malignant examples. And if new patients walks in for a diagnosis and they have a lump that is this size, then the question is, will your system classify this tumor as benign or malignant?
现在,我将使用两个不同的符合去标记类别,使用圆圈O表示良性案例,使用X代表恶性案例。如果新的病人们走进来寻求医学诊断并且他们有一个这个大小的肿块,那么问题是,你的系统会将这个肿瘤分类为良性还是恶性?

It turns out that in classification problems you can also have more than two possible output categories. Maybe you’re learning algorithm can output multiple types of cancer diagnosis if it turns out to be malignant. So let’s call two different types of cancer type 1 and type 2.
实际上,在分类问题中,可能的输出类别数是可以多于2个的。如果检测的结果是恶性,也许你的学习算法能够输出多种类型的癌症诊断。那么我们将不同的癌症类型称为类型1和类型2。

In this case the average would have three possible output categories it could predict. And by the way in classification, the terms output classes and output categories are often used interchangeably. So what I say class or category when referring to the output, it means the same thing.
在这种情况下就有了三个可以预测的类别。顺便说一下,在分类问题中,术语"output classes"和"output categories"(中文只有一个意思,就是输出类别)经常可以互换使用。所以当我提到上面两个单词的时候,它们表示一个意思。

So to summarize classification algorithms predict categories. Categories don’t have to be numbers. It could be non numeric for example, it can predict whether a picture is that of a cat or a dog. And it can predict if a tumor is benign or malignant. Categories can also be numbers like 0, 1 or 0, 1, 2. But what makes classification different from regression when you’re interpreting the numbers is that classification predicts a small finite limited set of possible output categories such as 0, 1 and 2 but not all possible numbers in between like 0.5 or 1.7.
所以,总结一下,分类算法用于预测类别。类别不一定是数字,可以是非数值的,例如,它可以预测一张图片的内容是猫还是狗。它也可以预测一个肿瘤是良性还是恶性。类别也可以是数字,比如0、1或者0、1、2。但分类问题与回归问题的不同之处在于,当你解释这些数字时,分类问题预测的是一组有限的可能输出类别,比如0、1和2,而不是介于之间的所有可能数字,如0.5或1.7

In the example of supervised learning that we’ve been looking at, we had only one input value the size of the tumor. But you can also use more than one input value to predict an output. Here’s an example, instead of just knowing the tumor size, say you also have each patient’s age in years.
在我们一直在研究的有监督学习示例中,只有一个输入值,即肿瘤的大小。但你也可以使用多个输入值来预测一个输出值。这里有一个例子,除了知道肿瘤的大小之外,假设你还知道每个患者的年龄,以年为单位。

Your new data set now has two inputs, age and tumor size. What in this new dataset we’re going to use circles to show patients whose tumors are benign and crosses to show the patients with a tumor that was malignant. So when a new patient comes in, the doctor can measure the patient’s tumor size and also record the patient’s age.
你的新数据集现在有两个输入值,即年龄和肿瘤大小。在这个新数据集中,我们将使用O表示肿瘤为良性的患者,使用X表示肿瘤为恶性的患者。因此,当一个新的患者来就诊时,医生可以测量患者的肿瘤大小并记录患者的年龄。

And so given this, how can we predict if this patient’s tumor is benign or malignant? Well, given the day said like this, what the learning algorithm might do is find some boundary that separates out the malignant tumors from the benign ones. So the learning algorithm has to decide how to fit a boundary line through this data. The boundary line found by the learning algorithm would help the doctor with the diagnosis.
根据上文,我们如何预测患者的肿瘤是恶性还是良性呢?根据之前所说的,学习算法可能会找到一些界限来区分恶性肿瘤和良性肿瘤。因此,学习算法需要决定如何通过这些数据拟合一个界限线。学习算法所找到的界限线将会帮助医生进行诊断。

In this case the tumor is more likely to be benign. From this example we have seen how to inputs the patient’s age and tumor size can be used. In other machine learning problems often many more input values are required. My friends who worked on breast cancer detection use many additional inputs, like the thickness of the tumor clump, uniformity of the cell size, uniformity of the cell shape and so on. So to recap supervised learning maps input x to output y, where the learning algorithm learns from the quote right answers.
在这个例子里,病人的肿瘤可能是良性的。通过这个例子,我们看到了如何使用患者的年龄和肿瘤大小这两个输入值。在其他机器学习问题中,通常需要更多的输入值。我有些朋友从事乳腺癌检测的研究,他们使用了很多额外的输入值,比如肿瘤团块的厚度、细胞大小的一致性、细胞形状的一致性等等。所以,回顾一下,监督学习将输入x映射到输出y,学习算法会从引用的正确答案(也就是提供给监督学习算法的示例,先提供包含输入x和正确的输出y的案例,监督算法才能学习)中学习。

The two major types of supervised learning our regression and classification. In a regression application like predicting prices of houses, the learning algorithm has to predict numbers from infinitely many possible output numbers. Whereas in classification the learning algorithm has to make a prediction of a category, all of a small set of possible outputs.
监督学习主要分为两类,即回归和分类。在回归算法的应用中,比如房价预测, 学习算法必须从无数个可能的输出结果的数字中预测数值。而在分类算法中,学习算法需要预测类别,分类算法输出的预测类别是极小的,是有限的。

So you now know what is supervised learning, including both regression and classification. I hope you’re having fun. Next there’s a second major type of machine learning called unsupervised learning. Let’s go on to the next video to see what that is.
现在你已经了解了监督学习的内容,包括回归和分类。希望你觉得很有趣。接下来,还有第二个主要类型的机器学习,称为无监督学习。让我们继续下一个视频,看看无监督学习是什么。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/698911.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux vs MacOS ,你更喜欢哪个系统?

大家应该都知道Windows,Linux和MacOS这几个操作系统,它们各有优缺点,比如像游戏等专门的领域,Windows当然是比Linux更好些,但Linux是开源的,安全性和稳定性要比Windows要好,如果是关于视频编辑方…

蓝绿发布、灰度发布和滚动发布

当涉及到软件发布时,金丝雀发布(灰度发布)、滚动发布和蓝绿发布是常见的策略。它们各自有自己的优缺点、区别和特点。本文将简单介绍: 金丝雀发布(Canary Release) 金丝雀发布有一个有趣的小故事&#xff…

【算法】最长公共子序列编辑距离

文章目录 最长公共子序列(LCS)编辑距离(Edit Distance)总结相关题目练习583. 两个字符串的删除操作 https://leetcode.cn/problems/delete-operation-for-two-strings/712. 两个字符串的最小ASCII删除和 https://leetcode.cn/prob…

破解 Linux 文件安放之谜:哪里才是绝佳文件归宿?

想象一下,你盯着 Linux 中一大堆晦涩难懂的目录名。你想知道应该把特定类型的文件放在哪里。于是把文件随意放进了 /usr/share,希望这样做是正确的。 几天后,你发现应该把它放在 /var/local。 我们都有过类似的经历。Linux 的目录结构可能非…

如何在 AlmaLinux 上安装 Cockpit

Cockpit 是一个管理平台,允许管理员使用远程管理器轻松管理和控制他们的 GUI 或 CLI Linux 服务器系统。浏览器。驾驶舱可通过 Web 浏览器访问,其仪表板可让您查看服务器的健康状况以及其他系统统计数据,例如网络使用情况、磁盘空间和利用率、…

FPGA-DFPGL22学习3-调试手段

文章目录 前言一、调试前瞻二、Fabric Inserter 使用步骤1、选择探针2、开启调试 总结 前言 和原子哥一起学习FPGA 开发环境:正点原子 ATK-DFPGL22G 开发板 参考书籍: 《ATK-DFPGL22G之FPGA开发指南_V1.1.pdf》 个人学习笔记,欢迎讨论 一…

JVM调优相关

1.jvm中的一些工具 1.1 jps jps 用于查看java进程运行情况,输出JVM中运行的进程状态信息 命令行参数如下: -m 输出传入main方法的参数 -l 输出main类或Jar的全限名 -v 输出传入JVM的参数 如上,bootstrap 就是tomcat进程,调用…

C# ref / out 用法

目录 一、简介 二、ref 关键字 案例 注意点1 注意点2 三、out 关键字 案例 注意点1 注意点2 四、ref 和 out 关键字的相同点 五、ref 和 out 关键字的不同点 结束 一、简介 在C#中,ref和out关键字用于参数传递的方式。它们允许在方法内部对参数进行修改…

【无标题】宋词节选与中英对照

(https://img-blog.csdnimg.cn/03a0e9fdc924401fa7ab82d42a5b8dcc.jpg)

【剑指offer刷题记录 java版】链表双指针

本系列文章记录labuladong的算法小抄中剑指offer题目 【剑指offer刷题记录 java版】链表双指针 剑指 Offer II 025. 链表中的两数相加剑指 Offer 25. 合并两个排序的链表剑指 Offer 52. 两个链表的第⼀个公共节点剑指 Offer II 021. 删除链表的倒数第 n 个结点剑指 Offer II 02…

qt event事件处理

qt事件处理 qt事件处理比较恶心,各个事件都是独立的。如果同一时间出现多个事件,某些事件在qt中接收不到。 可以参考qtbase源码事件处理部分,所有的事件都在switch…case中处理,所以一次循环只会处理一个事件。 主窗口中可以通过…

【Rust 基础篇】Rust引用详解

文章目录 引言一、什么是引用?二、不可变引用三、可变引用四、引用的规则五、引用的使用建议六、示例代码总结 引言 在Rust中,引用是一种轻量级的指向数据的方式,它允许我们在不获取所有权的情况下访问和操作数据。引用是Rust中处理借用操作…

PostgreSql 逻辑结构

Database Cluser: 数据库集簇,一套服务器上安装部署完成的一套PostgreSql。在其中可创建数据库(Database)、用户(User)。User: 数据库用户,用来连接访问数据库,可通过权限管理,控制其…

360手机刷机 360手机Magisk面具安装与使用教程

360手机刷机 360手机Magisk面具安装与使用教程 参考:360手机-360刷机360刷机包twrp、root 360刷机包360手机刷机:360rom.github.io 【前序】 360手机通过Twrp,即可刷写Magisk文件;刷写成功后,即可获得root权限&#…

idm下载器怎么样好用吗?最新版本有哪些优势

日常工作中下载资料、音/视频等文件是常见的操作,如今市面上的软件非常多,根据我个人的使用经验idm非常不错。idm下载软件怎么样?idm下载软件不仅可下载的文件类型多,而且idm下载文件的速度非常快,同样下载文件的方法也…

电子证件照怎么弄?学会这几招在家也能做证件照

在很多情况下,人们需要制作证件照来证明自己的身份。例如,如果你想办理身份证、护照、驾驶证等证件,或者报考各类考试或申请学校、公司等机构,或者办理银行卡、社保卡等业务,或者申请签证或出入境手续,或者…

基于Java+Swing+Mysql商品信息管理系统

基于JavaSwingMysql商品信息管理系统 一、系统介绍二、功能展示1.主页2.新增商品信息3.查询商品信息 三、数据库四、其他系统实现五、获取源码 一、系统介绍 该系统实现了查看商品列表、新增商品信息、查询商品信息 运行环境:eclipse、idea、jdk1.8 二、功能展示…

IOC-DI(分层解耦)

问题-引出 可以发现我们之前的代码但是写在我们的controller程序中 这里因为比较简单 但是如果我们开发一个比较复杂的功能的话-会出现大量操作数据的代码 导致代码的复用性较差 且难以维护 分层解耦 三层架构 按照上面的对应代码不同功能 来分为下面这三个架构 对应的contr…

Elasticsearch:跨集群复制应用场景及实操 - Cross Cluster Replication

通过跨集群复制(Cross Cluster Replication - CCR),你可以跨集群将索引复制并实现: 在数据中心中断时继续处理搜索请求防止搜索量影响索引吞吐量通过在距用户较近的地理位置处理搜索请求来减少搜索延迟 跨集群复制采用主动 - 被…

电商神器!教你如何利用数据分析打造销售奇迹!

能解决80%通用需求,提供销售、财务、广告、库存等电商数据分析主题的奥威BI电商数据分析方案一直都是比较神秘的存在。有说它风险低的,也有说它性价比高、效率高、可塑性高(支持个性化开发),但说到底,这份B…