机器学习的数据

机器学习的数据

news2025/1/9 2:08:29

数据

在这里插入图片描述

数据整体的信息
在这里插入图片描述

在这里插入图片描述

我们整个数据就可以表示成这样
在这里插入图片描述

上图中的数据整体叫数据集(data set)
图中每一行数据称为一个样本(sample)。
除最后一列，每一列表达样本的一个特征(feature)
最后一列称为标记（label）

在这里插入图片描述

除了第一行和最后一列以外的信息就是我们所需要的数据，通常数据我们用矩阵X来表示，最后一列的标记我们用y像两个来表示

X矩阵中第i个样本行写作 $X^{(i)}$ ，第i个样本第j个特征值 $X_{j}^{(i)}$ 。y向量中第i个样本的标记写作 $y^{(i)}$

每个样本的特征所组成的向量称为特征向量
在这里插入图片描述

我们通常表示向量都是用列向量的形式表示

在这里我们选择数据集中前两个特征的数据，并用可视化图表的形式表示出来，这两个特征所组成的是一个二维空间，样本中每个特征的值所组成的向量就代表该空间中的每个点，那么这个空间我们就称之为特征空间（feature space）

在这里插入图片描述

分类的本质就是在特征空间切分。当我们输入一个数据的时候，我们把它在特征空间中进行表示，然后根据新输入数据的落点区域去判断去花的种类
在这里插入图片描述

特别强掉的是，由于可视化的需要，所以很多时候我们把数据降到两维，因为通常对于一个数据而言都是具有非常多的特征的，比如上面的鸢尾花数据集中，其中就有四个特征，那么我们其实是在四维的空间中进行切分，那么这是无法可视化的，所以我们通常会采用降维的方式进行数据分类，最后我们再把低维空间得到的结论推广到高维空间，这在高维空间中都同理。

在机器学习的领域中特征可以是一个非常抽象的一个事物，比如下面这个图象识别数据集中的一个样本5，它是一个灰度图像，它的特征值相比于彩色图像特征少一点
在这里插入图片描述

在这里：

图象，每一个像素点都是特征
一个图像的特征的数目：比如28*28的图像有28*28=784个特征
如果是彩色图像则特征更多

在机器学习领域中，特征不都是有语义的，也有可能是非常抽象的。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1034499.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

el table 修改鼠标在行上改变背景颜色

el table 修改鼠标在行上改变背景颜色

el table 在制作的时候，需要修改当鼠标停留在指定行上的时候，修改背景颜色等相关样式。这里面记录一下 1. 首先，在table上面添加class，如下图: 2. 然后再最下面下面创建style样式，是<style scoped> 的&#x…

阅读更多...

滑动窗口9.23

1876.长度为3且各字符不同的子字符串 1876. 长度为三且各字符不同的子字符串 - 力扣（LeetCode）https://leetcode.cn/problems/substrings-of-size-three-with-distinct-characters/?envTypelist&envId24zW97w8自写思路： 数组充当哈希表…

阅读更多...

Spring面试题16：Spring框架中的单例bean是线程安全的吗?Spring框架中bean的生命周期？哪些是重要的bean生命周期方法？

Spring面试题16：Spring框架中的单例bean是线程安全的吗?Spring框架中bean的生命周期？哪些是重要的bean生命周期方法？

该文章专注于面试，面试只要回答关键点即可，不需要对框架有非常深入的回答，如果你想应付面试，是足够了，抓住关键点面试官：Spring框架中的单例bean是线程安全的吗?为什么？是的，Spring框架中的单例Bean是线程安全的。 Spring中的单例Bean默认是在容器启动时创建的，并…

阅读更多...

【Cpp】位图Bitmap

【Cpp】位图Bitmap

code #include <iostream> #include <vector> #include <stdio.h> #include <stdint.h>class Bitmap { private:std::vector<uint8_t> data; // 存储位图数据的字节数组uint32_t size; // 位图的大小（以位为单位&#x…

阅读更多...

springboot整合aop，实现日志操作

springboot整合aop，实现日志操作

前言： 整合之前，我们要明白aop是什么，为什么要用aop，aop能帮我们做什么。答：AOP是面向切面编程（Aspect-Oriented Programming）的简称，它是一种编程思想，旨在在面向对象…

阅读更多...

【AI视野·今日Sound 声学论文速览第十期】Fri, 22 Sep 2023

【AI视野·今日Sound 声学论文速览第十期】Fri, 22 Sep 2023

AI视野今日CS.Sound 声学论文速览 Fri, 22 Sep 2023 Totally 1 papers 👉上期速览✈更多精彩请移步主页 Daily Sound Papers Performance Conditioning for Diffusion-Based Multi-Instrument Music Synthesis Authors Ben Maman, Johannes Zeitler, Meinard M lle…

阅读更多...

数据库中的DDL与DML

数据库中的DDL与DML

标签：数据库记录下DDL和DML的相关概念。数据定义语言定义数据库模式数据定义语言DDL(Data-Definition Language)可定义数据库模式。数据库模式在之前的文章中已经提到过了。简单来说，建表用的SQL语句就是DDL。如下代码 CREATE TABLE department(de…

阅读更多...

使用Python做一个微信机器人

使用Python做一个微信机器人

介绍简介该程序将微信的内部功能提取出来，然后在程序里加载Python，接着将这些功能导出成库函数，就可以在Python里使用这些函数程序启动的时候会执行py_code目录下的main.py，类似于你在命令行使用python main.py。现在会以…

阅读更多...

用《斗破苍穹》的视角打开C#多线程开发1（斗帝之路）

用《斗破苍穹》的视角打开C#多线程开发1（斗帝之路）

Thread.Start() 是的，我就是乌坦城那个斗之气三段的落魄少爷，在我捡到那个色眯眯的老爷爷后，斗气终于开始增长了。在各种软磨硬泡下，我终于学会了我人生中的第一个黄阶斗技——吸掌。 using System.Threading;namespace Framewo…

阅读更多...

第一部分：HTML5

第一部分：HTML5

一：网页 1.1：什么是网页？ 网站是指在因特网上根据一定的规则，使用HTML等制作的用于展示特定内容相关的网页集合网页是网站中的一"页"，通常是HTML格式的文件，它要通过浏览器来阅读网页是构成网…

阅读更多...

透视俄乌网络战之四：西方科技巨头的力量

透视俄乌网络战之四：西方科技巨头的力量

透视俄乌网络战之一：数据擦除软件透视俄乌网络战之二：Conti勒索软件集团（上） 透视俄乌网络战之三：Conti勒索软件集团（下） 西方科技巨头的力量 1. Palantir2. SpaceX3. Maxar Technologies4. Cl…

阅读更多...

送水订水小程序商城的作用是什么？

送水订水小程序商城的作用是什么？

桶/瓶装水有很高的市场需求度，除了家庭外，部分办公场几乎每天都会订水且有一定的合作，由于没有空间限制，因此对桶装水商家来说，本地和外地客户都有较高的拓展度，而传统电话、微信私信订购宣传方式低效且不智…

阅读更多...

10.5 串联型稳压电路（1）

10.5 串联型稳压电路（1）

稳压管稳压电路输出电流较小，输出电压不可调，不能满足很多场合下的应用。串联型稳压电路以稳压管稳压电路为基础，利用晶体管的电流放大作用，增大负载电流；在电路中引入深度电压负反馈使输出电压稳定；并且&a…

阅读更多...

ElasticSearch - 分布式搜索引擎底层实现——倒排索引

ElasticSearch - 分布式搜索引擎底层实现——倒排索引

目录一、ElasticSearch 1.1、ElasticSearch 是什么？ 1.2、ElasticStack 是什么? 1.3、正向索引和倒排索引 1.3.1、正向索引 1.3.2、倒排索引 a）倒排索引的创建过程： b）倒排索引的查询过程： c）分…

阅读更多...

三、初识FreeRTOS之FreeRTOS基础知识

三、初识FreeRTOS之FreeRTOS基础知识

从这节开始，我们正式学习FreeRTOS的一些基础知识，争取做到日更，或者隔日更。如果在学习的过程中哪里有理解错误，希望各位朋友批评指正。因为自己觉得图文并茂好像更容易理解一点，所以在博文中加了大量的图片&#xff0…

阅读更多...

Tomcat部署、优化、以及操作练习

Tomcat部署、优化、以及操作练习

一.Tomcat的基本介绍 1.1.Tomcat是什么？ Tomcat服务器是一个免费的开放源代码的Web应用服务器，属于轻量级应用服务器，在中小型系统和并发访问用户不是很多的场合下被普遍使用，是开发和调试JSP程序的首选。一般来说，T…

阅读更多...

APM32F0XX/STM32F0XX内部参考电压VREFINT反算ADC引脚电压

APM32F0XX/STM32F0XX内部参考电压VREFINT反算ADC引脚电压

首先打开极海APM32F030x4x6x8xC 用户手册找到VREFINT。找到内部参考电压 VREFINT为ADC1_IN17通道使用VREFINT必须使能VREFEN位初始化ADC代码 void ADC_Init(void) {GPIO_Config_T gpioConfig;ADC_Config_T adcConfig;/* Enable GPIOA clock */RCM_Ena…

阅读更多...

Redis学习笔记--002

Redis学习笔记--002

Redis的JAVA客户端文章目录 Redis的JAVA客户端一、Redis的Java客户端的种类二、Jedis2.1、使用步骤2.2、Jedis连接池三、[SpringDataRedis](https://spring.io/projects/spring-data-redis)3.1、介绍3.2、RedisTemplate3.3、SpringDataRedis使用步骤3.4、SpringDataRedis的序…

阅读更多...

银行家算法——C语言实现

银行家算法——C语言实现

算法思路将操作系统看作是银行家，操作系统所拥有的资源就相当于银行家所拥有的资产，进程向操作系统申请资源就相当于资产家向银行贷款，规定资产家在向银行贷款之前，先申明其所贷数额的最大值，申明之后其贷款的数额不…

阅读更多...

深度学习-一个简单的深度学习推导

深度学习-一个简单的深度学习推导

文章目录前言1.sigmod函数2.sigmoid求导3.损失函数loss4.神经网络1.神经网络结构2.公式表示-正向传播3.梯度计算1.Loss 函数2.梯度1.反向传播第2-3层2.反向传播第1-2层前言本章主要推导一个简单的两层神经网络。其中公式入口【入口】 1.sigmod函数激活函数我们选择sigmo…

阅读更多...

推荐文章

最新文章