机器学习学习笔记（1）

机器学习学习笔记（1）

news2026/3/24 15:16:11

字典特征提取

第一列表示北京第二列表示上海第三列表示深圳第四列表示温度

前面三列是的话用1 不是的话用0

什么时候用稀疏矩阵：比如上面这种情况当你的城市很多的情况下那这样就会出现大量的0 而系数矩阵只存储不是0的位置可以节省大量空间

为什么采用这种表示方法呢？

首先我们来看假如要分类：人是1 企鹅是2 章鱼是3

那么这样数字表示的就存在优先级不如按这种办法来

pclass是一等舱二等舱三等舱这种

字典特征抽取的应用场景：

文本特征提取：自动抽取非字母的单词

对中文分词它会把连在一起的词也就是短句当做特征不符合我们想要的效果于是我们可以用空格把句子分割但是还是麻烦于是：

首先先import jieba：

.join是分割 join的参数是一个整体

输出

输出：

KMeans：

KMeans步骤：

这边的与原中心点一样代表着与上次的中心点还是一样说明已经趋于极限值了再改中心点意义已经不大了已经是局部最优

归一化：

前面导入的是线性归一化后面导入的是标准差归一化

图就省略了

降维：

这里的降维可以理解为降低特征的个数使得相关性较强的特征减少

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/84452.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

中国算力网络铺开，竟是运营商走在前列？

中国算力网络铺开，竟是运营商走在前列？

明敏发自凹非寺量子位 | 公众号 QbitAI中国算力格局，已悄然发生改变。今年，在一批云厂商的积极布局下，一座座算力中心建成落地，坐标却纷纷绕开东南沿海和一线城市。成都、张北、乌兰察布、重庆……这种趋势概括起来就一句话&…

阅读更多...

spring framework IoC 容器接口体系结构概述

spring framework IoC 容器接口体系结构概述

目录BeanFactory体系结构BeanFactory 主要接口，可分为三级：BeanFactory 主要实现类：BeanFactory 相关接口和实现类：主要知识点ApplicationContext体系结构ApplicationContext 主要接口，可分为三级：二级接口…

阅读更多...

[kerberos] kerberos 认证详解

[kerberos] kerberos 认证详解

什么是kerberos认证？ kerberos 认证是一种用于验证通信双方身份的网络协议。即帮助客户端和服务端证明我是我自己 ，从而使得通信双方可以完全信任对方身份 kerberos 角色组成？ 客户端（client）：发送请求的…

阅读更多...

macOS/Linux如何开机自动挂载/卸载磁盘

macOS/Linux如何开机自动挂载/卸载磁盘

不管是Linux还是基于Unix的macOS，挂载磁盘可以使用mount命令进行磁盘的挂载。挂载的一般状态： 查看磁盘状态挂载磁盘读写磁盘最后是卸载磁盘。 macOS和Windows类似，移动存储一般会自动挂载；部分Linux发行版本，也…

阅读更多...

数据结构与算法（Java版） | 关于以上几个经典算法面试题的一个小结

数据结构与算法（Java版） | 关于以上几个经典算法面试题的一个小结

为了让大家明白算法的重要性，以上我就举了几个经典的算法面试题，我的目的也很简单，就是希望引起大家对算法的一个兴趣。之所以在正式讲解数据结构与算法之前引出这几个经典的算法面试题，是因为我想告诉大家如下三点。算法非常…

阅读更多...

一文看懂MySQL的explian执行计划

一文看懂MySQL的explian执行计划

表： 数据： 例如：explain select * from t where a 2; 各个字段解释： select_type 表示查询中每个 select 子句的类型（简单 OR 复杂） type 对表的访问方式，表示 MySQL 在表中找到所需行的方式…

阅读更多...

[DT框架使用教程01]如何在DT框架中创建插件

[DT框架使用教程01]如何在DT框架中创建插件

[DT框架使用教程01]如何在DT框架中创建插件 DT框架代码地址： https://github.com/huifeng-kooboo/DT 由于国内访问速度的问题也可以访问gitee的地址: https://gitee.com/huifeng_github/DT DT框架是基于QT框架衍生出的组件化框架。对于想具体了解DT框架的同学&…

阅读更多...

GO语言基础介绍

GO语言基础介绍

go语言的GMP模型（协程并发模型），P是go语言本身内部实现的调度器，它是基于协程队列的，协程在调度器面前就类似一个个独立的任务；P一般数量上是处理器内核数。Process本身有调度和创建M的能力，它会…

阅读更多...

Web3中文｜迪士尼前任CEO回归，能否带领迪士尼开辟web3之路？

Web3中文｜迪士尼前任CEO回归，能否带领迪士尼开辟web3之路？

据国外媒体报道，11 月 21 日，当地时间周日晚间，迪士尼宣布首席执行官（CEO）鲍勃查佩克（Bob Chapek）离职，而其前任鲍勃伊格尔（Bob Iger）将重返迪士尼CEO一职…

阅读更多...

Navicat 16 和表空间 - Part 2

Navicat 16 和表空间 - Part 2

如何运作 "What is it? Its it" - Epic, Faith No More 欢迎回到这个关于在 Navicat 16 中使用表空间的系列。第 1 部分介绍了表空间的一些优点，包括可恢复性、轻易添加更多表、自动存储管理以及在隔离缓冲池中数据以提高性能或内存利用率。而第二部分…

阅读更多...

Spring boot 3 GraalVM Native Image

Spring boot 3 GraalVM Native Image

Spring boot 3 && GraalVM Native Image 什么是 GraalVM? GraalVM is a high-performance JDK designed to accelerate the execution of applications written in Java and other JVM languages while also providing runtimes for JavaScript, Python, and a numb…

阅读更多...

Seata模式-tcc

Seata模式-tcc

Seata模式目录概述需求：设计思路实现思路分析1.tcc模式2.一阶段 prepare 行为参考资料和推荐阅读Survive by day and develop by night. talk for import biz , show your perfect code,full busy，skip hardness,make a better result,wait for change,c…

阅读更多...

qiankun 部署微前端-vue2 （二）

qiankun 部署微前端-vue2 （二）

对于基本的部署问题，也可以去官网查找答案： 常见问题 - qiankun 这里主要记录在部署过程中遇到的问题一、路由权限问题无论主应用路由还是子应用中的路由，都会涉及权限问题，并不是每个路由路径对任何角色都是可见&#xff0…

阅读更多...

Linux学习-83-MySQL安装过程

Linux学习-83-MySQL安装过程

17.12 MySQL安装作为LAMP架构的后端，是一款流行的开源关系数据库系统。在企业网站、业务系统等应用中，各种账户信息、产品信息，客户资料、业务数据等都可以存储到MySQL数据库，其他程序可以通过SQL语句来查询，更改这些…

阅读更多...

〖产品思维训练白宝书 - 产品思维认知篇①〗- 产品思维能够为我们带来多大的价值？

〖产品思维训练白宝书 - 产品思维认知篇①〗- 产品思维能够为我们带来多大的价值？

大家好，我是哈士奇 ，一位工作了十年的"技术混子"， 致力于为开发者赋能的UP主, 目前正在运营着 TFS_CLUB社区。 💬 人生格言：优于别人,并不高贵,真正的高贵应该是优于过去的自己。💬 &#x1f4e…

阅读更多...

算法竞赛入门【码蹄集进阶塔335题】(MT2026-2050）

算法竞赛入门【码蹄集进阶塔335题】(MT2026-2050）

算法竞赛入门【码蹄集进阶塔335题】(MT2026-2050） 文章目录算法竞赛入门【码蹄集进阶塔335题】(MT2026-2050）前言为什么突然想学算法了？为什么选择码蹄集作为刷题软件？目录1. MT2026 二维坐标点移动2. MT2027 一秒成零3. MT2028 小…

阅读更多...

开关量转4G模块直接阿里云操作介绍

开关量转4G模块直接阿里云操作介绍

开关量转4G模块直接阿里云操作介绍首先，设备接入阿里云阿里云的连接同上，配置阿里云平台参数前，和华为云一样，首先要在阿里云控制台创建产品，添加设备获取设备证书上云流程：创建产品--添加设备--获取证书…

阅读更多...

USACO简介

USACO简介

USACO是美国信息学奥赛官网，网站为：USACO 其中还包括USACO TRAINING题目，这是一个可以做练习的网站，网站为USACO Training Gateway 进入USACO网站，我们可以看到以下图片下来简要说一下关于USACO的注意事项 1.USACO…

阅读更多...

python-(6-5-3)爬虫---处理防盗链获取视频

python-(6-5-3)爬虫---处理防盗链获取视频

文章目录一需求二分析1 拿到contId2 拿到video_status返回的json -----> src Url3 对src Url 进行修整4 下载资源三代码一需求想要获得某处的视频资源，但由于防盗链的存在，使得在使用浏览器的开发页面获得的视频地址与我们实际获取的地址产生差…

阅读更多...

Spring源码深度解析十四：@Aspect方式的AOP上篇 - @EnableAspectJAutoProxy

Spring源码深度解析十四：@Aspect方式的AOP上篇 - @EnableAspectJAutoProxy

一、前言文章目录：Spring源码深度解析：文章目录二、简介 Aop 即面向切面编程，而 Aspect 是Aop 思想的一种实现。并不是所有的AOP框架都相同，它们在连接点模型上可能有强弱之分，有些允许在字段修饰符级别的应用通…

阅读更多...

推荐文章

最新文章