pd.cut()函数--Pandas

news2024/11/27 22:37:09

1. 函数功能

将连续性数值进行离散化处理:如对年龄、消费金额等进行分组

2. 函数语法

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise', ordered=True)

3. 函数参数

参数含义
x要离散分箱操作的数组,必须是一维的
bins取值为:(1)整数n:将数据x划分为组距相等的n组;(2)标量组成的序列:指定每组的分界值;(3)IntervalIndex:间隔索引
right布尔值,默认为True:包括每组的右边边界值:当“ right = True”(默认值)时,则“ bins”=[1、2、3、4]表示(1,2],(2,3],(3,4]
labels指定离散化后返回每组的标签,长度与组数一致。默认为None:以分界值组成的左开右闭区间展示;取值为False时,返回一个区分箱的整数组成的序列。
retbins布尔值,默认为False:不返回分箱情况,该参数在bins取值为整数时起作用
precision分箱数值的精度,取值为整数,默认为3
include_lowest布尔值,默认为False:不包括每组的左侧分界值,即:左开区间
duplicates可选参数:当bins的边界值存在重复,采取的措施:raise(报错:默认)或者drop(删除)
ordered布尔值,默认为True:对labels标签排序,属于定序型变量:优秀>良好;取值为False时:得到的标签labels属于定类型变量:如:汉族、维吾尔族

4. 返回值

返回值包括两个

返回值含义
out返回值取决于labels参数的取值:(1)labels参数取值为None(默认):输入为Series时返回一个Series,其他输入类型返回categorical;(2)labels取值为标量组成的序列:输入为Series时返回一个Series,其他输入类型返回categorical;(3)labels取值为False时:返回一个整数组成的数组
bins计算得到或者制定的每组分界值,当retbins=True时,才会返回该值

5. 示例

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

其实标签为上述数字边界组成时,不需要通过Labels特别指定,取值为None时,默认即是上述形式。见下例:
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/940355.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ES6 新特性

🎄欢迎来到边境矢梦的csdn博文🎄 🎄本文主要梳理前端技术的JavaScript的知识点ES6 新特性文件上传下载🎄 🌈我是边境矢梦,一个正在为秋招和算法竞赛做准备的学生🌈 🎆喜欢的朋友可以…

ardupilot开发 --- EKF篇

状态估计的算法发展 参数调试 AHRS_EKF_USE: set to “1” to use the EKF, “0” to use DCM for attitude control and inertial nav (Copter-3.2.1) or ahrs dead reckoning (Plane) for position control. In Copter-3.3 (and higher) this parameter is forced to “1” …

Maven报错 [ERROR] Malformed \uxxxx encoding.

IDEA刷新项目,报错[ERROR] Malformed \uxxxx encoding. 现象 1.控制台报错 [ERROR] Malformed \uxxxx encoding.2.项目代码大部分爆红 3.Pom文件不爆红 4.IDEA未能构建Dependencies 尝试清除IDEA缓存无效,重新克隆项目无效,更换低版本mav…

【MySQL】3、MySQL的索引、事务、存储引擎

create table class (id int not null,name char(10),score decimal(5,2)); insert into class values (1,zhangsan,80.5); update class set namewangwu,passwd123 where id2; select * from class where id2; drop 索引的概念 是一种帮助系统,能够更快速的查询信…

并发编程篇

并发编程篇 线程基础 线程和进程的区别 面试官: 说一下线程和进程的区别? 候选人: 嗯,好~ 进程是正在运行程序的实例,进程中包含了线程,每个线程执行不同的任务不同的进程使用不同的内存空间&#xf…

elementplus实现左侧菜单栏收缩与展开

1.页面结构 Home.vue下包含aside.vue和menu.vue 2.TAside.vue el-menu左侧菜单栏显示 注意: 要使用收缩与展开,el-aside必须设置width"collapse",否则收缩展开会出现收缩后,el-aside宽度不变窄需要使用动态改变展开收…

微信商城小程序的特点以及功能都有什么?

在移动互联网时代,微信商城小程序已成为许多企业开展电商业务的重要工具。通过微信商城小程序,用户可以方便地在微信平台上浏览商品、下单购买、进行支付等操作。为了开发一款成功的微信商城小程序,既需要专业性,又需要思考深度的…

高速公路自动驾驶汽车超车控制方法研究

目录 摘要 ............................................................................................................ I Abstract ...................................................................................................... II 目录 ...............…

【Python】python 打印本地代理

前言 在 Python 中,如果需要访问被墙的网站或者需要隐藏本机 IP 地址,可以通过使用代理服务器来实现。本文将介绍如何打印本地代理的方法,并提供相应的代码和实例。 一、什么是代理服务器 代理服务器(Proxy Server)是…

AxureRP制作静态站点发布互联网,内网穿透实现公网访问

AxureRP制作静态站点发布互联网,内网穿透实现公网访问 文章目录 AxureRP制作静态站点发布互联网,内网穿透实现公网访问前言1.在AxureRP中生成HTML文件2.配置IIS服务3.添加防火墙安全策略4.使用cpolar内网穿透实现公网访问4.1 登录cpolar web ui管理界面4…

Django(9)-表单处理

django支持使用类创建表单实例 polls/forms.py from django import forms class NameForm(forms.Form):your_nameforms.CharField(label"Your name",max_length100)这个类创建了一个属性,定义了一个文本域,和它的label和最大长度。 polls/vi…

抖音矩阵,矩阵账号开发,抖音矩阵源码搭建

抖音矩阵,矩阵账号开发,抖音矩阵源码搭建: 1、账号矩阵系统搭建首先需要注意的是支持多平台,多账号,可以实现流量互通,账号矩阵多个账号联动形成账号矩阵形式分发开发。 2、账号矩阵系统需要可以查看分发…

尚硅谷宋红康MySQL笔记 10-13

是记录,我不会记录的特别详细 第10章 创建和管理表 标识符命名规则 数据库名、表名不得超过30个字符,变量名限制为29个只能包含 A–Z, a–z, 0–9, _共63个字符数据库名、表名、字段名等对象名中间不要包含空格同一个MySQL软件中,数据库不能…

【C++入门】new和delete(C/C++内存管理)

目录 1.C/C内存分布2.C语言中动态内存管理方式3.C内存管理方式3.1new/delete操作内置类型3.2new和delete操作自定义类型 4.operator new与operator delete函数5.new和delete的实现原理5.1内置类型5.2自定义类型 6.malloc/free和new/delete的区别7.定位new表达式(了解…

小程序开发之登录授权

小程序开发登录授权流程 看懂这张图登录授权就没问题了(哈哈哈哈哈) 说明: 调用 wx.login() 获取 临时登录凭证code ,并回传到开发者服务器。 调用 auth.code2Session 接口,换取 用户唯一标识 OpenID 和 会话密钥 sess…

Jmeter(三十):并发测试(设置集合点)

集合点:让所有请求在不满足条件的时候处于等待状态。 如:我集合点设置为50,那么不满足50个请求的时候,这些请求都会集合在一起,处于等待状态,当达到50的时候,就一起执行。从而达到并发的效果。 那么Jmeter中可以通过同步定时器 Synchronizing Timer 来完成。 Number …

数学系硕士研究生的科研过程——PDE约束下含参优化控制问题的深度学习算法

笔者今天上午收到了之前北大课题组老板的通知,得知研究生期间和学长合作的论文终于被siam接收,终于为自己研究生涯画上了一个句号。这里打算分享一下个人的科研过程以及这篇论文的工作,即将读研或者打算读研的同学或许可以从中获得益处。论文…

Jumpserver堡垒机管理(安装和相关操作)-------从小白到大神之路之学习运维第89天

第四阶段 时 间:2023年8月28日 参加人:全班人员 内 容: Jumpserver堡垒机管理 目录 一、堡垒机简介 (一)运维常见背黑锅场景 (二)背黑锅的主要原因 (三)解决背黑…

【微信红包】Axure聊天发红包原型图,含流程图和PRD产品文档

作品概况 页面数量:共 60 页 兼容软件:Axure RP 9/10,不支持低版本 应用领域:聊天软件、社交软件 作品申明:页面内容仅用于功能演示,无实际功能 作品特色 本作品为「发红包」的原型设计图&#xff0c…

新媒必看!如何利用文件传输软件拿到一手资料!

在新媒体时代,新闻的爆发和传播已经变得非常迅速和紧迫,这要求新媒体从业者具备敏锐的嗅觉和快速获取第一手资料的能力。然而,在大数据文件传输过程中常常遇到信息滞后、泄露或丢失等问题,这会直接影响新闻报道的质量。为了解决这…