缺失数据的处理

news2024/12/25 9:34:13

1:方括号里写数组,是对行进行操作,方括号里写字符串,是对列进行操作

df=df.sort_values(by='Count_AnimalName',ascending=False)
#print(df.head(5))
print(df[:20])
print(df['Row_Labels'])
print(type(b))

2:t3.loc(定位取值)

import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
#print(t3)
a=t3.loc['a','z']
print(a)

#取第a行,列数不管它

#coding=utf-8
import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
#print(t3)
b=t3.loc['a',]
print(b)

#取列,不管行。

#coding=utf-8
import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
#print(t3)
c=t3.loc[:,'w']
print(c)

#取多行多列

#coding=utf-8
import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
#print(t3)
d=t3.loc[['a','c'],]
print(d)
f=t3.loc[['a','c'],[w,z]]

3:t3.iloc获取位置

#coding=utf-8
import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
#print(t3)
e=t3.iloc[1]
print(e)

#取第二列

3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
f=t3.iloc[:,[2,1]]
print(f)

#取连续的行和列

#coding=utf-8
import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
g=t3.iloc[0:,:2]

#赋值

import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
t3.iloc[0:,:2]=30
print(t3)

#赋值为nan,可以直接赋值

#coding=utf-8
import pandas as pd
import numpy as np
t3=pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))
t3.iloc[0:,:2]=np.nan
print(t3)

4:布尔值大于800

df=df.sort_values(by='Count_AnimalName',ascending=False)
#print(df.head(5))
# print(df[:20])
# print(df['Row_Labels'])
t=df[df['Count_AnimalName']>800]
print(t)

#大于800小于1000,需要用&号表示‘且’,用|号表示‘或’

不同条件之间要使用() 括起来。

#使用str.len()的方法

df=df.sort_values(by='Count_AnimalName',ascending=False)
#print(df.head(5))
# print(df[:20])
# print(df['Row_Labels'])
t=df[(800<df['Count_AnimalName'])&(df['Count_AnimalName']<1000)]
print(t)

df=df.sort_values(by='Count_AnimalName',ascending=False)
#print(df.head(5))
# print(df[:20])
# print(df['Row_Labels'])
t=df[(800<df['Count_AnimalName'])&(df['Count_AnimalName']<1000)]
#print(t)
h=df[(df['Row_Labels'].str.len()>3)&(df['Count_AnimalName']>700)]
print(h)

5:str的方法

df['info'].str.split('/')

6.tolist的方法(把Series转换成列表)

7:Panda中缺失数据的处理

#pd有2种方法,一种判断为NAN,一种判断不为NAN,isnull,notnull

t3.loc['a','z']=np.nan
#print(a)
#print(t3)
t3=t3[pd.notnull(t3['z'])]
print(t3)

#删除。

t3.loc[('a','b'),('z','y')]=np.nan
#print(a)
#print(t3)
# t3=t3[pd.notnull(t3['z'])]
#print(t3)
b=t3.dropna(axis=0,how='all',inplace=False)
print(b)

#填充数据

b=t3.dropna(axis=0,how='all',inplace=False)
#print(b)
c=t3.fillna(0)
print(c)

#填充均值

b=t3.dropna(axis=0,how='all',inplace=False)
#print(b)
c=t3.fillna(0)
#print(c)
#print(t3)
print(t3.mean())
c=t3.fillna(t3.mean())
print(c)

#填充一个列里的均值

b=t3.dropna(axis=0,how='all',inplace=False)
print(t3)
print('*'*100)
t3['y']=t3['y'].fillna(t3['y'].mean())
print(t3)

8:Panda处理NAN比较有人性化,不会把NAN算进去算均值等

#处理为0的数据:t[t==0]=np.nan

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/342299.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

程序的编译与链接(预处理详解)+百度面试笔试题+《高质量C/C++编程指南》笔试题

本篇重点介绍程序的编译与链接过程中的预处理阶段&#xff0c;将详细的介绍在预处理阶段会发生什么&#xff0c;以及讲解有关百度该内容的面试笔试题和源于《高质量C/C编程指南》的笔试题。一.【预处理详解】①预定义符号②#define2.1 #define 定义标识符注意&#xff1a;2.2 #…

常见的EMC问题

电磁兼容设计的目的就在于满足产品功能要求、减少调试时间&#xff0c;使产品满足电磁兼容标准的要求&#xff0c;并且使产品不会对系统中的其它设备产生电磁干扰。 电磁兼容设计中常见的问题有哪些&#xff1f; 1、电磁兼容设计可以从电路设计&#xff08;包括器件选择&…

69. open函数—打开文件并返回文件对象

69. open函数—打开文件并返回文件对象 文章目录69. open函数—打开文件并返回文件对象1. open() 函数的作用2. open函数语法参考3. open()函数参数说明1. file参数2. encoding 参数3. errors参数4. mode参数4. mode参数详解1. 准备工作2. w 写入模式3. a 追加模式4. r 只读模式…

RabbitMQ学习总结(10)—— RabbitMQ如何保证消息的可靠性

一、丢失场景 RabbitMQ丢失的以下3种情况: (1)生产者:生产者发送消息至MQ的数据丢失

布隆过滤器的使用

目录说明使用布隆过滤器使用测试Java 本地使用布隆过滤器Java集成Redis使用布隆过滤器说明 布隆过滤器是用来防止缓存穿透的&#xff0c;我们需要知道如何使用布隆过滤器。 使用 Google 的 Guava 库提供了使用布隆过滤器的 API 类&#xff08;BloomFilter.class&#xff09;&…

ubuntu 创建raid5教程

1、查看磁盘&#xff1a;parted -l 2、安装创建raid工具mdadm: sudo apt install mdadm 3、创建命令&#xff1a; sudo mdadm -Cv /dev/md0 -l5 -n3 /dev/sdb /dev/sdc /dev/sdd 说明&#xff1a; -Cv: 创建一个阵列并打印出详细信息 /dev/md0: 阵列名称 -l5: 指定阵列类型为 R…

Linux管道排序命令:sort、wc、uniq

sort 它可以根据不同的数据形式来排序&#xff0c;例如数字与文字的排序就不一样。此外&#xff0c;排序的字符与语系的编码有关&#xff0c;因此我们需要排序时&#xff0c;建议使用LANGC来让与系统统一&#xff0c;数据排序比较好一些 sort 【-fbMnrtuk】【file or stdin】 …

java: 错误: 不支持发行版本 5(快速解决办法)

目录 前言 一、出现报错 二、报错的原因 三、解决办法 四、解决成功 前言 在maven web项目上面要部署运行tomcat时候&#xff0c;会出现这个问题 一、出现报错 java: 错误: 不支持发行版本 5 二、报错的原因 &#xff08;1&#xff09;官方解释&#xff1a;这个错误…

解决1130-Host‘ ‘is not allowed to connect to this MySQL server,实现远程连接本地数据库

在使用Navicat远程连接本地数据库时&#xff0c;遇到了这样一个问题&#xff0c;我使用 本地主机的地址&#xff0c;连接本地的数据库&#xff0c;报错host ‘’ is not allowed to connect to this mysql server。上网上查了一下资料&#xff0c;原来自己安装在本地的mysql默认…

Netty 学习笔记——概念篇

Netty Home Netty GitHub Netty简介 Netty是由JBOSS提供的一个java开源框架&#xff0c;现为 Github上的独立项目。Netty提供异步的、事件驱动的网络应用程序框架和工具&#xff0c;用以快速开发高性能、高可靠性的网络服务器和客户端程序。 也就是说&#xff0c;Netty 是一个…

Java——聊聊JUC中的ThreadLocal

文章目录&#xff1a; 1.什么是ThreadLocal&#xff1f; 1.1 api介绍 1.2 最简单的案例认识ThreadLocal 1.3 线程池结合ThreadLocal案例 2.Thread &ThreadLocal & ThreadLocalMap 3.ThreadLocal内存泄漏问题 3.1 四大引用之强引用 3.2 四大引用之软引用 3.3 四…

cs285学习笔记

文章目录lec1ML和RL之间的区别几种RL分类current challengeslec4markov chainmarkov decision processpartially observed markov decision processRLs goalQ & Alec1 ML和RL之间的区别 mlrliid data数据不iid&#xff0c;前面的数据会影响future input训练时有确定的gro…

搜索二叉树

文章目录二叉搜索树模拟实现InsertInsertR()EraseEraseR搜索树的价值实现代码二叉搜索树 在二叉树的基础之上, 左子树的值都比根节点小&#xff0c;右子树都更大。那么他的左右子树也分别叫做二叉搜索树。 查找一个节点,最多查找高度次(建立在这个树是比较均衡的).10亿里面找…

Shennina:一款带有人工智能的自动化主机渗透工具

关于Shennina Shennina是一款功能强大的自动化主机渗透/漏洞利用框架&#xff0c;该项目的主要目的是使用人工智能技术来实现安全扫描、漏洞扫描/分析和漏洞利用开发的完全自动化。Shennina整合了Metasploit和Nmap这两款强大的网络安全工具实现其部分功能&#xff0c;并执行渗…

微搭使用笔记(二)微搭低代码平台介绍及基础使用

概述 官网地址&#xff1a; 官网 官方文档&#xff1a; 官方文档 FAQ: FAQ 腾讯云微搭低代码是一个高性能的低代码开发平台&#xff0c;用户可通过拖拽式开发&#xff0c;可视化配置构建 PC Web、H5 和小程序应用。支持打通企业内部数据&#xff0c;轻松实现企业微信管理、工…

别具一格,原创唯美浪漫情人节表白专辑,(复制就可用)(html5,css3,svg)表白爱心代码(4)

别具一格,独此一家&#xff0c;原创唯美浪漫情人节表白专辑 不一样的惊喜哦~&#xff01;&#xff08;html5,css3,svg)表白爱心代码&#xff08;复制就可用&#xff09;&#xff08;4&#xff09; 目录 款式四&#xff1a;时光的记忆款 1、拷贝完整源代码 2、更新时光盒所…

Springboot使用MDC进行日志追踪

Springboot使用MDC进行日志追踪前言一、为什么要跟踪日志二、MDC存储日志原理三、开始代码1、封装MDC工具类2、注册日志追踪拦截器四、配置logBack五、查看追踪效果六、要解决traceId传递问题1、在不同线程之间的传递2、远程调用时候的传递总结前言 MDC&#xff08;Mapped Diag…

基于ChatGPT +Node.js的基本使用

一、简介 最近,围绕ChatGPT和OpenAI的话题是层出不穷,国内外的技术工作者都掀起了一股学习OpenAI的技术浪潮,甚至有很多的媒体预测OpenAI将会带来行业的革命,而国外一些大的企业也将OpenAI视为重要的竞争对手,比如Google和微软。 事实上,OpenAI 可以应用于任何涉及理解…

SpringBoot(3)之包结构

根据spring可知道&#xff0c;注解之所以可以使用&#xff0c;是因为通过包扫描器&#xff0c;扫描包&#xff0c;然后才能通过注解开发。 那么springboot需要扫描哪里呢&#xff1f; springboot的默认包扫描器&#xff0c;扫描的是自己所在的包和子包&#xff0c;例子如下 我…

生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂

集成与融合类ChatGPT工具与技术&#xff0c;以生成式AI变革业务流程ChatGPT背后的生成式AI&#xff0c;聊聊生成式AI如何改变业务流程ChatGPT月活用户过亿&#xff0c;生成式AI对组织的业务流程有哪些影响?生成式AI对业务流程有哪些影响?企业如何应用生成式AI?一文看懂业务流…