【011】pandas处理数据的作用_#py

news2024/12/26 12:58:51

pandas操作

  • 1. 导入数据库
  • 2. 修改行列名
    • 2.1 修改列名
    • 2.2 修改行名
  • 3. 按条件筛选
    • 3.1 根据条件筛选,提取所有信息
    • 3.2 根据条件筛选,提取某列或者某几列
  • 4. 按某行某列提取信息
    • 4.1 获取信息
    • 4.2 更改具体的值
  • 5. 合并
    • 5.1 单列并入大数据中(方法一)
    • 5.2 多列并入大数据中

1. 导入数据库

# 定义空白的数据库,便于存储数据
df1 = []
df1 = pd.DataFrame(df1)
## 或者
df1= pd.DataFrame([])

# 数组全转为数据库内容,不设置首行
df2= [['a', 'b'], [1, 3], [2, 4]]
df2= pd.DataFrame(df2)

# 数组转为数据库内容,并第一行为列名
df3= [['a', 'b'], [1, 3], [2, 4]]
df3 = pd.DataFrame(df3[1:], columns=value[0])

# 数组转为数据库内容,并第一列为行名(设置这一步操作,必须要有列号,因此需在上基础上进行)
# set_index 内容为首行内 想让哪一列作为行号的名称
df4 = [['a', 'b'], [1, 3], [2, 4]]
df4 = pd.DataFrame(df4 [1:], columns=value[0]).set_index('b')

上面导入数组的结果如下:

df1df2df3df4
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

2. 修改行列名

2.1 修改列名

columns的内容,修改前后的

# 在原数据上修改列名,以inplace设置的True为准
df3.rename(columns={'a': ' ', "b": 1}, inplace=True)
# 基于原数据上修改列名赋予新数据,原数据不变,以inplace设置的False为准
df5 = df3.rename(columns={'a': ' ', "b": 1}, inplace=False)

在这里插入图片描述

2.2 修改行名

# 重建列名且从0开始
# drop=True 表示删除原来的索引,drop=False 表示保留原来的行号作为一列,重新建立一个行号
df6 = df4.reset_index(drop=True)
df7 = df4.reset_index(drop=False)

如下:

drop=Truedrop=False
在这里插入图片描述在这里插入图片描述

3. 按条件筛选

3.1 根据条件筛选,提取所有信息

# 筛选出同时满足 a列和 b列的值的内容,并赋予新表
df8= df3[(df3['a'] == 2) & (table['b'] == 4)]

3.2 根据条件筛选,提取某列或者某几列

# 筛选出同时满足 a列和 b列的值的内容,提取 a列(只能提取一列)
df8= df3[(df3['a'] == 2) & (table['b'] == 4)]['a']
# 筛选出同时满足 a列和 b列的值的内容,提取 a列和 b列(可以提取多列)
df8= df3.loc[((df3['a'] == 2) & (table['b'] == 4)), ["a", "b"]]

4. 按某行某列提取信息

4.1 获取信息

先确定列,再确定行号。用 iloc 确定行号

content = df3["a"].iloc[0]

4.2 更改具体的值

df3["a"].iloc[0] = 3

5. 合并

5.1 单列并入大数据中(方法一)

# 设置单列数据
df = pd.DataFrame({'a': [1, 2]})
df3.insert(loc=0, column=str(soc), value=df, allow_duplicates=True)

将 df 插入 df3 的首列中

其各个含义如下:

loccolumnvalueallow_duplicates
表示插入第几列对插入的列名重命名插入的列内容允许出现重复的行名

5.2 多列并入大数据中

单列也可以如下进行合并,但必须行号相同。

df3 = pd.concat([df3, df3[["a", "b"]]], axis=1)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/465517.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

根据虚拟地址,如何求出页号和偏移量?

方法掌握 虚拟地址划分成虚拟页号和虚拟页偏移量。 物理地址同样可划分为物理页号和物理页偏移量 如何划分,关键点在于页面的大小。 假设给你一个十进制表示的地址20000,一个页面的大小为4KB,那么如何找出地址20000的具体位置呢&#xff1f…

消息队列介绍

一、消息队列(MQ)概述 消息队列(Message Queue),是分布式系统中重要的组件,其通用的使用场景可以简单地描述为: 当不需要立即获得结果,但是并发量又需要进行控制的时候,差不多就是需要使用消息队…

如何获取“上帝”的系统版本

如何获取“上帝”的系统版本 在对技术支持过程中,每个公司都难免会遇到这样一个困扰:我们的程序明明在内部环境中测试的好好的,但是到了客户手里总会出现各种问题。 从以往累计的经验来看,这类问题通常和客户的系统环境有关。所…

PHP库存管理系统mysql数据库web结构apache计算机软件工程网页wamp

一、源码特点 PHP库存管理系统 是一套完善的web设计系统,对理解php编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为PHP APACHE,数据库为 mysql5.0,使用php语言开发。 php 库…

【redis】redis分布式锁(一)手写分布式锁1.0~6.0

redis分布式锁(入门) 文章目录 redis分布式锁(入门)前言一、面试题redis的用法:CAP 二、锁的种类三、一个靠谱分布式锁需要具备的条件和刚需四、分布式锁五、重点六、Base案例(bootredis)1.0、最…

如何使用WordPress建立在线辅导网站(3个步骤)

在线辅导网站在过去几年中变得非常流行。随着越来越多的人转向远程工作和学习,这个行业已成为在家赚取额外收入的绝佳方式。 此外,提供在线指导可以帮助您成为所在领域的权威。 如果您想提供在线辅导,最好的方法通常是通过您自己的辅导网站…

并发编程中的三大问题剖析与解决

java并发编程中的三大问 可见性原因分析:解决: 原子性原因分析:解决: 有序性解决: 首先让我们来了解一下JUC JUC(Java Util Concurrent)是Java提供的一个并发编程工具包,它解决了在多…

【Linux】进程地址空间的初步理解

目录 程序地址空间空间布局图引入物理地址与虚拟地址的概念虚拟地址空间虚拟地址与物理地址是如何对应的?※父子进程独立性的理解(重点)fork两个返回值的原理地址空间为什么要存在?补充理解 程序地址空间空间布局图 (这…

IDEA 新版安装教程

目录 一、安装IDEA 1、双击安装,然后下一步 2、修改默认安装路径,自定义目录。(建议所有开发工具都放在同一个盘符) 3、改为自定义安装路径,下一步。(不用使用中文或空格) 4、创建桌面图标等 5、点击安装&#x…

02.DolphinScheduler数据源中心

文章目录 MySQLHIVE数据源使用HiveServer2使用 HiveServer2 HA Zookeeper Clickhouse MySQL 填写参数 数据源:选择 MYSQL数据源名称:输入数据源的名称描述:输入数据源的描述IP 主机名:输入连接 MySQL 的 IP端口:输入…

一维卷积与一维平均池化的时间复杂度

计算请参考这篇文章: (284条消息) 卷积神经网络的时间、空间复杂度以及数据流的变化_卷积的时间复杂度_Briwisdom的博客-CSDN博客 1. 时间复杂度 时间复杂度即模型的运行次数。 单个卷积层的时间复杂度:Time~O(M^2 * K^2 * Cin * Cout) //有的好奇小宝…

Spring(11. 循环依赖 - 周阳)学习笔记

上一篇 :10. 面试问题简析 文章目录 1. Spring AOP1.1. Aop 常用注解1.2 测试前的准备工作1.2.1 业务类1.2.2 切面类 1.3 Spring4 下的测试1.3.1 POM 文件1.3.2 创建测试类1.3.3 Aop 测试结果 1.4 Spring 5 下的测试1.4.1 POM 文件1.4.2 创建测试类1.4.3 Aop 测试结…

e签宝,「进化」在2023

精准布局生态化、统一化、智能化、信创化,辅以具体产品落地;加速产业、行业、企业、业务,“四业”互通互联,提高产业数字化渗透率。电子签“群战”时代,e签宝再次进化。 作者|斗斗 出品|产业家 “印章在谁手上&…

Camtasia 2023版强悍来袭,会哪些新功能呢?

Camtasia Studio 是一款专门录制屏幕动作的工具,它能在任何颜色模式下轻松地记录 屏幕动作,包括影像、音效、鼠标移动轨迹、解说声音等等,另外,它还具有即时播放和编 辑压缩的功能,可对视频片段进行剪接、添加转场效果…

享受简单上传体验:将Maven仓库迁移到GitHub

前言:我为什么放弃了Maven Central 之前我写过一篇《Android手把手,发布开源组件至 MavenCentral仓库》,文中详细介绍了如何发布组件到Maven Central中供所有开发者共用。但是最近使用下来,发现Sonatype JIRA 的Maven Center上传…

python接口自动化测试 requests库的基础使用

目录 简单介绍 Get请求 Post请求 其他类型请求 自定义headers和cookies SSL 证书验证 响应内容 获取header 获取cookies 简单介绍 requests库简单易用的HTTP库 Get请求 格式: requests.get(url) 注意:若需要传请求参数,可直接在 …

c++STL标准库排序函数std::sort使用

Qt系列文章目录 文章目录 Qt系列文章目录前言一、错误原因二、修改后的代码 前言 C sort()排序函数 C STL 标准库中的 sort() 函数,本质就是一个模板函数。正如表 1 中描述的,该函数专门用来对容器或普通数组中指定范围内的元素进行排序,排序…

【ML】windows 安装使用pytorch

使用pytorch需要python环境,建议是直接装anaconda ,IDE用visual studio anaconda安装 Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科学计算、数据分析的 Python 包 官网链接anaconda 本人下载…

(转)maven安装及配置(详细版)

1.下载: 方式一可以从官方下载,下载页面:http://maven.apache.org/download.cgi 方式二:或者题主提供的版本下载maven安装包 提取码:ysns 下载好后是一个压缩文件 2.安装: maven压缩包解压到一个没有中文&a…

AI 编程

GitHub Copilot(收费) 开发者:微软 openAI 2022年8月22日之后开始收费,10美元/月,100美元/年。 CodeGeeX(免费) CodeGeeX 可以根据自然语言注释描述(支持中英文注释&#xff09…