Python Pandas 使用示例

news2024/9/22 19:35:12

文章目录

  • 使用Boolean 选择rows
  • 读取Excel表格里指定的sheet, 并跳过起始n行
  • 删除只有一个元素的行
  • 删除重复的
  • 合并多个csv文件到excel表格中
  • 获取csv文件的数据

使用Boolean 选择rows

import pandas as pd

# Sample DataFrame
data = {'Name': ['John', 'Alice', 'Bob', 'Emily'],
        'Age': [25, 30, 35, 40],
        'City': ['New York', 'Paris', 'London', 'Tokyo']}
df = pd.DataFrame(data)
print(df)
print('================')

# List of boolean values
boolean_list = [True, False, True, False]

# Select rows based on the boolean list
selected_rows = df[boolean_list]
print(selected_rows)

输出:

    Name  Age      City
0   John   25  New York
1  Alice   30     Paris
2    Bob   35    London
3  Emily   40     Tokyo
================
   Name  Age      City
0  John   25  New York
2   Bob   35    London

读取Excel表格里指定的sheet, 并跳过起始n行

安装openpyxl, openpyxl是Python操作Excel文件的另一个库,可以非常方便地读写Excel文件的各种内容

pip install openpyxl
df = pd.read_excel(path, sheet_name= sheetName, skiprows=1)
  • sheet_name: 指定读取某个sheet
  • skiprows: 参数跳过起始的n行,因为可能有表头等合并单元格之类的数据

删除只有一个元素的行

假设excel表格正常的每行有4个数据(即4列),但是某一行只有一个单元格有数据,需要删除该行(改行可能是数据或者其他内容)

df = df.dropna(thresh=2)  
  • thresh: thresh = 2表示,如果一行至少有2个以上非空值时才会被删除

删除重复的

原始data frame

brand style  rating
0  Yum Yum   cup     4.0
1  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

默认删除,基于所有列删除重复行

df = df.drop_duplicates()
 brand style  rating
0  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

删除特定的重复列, 使用subset

>>> df.drop_duplicates(subset=['brand'])
    brand style  rating
0  Yum Yum   cup     4.0
2  Indomie   cup     3.5

keep参数的使用

keep{‘first’, ‘last’, False}, default ‘first’
Determines which duplicates (if any) to keep.
‘first’ : Drop duplicates except for the first occurrence.
‘last’ : Drop duplicates except for the last occurrence.
df.drop_duplicates(subset=['brand', 'style'], keep='last')
    brand style  rating
1  Yum Yum   cup     4.0
2  Indomie   cup     3.5
4  Indomie  pack     5.0

合并多个csv文件到excel表格中

使用前确保安装了xlsxwriter

pip install xlsxwriter
import os
import pandas as pd

# Get the directory name
directory_name = "your file path"

# List all CSV files in the directory
csv_files = [f for f in os.listdir(directory_name) if f.endswith('.csv')]

# Create a Pandas Excel writer using the directory name as the Excel file name
excel_file_name = os.path.basename(directory_name) + '.xlsx'
excel_writer = pd.ExcelWriter(excel_file_name, engine='xlsxwriter')

# Loop through each CSV file and add it as a new sheet in the Excel file
for csv_file in csv_files:
    sheet_name = os.path.splitext(csv_file)[0]  # Use CSV file name as sheet name
    # remove the special characters of the name, here is an example
    # sheet_name = sheet_name.replace("[", "").replace("]", "")  # Remove "[" and "]"
    df = pd.read_csv(os.path.join(directory_name, csv_file))
    df.to_excel(excel_writer, sheet_name=sheet_name, index=False)

# Save the Excel file
excel_writer.close()

print(f"CSV files merged into {excel_file_name} with different sheets.")

获取csv文件的数据

data = pd.read_csv('test.csv', header=None, encoding = "utf-8").values

读取后,data如下所示
在这里插入图片描述
可以通过索引去获取某一行某一列的数据

for i in range(len(data)):
	print(data[i][0])
	print(data[i][1])
	print(data[i][2])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/855390.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Segment Anything(SAM) 计算过程

给定输入图像 I ∈ R 3 H W I \in R^{3 \times H \times W} I∈R3HW。给定需要的prompts: M ∈ R 1 H W M \in R^{1 \times H \times W} M∈R1HW,代表图片的前背景信息。 P ∈ R N 2 P \in R^{N \times 2} P∈RN2,其中 N N N 是点的个数…

SpringBoot 底层机制分析【Tomcat 启动+Spring 容器初始化+Tomcat 如何关联Spring 容器】【下】

😀前言 本篇博文是关于SpringBoot 底层机制分析实现,希望能够帮助你更好的了解SpringBoot 😊 🏠个人主页:晨犀主页 🧑个人简介:大家好,我是晨犀,希望我的文章可以帮助到大…

多年软件测试面试经验,给正在面试工作的一些建议

工作8年多,测试管理经验4年左右,电话面试现场面试了很多测试工程师候选人员,总结下面试过程中我经常会问到的问题和梳理下我的面试流程,希望对候选人员有所帮助。 1.自我介绍 自我介绍其实并不是我想了解除了简历之外的候选人的…

【王树森】深度强化学习(DRL)课程笔记:P2 价值学习

Value-Based RL 试图找出能预测最优action的Q*函数 Deep Q Network(DQN) Temporal Difference(TD) Learning Example 如果在只到半路DC能不能更新模型? TD在这种情况下也可以学习的原因 TD learning for DQN 使用TD Learning 训练 DQN Summary

oracle sql developer批量删除某个用户

随着navicate收费,还得破解,pl/sql developer配置麻烦,最近使用oracle sql developer来试试oracle的操作如何; 用着还行,没有卡顿现象, 最近要oracle sql developer批量删除某个用户下所有的表&#xff0…

springboot中消失的静态资源

springboot中消失的静态资源 问题:springboot项目中,resource/static 目录下的index.html以及template目录下 。实现WebMvcConfigurer这个接口,index.html就404了。 原因:实现了 WebMvcConfigurer 接口后,index.html …

网络安全的相关知识点

网络安全威胁类型: 1.窃听:广播式网络系统。 2.假冒 3.重放:重复一份报文或者报文的一部分,以便产生一个被授权的效果。 4.流量分析 5.数据完整性破坏 6.拒绝服务 7.资源的非授权使用 8.陷门和特洛伊木马:木马病毒有客…

Kali中AWD靶机环境搭建

Kali中AWD靶机环境搭建 1、kali安装docker2、克隆项目(400多M,下载会有点久)3、进入项目4、下载镜像5、改镜像名6、比赛环境搭建6.1 启动靶机6.2 连接裁判机,启动check脚本6.3 关闭环境命令 7、 靶机访问方式7.1 web界面访问7.2 s…

AMD 翻身无望,RX7000多款主流新卡出炉逗乐NVIDIA

看了今年 NVIDIA RTX 40 系中端主流级显卡,让咱明白了什么叫毫无诚意。 4060 核心规模不及 4090 的 19%、4060Ti 打不过 3070,可真是小刀划屁股开了眼。 奈何 AMD 这代 RX 7000 系显卡着实给不上压力。 旗舰 RX 7900 XTX、7900 XT 完全不敌 RTX 4090、…

go get报错

这里写目录标题 执行 go install github.com/mitchellh/goxlatest提示下面错误,我浏览器直接访问时能访问了,这个下面的提示是golang代理问题 go install: github.com/mitchellh/goxlatest: module github.com/mitchellh/gox: Get “https://proxy.golan…

职场演讲口才培训的影响研究:演讲训练项目的效果探究

题目:职场演讲口才培训的影响研究:演讲训练项目的效果探究 I. 引言 A. 话题背景和意义 在现代职场中,良好的演讲口才已经成为一个不可或缺的技能。随着全球化和信息技术的迅速发展,职场中的沟通方式和需求也发生了巨大变化。无论…

多门店小程序怎么弄

连锁多门店小程序是一种基于微信平台的应用,旨在为连锁企业提供线上线下一体化的服务。以下是该小程序的功能介绍: 1. 门店查找:用户可以通过小程序查找附近的连锁门店,根据地理位置、距离等条件进行筛选,并查看每个门…

MFC创建和使用OCX控件

文章目录 MFC建立OCX控件注册OCX控件与反注册使用Internet Explorer测试ocx控件OCX控件添加方法OCX控件添加事件Web使用OCX控件MFC使用OCX控件使用OCX控件调用ocx的功能函数对ocx的事件响应OCX控件调试工具tstcon32.exe加载ocx控件使用tstcon32.exe调试ocxMFC建立OCX控件 新建…

镜像网站汇总【8月9日更新】

今日最新整理:还是最基本原则: 不用注册, 不用登录, 不用魔法, 不用梯子, 必须是上来就用的镜像! 第一个:可用网址汇总 网址:https://c.aalib.net/tool/chatgpt/ …

【原创】基于JavaWeb的婚礼策划平台

主要功能介绍:系统基于Java语言开发。整个程序属于B/S架构应用。在开发的时候,将婚礼策划中主要的业务如:婚纱摄影预约以及婚纱租赁等作为主要的目标和研究方向。婚礼策划平台系统从整体结构设计上,由网站前台和系统后台组成。网站…

江苏省发布雨水排放环境管理办法,这些重点值得关注!

近日,江苏省深入打好污染防治攻坚战指挥部办公室正式印发了《江苏省重点行业工业企业雨水排放环境管理办法(试行)》,已于2023年5月15日正式施行。 本办法所称重点行业工业企业,是指化工、电镀原料药制造、冶炼、印染行…

方法区——元空间概述

方法区 不同版本具体实现 标准层面:方法区(Method Area)具体实现层面: ≤JDK1.6 永久代JDK1.7 永久代仍然存在,但是已经开始提出:去永久代≥JDK1.8元空间(Meta Space) 永久代概念辨…

【torch.nn.Fold】和【torch.nn.Unfold】

文章目录 torch.nn.Unfold直观理解官方文档 toch.nn.Fold直观理解官方文档 torch.nn.Unfold 直观理解 torhc.nn.Unfold的功能: 从一个batch的样本中,提取出滑动的局部区域块patch(也就是卷积操作中的提取kernel filter对应的滑动窗口&#…

C语言基础(持续更新)

常用函数 strrchr 描述 C 库函数 char *strrchr(const char *str, int c) 在参数 str 所指向的字符串中搜索最后一次出现字符 c(一个无符号字符)的位置。测试代码 #include "stdio.h" #include "string.h"int main() {printf(&q…

Ubuntu18.04中QGroundControl安装及添加到应用程序

Ubuntu18.04中QGroundControl安装及添加到应用程序 Ubuntu18.04中QGroundControl安装及添加到应用程序教程 目录 Ubuntu18.04中QGroundControl安装及添加到应用程序QGroundControl下载安装一、设置用户权限二、安装必要扩展包三、注销并再次登录以启用对用户权限的更改四、下…