【python】一些常用的pandas技巧

news2024/11/19 17:25:12

有了gpt之后,确实很多代码都可以让gpt给改错。嘎嘎香


merge多个dateframe

https://stackoverflow.com/questions/44327999/how-to-merge-multiple-dataframes

data_net = [a,b,c,d]
net_merged = reduce(lambda  left,right: pd.merge(left,right,on=['key column'],
                            how='outer'), data_net)

merge的参数细节

看过很多次的文章。基础但有用。
pandas数据合并之一文弄懂pd.merge()https://zhuanlan.zhihu.com/p/132579724

NAN值处理

移动全为NAN的行

dataframe.dropna(axis=0,how='any',inplace=True)

看各列里面NAN的数量

dataframe.isnull().sum() 

把带NAN的dataframe以行显示

dataframe[dataframe.isnull().T.any()]

将NAN值替换为0并以整数显示

df.fillna(0, inplace=True)
df= df.astype(int) 

保存csv

解决中文乱码

dataframe.to_csv(r"XXXXXX.csv",
                  header=True,encoding="utf_8_sig",index=False)

自定义名字

file.to_csv(r"XXXX/{}.csv".format(XXXXX),
                  header=True,encoding="utf_8_sig",index=False

pathlib读取文件夹内文件

from pathlib2 import Path
file_path=Path(r"XXXX")
for date in file_path.iterdir():
    print(date.stem) #文件名
    file=pd.read_csv(date)
    print(file)

os读取文件夹

# 设置 CSV 文件所在的目录
csv_dir = "路径"
# 获取目录下所有的 CSV 文件名
csv_files = [f for f in os.listdir(csv_dir) if f.endswith('.csv')]
# 读取每个 CSV 文件,并将它们存储在一个列表中
dfs = []
for csv_file in csv_files:
    df = pd.read_csv(os.path.join(csv_dir, csv_file))

split切割

file['XX'] = file['AA'].map(lambda x: x.split(' ')[0]) #保存空格前面的部分
file['YY'] = file['AA'].map(lambda x: x.split(' ')[1]) #保存空格后面的部分

统计一列里有多少变量

代码的意思是读取DF里面一列并进行个数统计,将结果保存为一共两列的DF

XXX=dataframe['列名'].value_counts(
                ).rename_axis('自定义列名').reset_index(name='自定义统计量列名')

举个结果例子:
在这里插入图片描述

对行进行操作

  1. 移除满足条件的行
df= df[df['列名'].astype(float) > 10]
  1. List item

strptime和strftime

涉及到时间序列的缩写表达
https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior
在这里插入图片描述

24小时制度的转换

file['XXX']=file['XXX'].apply(
#             lambda x: datetime.datetime.strptime(x,"%H:%M").strftime("%H:%M"))

列名

删掉带有特定字符的列名

https://stackoverflow.com/questions/19071199/drop-columns-whose-name-contains-a-specific-string-from-pandas-dataframe

df = df[df.columns.drop(list(df.filter(regex='特定字符')))]

对含有特定字符的列名进行批量修改
举例:_x和_y被删掉了

df.rename(columns=lambda x: x.replace('_x', '').replace('_y', ''), inplace=True)

列值排序

df= df.sort_values(by=['XXX'], ascending=True)

merge how=outer

两张表=5296+6509=
在这里插入图片描述
在这里插入图片描述
how=outer的结果,左表5108+194=5302,右表6324+194=6518
??????????????????
在这里插入图片描述

怎么在pathlib中一次性读取两个或者几个csv,分别存到不同DF中

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/669774.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小程序安全指南:保护用户数据的最佳实践

第一章:引言 近年来,小程序已成为移动应用开发的重要组成部分。它们为用户提供了方便的功能和个性化的体验,然而,与此同时,小程序安全问题也引起了广泛的关注。保护用户数据是开发者应该高度重视的问题。在本指南中&a…

JavaScript ES11新特性

文章目录 导文可选链操作符(Optional Chaining Operator)空值合并操作符(Nullish Coalescing Operator)动态 import() 函数BigInt 类型Promise.allSettled() 导文 JavaScript ES11,也被称为ES2020,引入了一…

经纬度、时差知识整理(理解与应用)

经纬度是经度与纬度的合称组成一个坐标系统,称为地理坐标系统,它是一种利用三度空间的球面来定义地球上的空间的球面坐标系统,能够标示地球上的任何一个位置。初一的同学在学地理这门课的时候,一上来很快就会学到经纬度这个概念。…

PC市场寒冬,大众还需要PC吗?

PC市场寒冬,大众还需要PC吗? PC(个人电脑)市场从2016年智能手机兴起之时便进入下滑态势,到2020年疫情发生后,居家办公、在线教育等需求曾给PC市场带来连续六个季度的增长。⁴ 好景不长,进入202…

mybatisplus分页total总数为0

mybatisplus分页total总数为0 背景&#xff1a;最近初始化新项目时&#xff0c;使用mybatisplus分页功能发现 records 有记录&#xff0c;但是 total 总是为0&#xff0c;于是开启了一顿“知识寻求”之路SpringBoot版本 <parent><groupId>org.springframework.boo…

Makerbase CANable V2.0 固件升级或替换

第1部分 应用软件与固件 应用软件CANable V2.0CANable V1.0cangaroocandleLight/slcan(支持CAN FD)candleLight/slcan/cantactBUSMASTER V3.2.2candleLightcandleLight/pcan/cantactTSMastercandleLightcandleLight/pcan/cantactPCAN-Explorer 5、pcan view不支持pcancantacts…

一文带你全面理解 MySQL 中的常用函数

0️⃣前言 MySQL是一种常用的关系型数据库管理系统&#xff0c;它提供了许多内置函数来处理数据。本文将介绍MySQL中的各种常用函数&#xff0c;包括字符串函数、日期函数、数学函数、聚合函数等。 文章目录 0️⃣前言1️⃣字符串函数1.1CONCAT函数1.2SUBSTRING函数1.3REPLACE函…

建设一个网站需要多长时间?

&#x1f482; 个人网站:【海拥】【游戏大全】【神级源码资源网】&#x1f91f; 前端学习课程&#xff1a;&#x1f449;【28个案例趣学前端】【400个JS面试题】&#x1f485; 寻找学习交流、摸鱼划水的小伙伴&#xff0c;请点击【摸鱼学习交流群】 目录 前言网站建设的基本步骤…

【Leetcode60天带刷】day10栈与队列—— 232.用栈实现队列,225. 用队列实现栈

题目&#xff1a; 232. 用栈实现队列 请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作&#xff08;push、pop、peek、empty&#xff09;&#xff1a; 实现 MyQueue 类&#xff1a; void push(int x) 将元素 x 推到队列的末尾int pop() 从队列的开头移…

Spring Boot 集成 Redisson分布式锁

Redisson 是一种基于 Redis 的 Java 驻留集群的分布式对象和服务库&#xff0c;可以为我们提供丰富的分布式锁和线程安全集合的实现。在 Spring Boot 应用程序中使用 Redisson 可以方便地实现分布式应用程序的某些方面&#xff0c;例如分布式锁、分布式集合、分布式事件发布和订…

旷视研究院获 CVPR 2023 自动驾驶国际挑战赛 OpenLane Topology 赛道冠军

近日&#xff0c;为期三个月的 CVPR 2023 自动驾驶国际挑战赛比赛结果揭晓。旷视研究院在OpenLane Topology 赛道中击败 30 余支国内外队伍&#xff0c;夺得冠军。 自动驾驶技术已经渗透到人们的日常生活中&#xff0c;但是传统的感知方法仍不能满足大家对 L5 级自动驾驶的追逐…

傻瓜式教程--基于FPGA的CYUSB3014双向通信

一、概述 CYUSB3014是赛普拉斯在近几年推出的新一代USB3.0的外设控制器&#xff0c;可以解决USB2.0带宽限制&#xff0c;或者单独开发USB协议和驱动的难题。赛普拉斯将CYUSB3014简称为EZ-USB FX3&#xff0c;具有高度的灵活特性&#xff0c;开发人员只需要下载FX3的固件库&…

电脑死机怎么办?试试这5个方法!

案例&#xff1a;我的电脑用着用着突然死机了&#xff0c;我的文档写到了一半没有保存&#xff0c;不知道还能不能找回&#xff1f;电脑死机了怎么办&#xff1f;有没有小伙伴有应对的方法&#xff1f; 随着电脑在我们生活中的普及和广泛应用&#xff0c;电脑死机问题也成为了…

【Python】让 plotly 可视化更上一层:cufflinks 包

文章目录 一、导读二、安装三、使用方法四、数据说明五、折线图六、散点图七、气泡图八、柱状图九、箱型图box十、直方图十一、小提琴图十二、热力图heatmap十三、3d图十四、散点矩阵图十五、子图 一、导读 今天给大家推荐一个高级的可视化神器&#xff1a;cufflinks 学习过可…

智能汽车 | 为什么是高压,为什么800V?

摘要&#xff1a; 在谈到高压储能以及高压动力电池时候&#xff0c;有提到400V的&#xff0c;800V的&#xff0c;还有光伏储能用的1500V的&#xff1b;为什么是高压&#xff1f;本文做个总结。 1、李想看高压系统架构 今春李想的发言&#xff0c;从用户需求&#xff0c;市场需…

vue elementUI封装的无限多级导航菜单(递归循环)

需要封装成两个文件&#xff1a; menu/index.vue <template><el-menuclass"box-card"unique-opened:collapse"$store.state.isCollapse":default-active"$store.state.nowPage"background-color"#2f3332"text-color"…

浅谈电力通信与泛在电力物联网技术的应用与发展

安科瑞 崔丽洁 摘要&#xff1a;随着我国社会经济的快速发展&#xff0c;我国科技实力得到了巨大的提升&#xff0c;当前互联网通信技术在社会中得到了广泛的应用。随着电力通信技术的快速发展与更新&#xff0c;泛在电力物联网建设成为电力通讯发展的重要方向。本文已泛在电力…

股票量化分析工具QTYX使用攻略——每日涨停数据选股(更新2.6.6)

搭建自己的量化系统 如果要长期在市场中立于不败之地&#xff01;必须要形成一套自己的交易系统。 如何学会搭建自己的量化交易系统&#xff1f; 边学习边实战&#xff0c;在实战中学习才是最有效地方式。于是我们分享一个即可以用于学习&#xff0c;也可以用于实战炒股分析的量…

深入剖析Java 8的Stream并行原理,加速你的程序!

大家好&#xff0c;我是小米&#xff0c;在本期技术分享中&#xff0c;我将为大家详细介绍JDK1.8中的Stream以及它的并行操作原理。Stream是Java 8引入的一个强大的数据处理工具&#xff0c;可以让我们以一种简洁、高效的方式对集合数据进行操作和处理。接下来&#xff0c;我们…

C++初阶—模板进阶

目录 1. 非类型模板参数及容器arrary 2. 模板的特化 2.1 概念 2.2 函数模板特化 2.3 类模板特化 2.3.1 全特化 2.3.2 偏特化 2.3.3 类模板特化应用示例 3. 模板分离编译 3.1 什么是分离编译 3.2 模板的分离编译 3.3 解决方法 4. 模板总结 1. 非类型模板参数及容器a…