Pandas技术重点来了

news2024/7/31 6:04:04

Pandas库建立在NumPy之上,并为Python编程语言提供了易于使用的数据结构和数据分析工具。

1.安装及调用

pip install pandas

import pandas as pd
一种能够保存任何数据类型的一维标记数组

 >>> s = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd'])

 

一种具有潜在不同类型的列的二维标记数据结构

>>> data = { 'Country' : [ 'Belgium' , 'India' , 'Brazil' ], 'Capital' : [ 'Brussels' , 'New Delhi' , 'Brasília' ], 'Population' : [11190846, 1303171035, 207847528]}
>>> df = pd.DataFrame(data, columns=[ 'Country' , 'Capital' , 'Population' ])

2.读写

 2.1读取和写到CSV

>>> pd.read_csv( 'file.csv' , header=None, nrows=5)
>>> df.to_csv( 'myDataFrame.csv',index=False )

 2.1读取和写到Excel

>>> pd.to_excel( 'dir/myDataFrame.xlsx' , sheet_name= 'Sheet1' )
>>>
>>> xlsx = pd.ExcelFile( 'file.xls' )
>>> df = pd.read_excel(xlsx, 'Sheet1' )

 3.帮助信息

>>> help(pd.Series.loc)

 4.获取元素

>>> s[ 'b' ]
-5
>>> df[1:]
  Country Capital Population
1 India New Delhi 1303171035
2 Brazil Brasília 207847528
>>> df.iloc[0][0]    # 根据索引获取第一行第一列的值
'Belgium'
>>> df.loc([0], [ 'Country' ])   # 根据标签索引获取行为0,列为“country”的值
'Belgium'
5.对接数据库
>>> from sqlalchemy import create_engine
>>> engine = create_engine( 'sqlite:///:memory:' )
>>> pd.read_sql( "SELECT * FROM my_table;" , engine)
>>> pd.read_sql_table( 'my_table' , engine)
>>> pd.read_sql_query( "SELECT * FROM my_table;" , engine)
>>> pd.to_sql( 'myDf' , engine)
6.删除
>>> s.drop([ 'a' , 'c' ])
b   -5
d    4
>>> df.drop( 'Country' , axis=1)

 7.排序

>>> df.sort_index()
>>> df.sort_values(by= 'Country' )
>>> df.rank()
8.DataFrame数据信息
>>> df.shape   # 返回行列(3,3)
>>> df.index   # 返回索引信息 RangeIndex(start=0, stop=3, step=1)
>>> df.columns  #返回 Index(['Country', 'Capital', 'Population'], dtype='object')
>>> df.info()  #返回dataframe的基本信息
>>> df.count() 
Country       3
Capital       3
Population    3

9. 信息概要

>>>df.sum()

Country              BelgiumIndiaBrazil
Capital       BrusselsNew DelhiBrasília
Population                   1522209409

>>>df.cumsum()

              Country                    Capital  Population
0             Belgium                   Brussels    11190846
1        BelgiumIndia          BrusselsNew Delhi  1314361881
2  BelgiumIndiaBrazil  BrusselsNew DelhiBrasília  1522209409

>>>df.max()

Country            India
Capital        New Delhi
Population    1303171035

>>>df.min()

Country        Belgium
Capital       Brasília
Population    11190846

>>>df.describe()

         Population
count  3.000000e+00
mean   5.074031e+08
std    6.961346e+08
min    1.119085e+07
25%    1.095192e+08
50%    2.078475e+08
75%    7.555093e+08
max    1.303171e+09

>>>df.mean()

Population    5.074031e+08

>>>df.median()

Population    207847528.0

10.函数应用

>>>f=lambda x:x*2

>>>df.apply(f)

          Country             Capital  Population
0  BelgiumBelgium    BrusselsBrussels    22381692
1      IndiaIndia  New DelhiNew Delhi  2606342070
2    BrazilBrazil    BrasíliaBrasília   415695056

11.数据计算

>>>s3 = pd.Series([7, -2, 3], index=[ 'a' , 'c' , 'd' ])
>>>s + s3
a 10.0
b NaN
c 5.0
d 7.0
>>>s.add(s3, fill_value=0)
a    10.0
b    -5.0
c     5.0
d     7.0
>>> s.sub(s3, fill_value=2)
a   -4.0
b   -7.0
c    9.0
d    1.0
>>> s.div(s3, fill_value=4)
a    0.428571
b   -1.250000
c   -3.500000
d    1.333333
>>> s.mul(s3, fill_value=3)
a    21.0
b   -20.0
c   -14.0
d    12.0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/458931.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第八届cccc团体程序设计天梯赛——个人参赛总结——无代码纯粹的参赛总结

第八届cccc团体程序设计天梯赛——个人参赛总结——无代码纯粹的参赛总结 目录 第八届cccc团体程序设计天梯赛——个人参赛总结——无代码纯粹的参赛总结引言~介绍一下cccc天梯赛(选读)开篇介绍(以下是个人经历部分的分享)赛前准备…

其他品牌的触控笔能用在ipad上?性价比高的触控笔合集

随着平板电脑在学校、办公室等领域的广泛应用,越来越多的人需要一支出色的电容笔。虽然苹果原装的电容笔很给力,但是其的价格实在是太贵了,仅仅把它用于在纸上写写字,实在是太可惜了。所以,哪个电容笔更便宜&#xff1…

密歇根大学Python系列之一:零基础 Python 入门

密歇根大学计算机专业注重将计算机科学理论与实践相结合,旨在帮助学生全面掌握计算机科学的基础理论和实践技能: 1.计算机程序设计:编程技能和常见编程语言,如C和Java和Python等; 2.数据结构和算法:数据结…

2023年能源与环境工程国际会议(CFEEE 2023)

会议简介 Brief Introduction 2023年能源与环境工程国际会议(CFEEE 2023) 会议时间:2023年9月1日-3日 召开地点:中国三亚 大会官网:CFEEE 2023-2023 International Conference on Frontiers of Energy and Environment Engineering 由三亚纵横…

手撕八大排序算法(解析源码+图解)

八大排序算法 文章目录 八大排序算法一、插入排序1.代码实现2.思路图解 二、希尔排序1.代码实现2.思路图解 三、选择排序(优化版)1.代码实现2.思路图解 四、堆排序1.代码实现2.思路图解 五、冒泡排序1.代码实现2.思路图解 六、快速排序1.递归版本2.非递归版本3.快速排序的两个优…

Android之 Bitmap使用

一,简介 1.1 Bitmap是一种图片在内存中的表现形式,不管是png,还是jpg最终都是以bitmap的形式显示到控件上面。 Bitmap是一种位图,位图​是点阵图像​或栅格图像,是由称作像素(图片元素)的单个…

C++篇----类、封装、类访问权限、类实例化

文章目录 一、面向过程和面向对象二、类 一、面向过程和面向对象 c语言是面向过程的编程语言 c是面向对象的编程语言 面向过程:关注过程,对于求解问题的不走,调用函数逐步解决问题 就洗衣服来说:洗衣服需要放水,倒洗衣…

PCL点云库(2) — IO模块

目录 2.1 IO模块接口 2.2 PCD数据读写 (1) PCD数据解析 (2)PCD文件读写示例 2.3 PLY数据读写 (1)PLY数据解析 (2)PLY文件读写示例 2.4 OBJ数据读写 (1&#xff…

QMS-云质说质量 - 10 我和我的客户投诉(2) - 客户逐利 驱除良币

云质QMS原创 转载请注明来源 作者:王洪石 上策伐谋 中策伐交 前面发过一篇关于客户投诉的文章“逢年过节要祈祷”,引起了很多质量人的共鸣,特别是汽车零部件行业曾经和正在负责客诉的质量同行们。 真实的产品质量问题,是否发生只…

Linux-初学者系列2——用户组管理和权限管理

用户组管理和权限管理 Linux-初学者系列2_用户组管理和权限管理一、所有者1、查看文件的所有者指令 2、修改文件所有者指令实操 二、组创建语法指令:实操: 三、所在组1、查看文件/目录所在组基本指令:实操: 2、修改文件所在组基本…

【读书笔记】高效能人士的7个习惯

高效能人士的7个习惯-史蒂芬柯维 个人成功1. 积极主动(BE PROACTIVE)2. 以终为始(BEGIN WITH THE END IN MIND)3. 要事第一(PUT FIRST THINGS FIRST)个人成功总结 集体成功4. 双赢思维(THINK WI…

flex布局属性详解

Flex布局 flex-directionflex-wrapflex-flowjustify-contentalign-itemsalign-content其他orderflexalign-self 含义:Flex是Flexible Box的缩写,意为”弹性布局”,用来为盒状模型提供最大的灵活性。 flex-direction flex-direction属性决定主轴的方向&…

服务(第十二篇)LVS-DR模式

数据包流向分析: (1)客户端发送请求到 Director Server(负载均衡器),请求的数据报文(源 IP 是 CIP,目标 IP 是 VIP)到达内核空间。 (2)Director Server 和 Re…

022 - C++ 析构函数

上期我们讨论了构造函数。认识了它是什么以及如何使用它。如果你没有看上一期,那么你一定要回去看一下。 今天我们要讨论一下它的“孪生兄弟”,析构函数,它们在某些方面非常相似。 构造函数是你创建一个新的实例对象时运行,而析…

无线测温系统在煤矿高压电气设备上的应用

摘要:随着社会经济的不断发展,电力系统向着高电压、高容量的方向前进着,电力系统全新的技术与设备层出不穷,电力的输送能力不断提升。然而,高压电气设备承载的高压电力负荷也让其自身的温升问题成为了威胁电网稳定的元…

张驰咨询:企业如何在不确定的环境中逆势增长?

企业不确定环境主要包括以下几个方面: 1、宏观经济环境的不确定性 包括国内外经济形势、政策调整、外汇汇率等因素的变化,会对企业的发展带来不确定性。 2、市场需求的不确定性 市场需求的变化,包括消费者需求、市场规模、市场结构等方面…

【自制键盘01】CH9329代码两则,让任何单片机都能做键盘

简介 CH9329是一款由WCH(Nanjing QinHeng Electronics Co. Ltd.)生产的USB转串口芯片,可以方便地将USB接口转换为串口接口,它在键盘设计这块可以实现作为MCU和电脑设备的“中间人”,把串口信号转换为按键。 引脚定义 …

如何实现电脑通过手机上网?1分钟搞定!

案例:电脑没网时,如何通过手机上网? 【想用电脑看电影,但是附近没有Wi-Fi。朋友说可以说电脑可以通过手机上网,但我们都不知道具体如何操作,有没有小伙伴可以教教我们。】 在没有Wi-Fi或有线网络接入时&a…

《Left ventricular hypertrophy detection using electrocardiographic signal》阅读笔记

论文的摘要 Left ventricular hypertrophy (LVH) indicates subclinical organ damage, associating with the incidence of cardiovascular diseases. From the medical perspective, electrocardiogram (ECG) is a low-cost, non-invasive, and easily reproducible tool th…

低代码平台-宜搭的核心概念

宜搭的核心概念 文章目录 全局变量基本的变量使用查看输出内容以及调试方式事件绑定页面生命周期条件渲染循环渲染自定义样式表单校验 全局变量 在左侧数据源中添加变量,添加变量的写法和js的写法一致。 基本的变量使用 给文本绑定数据源,点击左侧刚才定…