Pandas的基础应用

news2024/11/25 16:26:20

Pandas 介绍

在这里插入图片描述

Pandas 是一个用于数据操作和分析的强大 Python 库,在数据科学和机器学习领域广泛使用。要有效地使用 Pandas,理解一些关键概念非常重要,如坐标轴(axis)、索引(index)、行(row)和列(column)。Pandas 处理数据非常方便,可以快速的导入数据并对数据做相应的处理。

Pandas 中的关键概念

轴(Axis): Pandas 对象(DataFrame 和 Series)有两个主要的轴。

  • 轴 0(Axis 0):指的是行(也称为“索引”轴)。
  • 轴 1(Axis 1):指的是列。
  • 可以沿着特定的轴应用操作,如sum()、mean() 等。
#例如有下面一个 dataframe

import pandas as pd

data = {
    'total': [10, 10]
}


df = pd.DataFrame(data)

df


df.sum(axis=0)  # 每列的总和(默认)
df.sum(axis=1)  # 每行的总和

索引(Index): 索引是唯一标识 DataFrame 中每一行中每个元素的标签。它作为行标签,提供访问行的方法。
索引可以是一维的,可以是唯一的或非唯一的。DataFrame 还可以有多级索引(MultiIndex)以进行更复杂的数据操作。


df.index  # 访问 DataFrame 的索引
df.set_index('column_name')  # 设置特定列为索引

行(Row):

  • 行表示 DataFrame 中的单个观察值或数据点。
  • 可以使用索引标签或数字索引访问行。
  • 可以使用 loc[] 或 iloc[]方法对行进行操作。
import pandas as pd

data = {
    'name': ['张三', '李四'],
    'product': ['iPhone', 'Xiaomi'],
    'total': [10, 10]
}


df = pd.DataFrame(data)

df['index'] = ['2024-05-21', '2024-05-22']

# Set the new column as the index
df.set_index('index', inplace=True)


df.loc['2024-05-21'] # 按索引标签访问第一行

df.iloc[0] # 按数字索引访问第一行

列(Column):

  • 列表示 DataFrame 中的单个特征或变量。
  • 可以使用列标签访问列。
  • 可以选择、添加或删除列。
  • 通过lambda 函数创建新列,以应对复杂的业务场景。
import pandas as pd

def combine(a, b):
    return a + b
data = {
    'name': ['张三', '李四'],
    'product': ['iPhone', 'Xiaomi'],
    'amount': [10, 10],
    'price': [100, 101]
}


df = pd.DataFrame(data)

df['index'] = ['2024-05-21', '2024-05-22']

# Set the new column as the index
df.set_index('index', inplace=True)

df['name'] # 访问单个列

df[['name', 'amount']]# 访问多个列

df['total']  = df['amount'] * df['price']  # 创建新列

df.drop('total', axis=1, inplace = True)  # 删除列

df['total'] = df.apply(lambda x: combine(x['name'], x['product']), axis=1) #调用方法

df

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1689262.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

windows平台vcpkg安装

1. 克隆vcpkg仓库 git clone https://github.com/microsoft/vcpkg 2.运行bootstrap-vcpkg.bat下载vcpkg.exe 3.运行验证 4.使用VCPKG安装OPENSSL 5.安装成功

RDDM论文阅读笔记

CVPR2024的残差去噪模型。把diffusion 模型的加噪过程分解为残差diffusion和noise diffusion,其中残差diffusion模拟从target image到degraded image的过程,而noise diffusion则是原来的diffusion过程,即从图片到高斯噪声的加噪过程。前者可以…

python批发模块的调试之旅:从新手到专家的蜕变

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、调试技巧的重要性 二、批发模块调试的实战演练 1. 设置断点 2. 逐行执行代码 3. 观察…

XSS---DOM破坏

文章目录 前言一、pandas是什么&#xff1f;二、使用步骤 1.引入库2.读入数据总结 一.什么是DOM破坏 DOM破坏总结为一句话就是&#xff1a;利用HTML元素来响应JS代码的执行结果。 举个例子&#xff1a; <body> <img id"x"> <img name"y"…

网络模型-PoE技术

一、PoE简介 以太网供电PoE(Powerover Ethernet)是指通过以太网网络进行供电&#xff0c;也被称为基于局域网的供电系统PoL(PoweroverLAN)或有源以太网(Active Ethernet)。 1、PoE的优势: 可靠: 电源集中供电&#xff0c;备份方便。连接简捷: 网络终端不需外接电源&#xf…

《web应用设计》第八次作业

我的小组长是姚若希&#xff0c;我们组课程设计的题目是&#xff1a;学生管理系统 &#xff0c;我认领的功能模块是&#xff1a;课程管理 2.查询并分页

这所211专硕22408复试线310分,学硕收调剂!辽宁大学计算机考研考情分析!

辽宁大学信息学院下设计算机科学与技术、电子信息科学与技术、通信工程、信息管理与信息系统、软件工程5个本科专业&#xff0c;有计算机软件与理论、计算机应用技术2个硕士学位授权点&#xff0c;软件工程和计算机技术两个专业硕士学位点&#xff0c;1个计算机应用研究所、1个…

信息化项目交付验收流程管理办法

项目交付验收流程制度 管理办法 (执行版) (文件编号: ) 编制: 审核: 批准: 版本: 生效日期: 管理办法概述 制定目的为了保证公司在建项目交付验收工作事项的顺利开展,保证交付验收进度及…

力扣652. 寻找重复的子树

Problem: 652. 寻找重复的子树 文章目录 题目描述思路复杂度Code 题目描述 思路 1.利用二叉树的后序遍历将原始的二叉树序列化&#xff08;之所以利用后序遍历是因为其在归的过程中是会携带左右子树的节点信息,而这些节点信息正是该解法要利用的东西&#xff09;&#xff1b; 2…

【EXCEL_VBA_基础知识】15 使用ADO操作外部数据

课程来源&#xff1a;王佩丰老师的《王佩丰学VBA视频教程》&#xff0c;如有侵权&#xff0c;请联系删除&#xff01; 目录 1. 使用ADO链接外部数据源 2. 常用SQL语句&#xff08;Execute(SQL语句)&#xff09; 2.1 查询数据、查询某几个字段、带条件查询、合并两表数据、插…

【撸源码】【ThreadPoolExecutor】线程池的工作原理深度解析——上篇

1. 前言 线程池这块&#xff0c;作为高频面试题&#xff0c;并且实际使用场景巨多&#xff0c;所以出了这篇文章&#xff0c;一块来研究一下线程池的实现原理&#xff0c;运行机制&#xff0c;从底层深挖&#xff0c;不再局限于面试题。 2. 线程池概览 2.1. 构造器 线程池总…

DSPF网络类型实验1

对R6配置 对R1配置 对R2 对R3 对R4 对R5 对R1R2R3R4R5加用户 环回处理 然后开始配置缺省 R1有两个下一跳 3&#xff0c;4&#xff0c;5同R2 然后对R1 dynamic动态 对R2 手写 把注册加上 register R3同R2处理

邮件群发效果提升攻略:揭秘影响因素与解决方案

邮件群发在现代营销中扮演着重要角色&#xff0c;但要确保邮件成功送达收件人的收件箱&#xff0c;需要注意多个因素。从发件人、互联网客户服务器邮件过滤到收件人反馈&#xff0c;每个环节都可能对最终效果产生重要影响。本文针对这些影响因素的详细分析&#xff0c;以及U-Ma…

zabbix“专家坐诊”第239期问答

问题一 Q&#xff1a;snmptrap配置触发器后&#xff0c;接口告警触发时候&#xff0c;一个接口告警恢复了&#xff0c;其他接口告警也被误恢复&#xff0c;这个有啥方法规避吗&#xff1f; A&#xff1a;可以参考一下这个&#xff0c;根据自动发现的名称来识别。 Q&#xff1a…

【pyspark速成专家】3_Spark之RDD编程1

目录 ​编辑 一&#xff0c;创建RDD 二&#xff0c;常用Action操作 三&#xff0c;常用Transformation操作 一&#xff0c;创建RDD 创建RDD主要有两种方式&#xff0c;一个是textFile加载本地或者集群文件系统中的数据&#xff0c; 第二个是用parallelize方法将Driver中的…

UWB论文:Introduction to Impulse Radio UWB Seamless Access Systems(2):脉冲;超宽带;测距;定位

3) 测距/接收器 像全球定位系统&#xff08;GPS&#xff09;这样的系统依赖于单向测距One Way Ranging&#xff08;OWR&#xff09;&#xff0c;其中多个卫星&#xff08;代表固定节点&#xff0c;称为锚点anchors&#xff09;定期传输同步的无线电数据包集合&#xff0c;这允许…

C++ 写的_string类,兼容std::string, MFC CString和 C# 的string

代码例子&#xff1a; using namespace lf; int main() { CString s1 _t("http://www.csdn.net"); _string s2 s1; CString s3 s2; _pcn(s1); _pcn(s2); _pcn(s3); return 0; } 输出&#xff1a; _Str.h /***************************************…

一个开源的工具类轮子是怎么造出来的

心路历程 为什么要做 在22年9月的某一天&#xff0c;在公司开需求评审时&#xff0c;接到了一个给PDF、图片添加水印的需求。做为一个刚工作的CURD程序员&#xff0c;在遇到这些问题时&#xff0c;第一反应是去github上找找有没有类似的开源框架。但是&#xff0c;出乎我意料…

JUnit5标记测试用例

使用场景&#xff1a; 通过Tag对用例分组&#xff1a; 环境分组&#xff1a;测试环境、预发布环境阶段分组&#xff1a;冒烟用例版本分组&#xff1a;V1.1、V1.2 Tag标记用例&#xff1a; 设置标签根据标签执行 结合Maven执行结合测试套件执行 设置标签&#xff1a; 通过T…

小皮面板中访问不了本地的sqli网站---解决方法

今天想在sqli-labs中做题&#xff0c;却发现自己访问不了网站 1、具体的错误原因如下 2、查了一下&#xff0c;可能是因为自己访问的域名不对 3、修改了域名为&#xff1a;http://sqli-labs:81/Less-2/便可以访问了 4、然后接下来我有遇到一个错误&#xff0c;这个问题是php版…