Pandas **Series**

news2025/4/2 6:05:06

以下是关于 Pandas Series 的从入门到精通的系统指南,包含核心概念、操作技巧和实战示例:


1. 入门篇:基础操作

1.1 创建Series
import pandas as pd

# 从列表创建
s1 = pd.Series([1, 3, 5, 7, 9])  # 默认数字索引
s2 = pd.Series([10, 20, 30], index=['a', 'b', 'c'])  # 自定义索引

# 从字典创建(自动将键作为索引)
data_dict = {'a': 10, 'b': 20, 'c': 30}
s3 = pd.Series(data_dict)
1.2 查看基本属性
print(s2.values)   # 输出值数组:[10, 20, 30]
print(s2.index)    # 输出索引:Index(['a', 'b', 'c'], dtype='object')
print(s2.dtype)    # 数据类型:int64
print(s2.shape)    # 形状:(3,)
print(s2.size)     # 元素数量:3
1.3 索引与切片
# 按位置索引(类似列表)
print(s2[0])       # 输出:10

# 按标签索引
print(s2['b'])     # 输出:20

# 切片(包含结束位置)
print(s2[1:3])     # 输出:b=20, c=30
print(s2['a':'c']) # 标签切片包含'c'

# 布尔索引
print(s2[s2 > 15]) # 输出值大于15的元素
1.4 修改索引和值
s2.index = ['x', 'y', 'z']  # 修改索引
s2['x'] = 100               # 修改单个值
s2.replace(20, 200, inplace=True)  # 替换值

2. 进阶篇:数据处理

2.1 处理缺失值
s4 = pd.Series([1, None, 3, np.nan, 5])

# 检测缺失值
print(s4.isna())   # 返回布尔Series

# 删除缺失值
s4_drop = s4.dropna()

# 填充缺失值
s4_fill = s4.fillna(0)          # 填充0
s4_ffill = s4.fillna(method='ffill')  # 前向填充
2.2 向量化操作
# 直接数学运算
s5 = s2 * 2              # 每个元素乘以2
s6 = s2 + pd.Series([1, 2, 3], index=['x', 'y', 'z'])  # 按索引对齐运算

# 使用NumPy函数
import numpy as np
s7 = np.sqrt(s2)         # 对每个元素开平方
2.3 统计计算
print(s2.mean())         # 平均值
print(s2.sum())          # 总和
print(s2.value_counts()) # 值频次统计(适用于离散值)
print(s2.describe())     # 快速统计摘要(均值、标准差、分位数等)
2.4 应用自定义函数
# 使用apply
s8 = s2.apply(lambda x: x**2 + 1)

# 使用map(元素级转换)
s9 = s2.map({10: 'low', 20: 'mid', 30: 'high'})  # 映射替换

3. 精通篇:高级技巧

3.1 时间序列处理
# 创建时间序列
dates = pd.date_range('2023-01-01', periods=5)
s_time = pd.Series([10, 20, 15, 30, 25], index=dates)

# 按时间重采样
s_resampled = s_time.resample('W').mean()  # 按周平均
3.2 分类数据优化
# 转换为分类类型(减少内存)
s_cat = pd.Series(['apple', 'banana', 'apple', 'orange'], dtype='category')
3.3 多层索引(MultiIndex)
arrays = [['A', 'A', 'B', 'B'], [1, 2, 1, 2]]
multi_index = pd.MultiIndex.from_arrays(arrays, names=('group', 'subgroup'))
s_multi = pd.Series([10, 20, 30, 40], index=multi_index)

# 按层级访问
print(s_multi.loc['A', 1])  # 输出:10
3.4 与DataFrame交互
# 从DataFrame中提取列(本质是Series)
df = pd.DataFrame({'A': [1, 2, 3], 'B': ['x', 'y', 'z']})
s_from_df = df['A']

# 将Series转换为DataFrame
df_from_s = s2.to_frame(name='values')

4. 实战技巧

4.1 高效过滤
# 多条件筛选
s_filtered = s2[(s2 > 15) & (s2.index != 'z')]
4.2 性能优化
# 避免循环,使用向量化操作
s_squared = s2 ** 2  # 比apply快10倍以上

# 使用eval表达式(适用于大型数据)
s_result = pd.eval('s2 * 2 + 5')
4.3 合并Series
s10 = pd.Series([100, 200], index=['x', 'y'])
combined = pd.concat([s2, s10], axis=0)  # 纵向合并

5. 常见问题

5.1 索引自动对齐
s11 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s12 = pd.Series([4, 5, 6], index=['b', 'c', 'd'])
s_sum = s11 + s12  # 结果:a=NaN, b=6, c=8, d=NaN
5.2 处理重复索引
s_dup = pd.Series([10, 20, 30], index=['a', 'a', 'b'])
s_unique = s_dup[~s_dup.index.duplicated()]  # 保留第一个重复索引

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2325303.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Kafka 多线程开发消费者实例

目前,计算机的硬件条件已经大大改善,即使是在普通的笔记本电脑上,多核都已经是标配了,更不用说专业的服务器了。如果跑在强劲服务器机器上的应用程序依然是单线程架构,那实在是有点暴殄天物了。不过,Kafka …

Linux线程池实现

1.线程池实现 全部代码&#xff1a;whb-helloworld/113 1.唤醒线程 一个是唤醒全部线程&#xff0c;一个是唤醒一个线程。 void WakeUpAllThread(){LockGuard lockguard(_mutex);if (_sleepernum)_cond.Broadcast();LOG(LogLevel::INFO) << "唤醒所有的休眠线程&q…

Linux《进程概念(上)》

在之前的Linux学习当中我们已经了解了基本的Linux指令以及基础的开发工具的使用&#xff0c;那么接下来我们就要开始Linux当中一个非常重要的部分的学习——进程&#xff0c;在此进程是我们之后Linux学习的基础&#xff0c;并且通过进程的学习会让我们了解更多的操作系统的相关…

【算法】并查集基础讲解

一、定义 一种树型的数据结构&#xff0c;用于处理一些不相交集合的合并及查询问题。思想是用一个数组表示了整片森林&#xff08;parent&#xff09;&#xff0c;树的根节点唯一标识了一个集合&#xff0c;只要找到了某个元素的的树根&#xff0c;就能确定它在哪个集合里。 …

C++ STL常用算法之常用集合算法

常用集合算法 学习目标: 掌握常用的集合算法 算法简介: set_intersection // 求两个容器的交集 set_union // 求两个容器的并集 set_difference // 求两个容器的差集 set_intersection 功能描述: 求两个容器的交集 函数原型: set_intersection(iterator beg1, iterat…

日程公布| 第八届地球空间大数据与云计算前沿大会与集中学习(3号通知)

日程公布| 第八届地球空间大数据与云计算前沿大会与集中学习&#xff08;3号通知&#xff09; 日程公布| 第八届地球空间大数据与云计算前沿大会与集中学习&#xff08;3号通知&#xff09;

Linux C语言调用第三方库,第三方库如何编译安装

在 Linux 环境下使用 C 语言调用第三方库时&#xff0c;通常需要先对第三方库进行编译和安装。以下为你详细介绍一般的编译安装步骤&#xff0c;并给出不同类型第三方库&#xff08;如使用 Makefile、CMake 构建系统&#xff09;的具体示例。 一般步骤 1. 获取第三方库源码 …

leetcode -编辑距离

为了求解将 word1 转换成 word2 所需的最少操作数&#xff0c;可以使用动态规划。以下是详细的解决方案&#xff1a; ### 方法思路 1. **定义状态** dp[i][j] 表示将 word1 的前 i 个字符转换成 word2 的前 j 个字符所需的最少操作数。 2. **状态转移方程** - 如果 word1[…

字节开源版Manus来袭

字节开源版Manus来袭 项目地址&#xff1a;https://github.com/langmanus/langmanus/blob/main/README_zh.md 在人工智能领域&#xff0c;Manus的出现无疑是一颗重磅炸弹&#xff0c;它凭借强大的通用Agent能力&#xff0c;迅速吸引了全球开发者和AI爱好者的目光。然而&#…

论文阅读笔记——PointVLA: Injecting the 3D World into Vision-Language-Action Models

PointVLA 论文 现有的 VLA 基于 2D 视觉-语言数据表现良好但缺乏 3D 几何先验导致空间推理缺陷。传统方案&#xff1a;1&#xff09;3D->2D 投影&#xff0c;造成几何信息损失&#xff1b;2&#xff09;3D 数据集少。PointVLA 保留原有 VLA&#xff0c;提取点云特征&#xf…

在win11 环境下 新安装 WSL ubuntu + 换国内镜像源 + ssh + 桌面环境 + Pyhton 环境 + vim 设置插件安装

在win11 环境下 新安装 WSL ubuntu ssh gnome 桌面环境 Pyhton 环境 vim 设置插件安装 简单介绍详细流程换国内镜像源安装 ssh 桌面环境python 环境vim 设置插件安装 简单介绍 内容有点长&#xff0c;这里就先简单描述内容了。主要是快速在 Win11 搭建一个 wsl 的 linux 环…

基于springboot课程学习与互动平台(源码+lw+部署文档+讲解),源码可白嫖!

摘要 随着我国经济的高速发展与人们生活水平的日益提高&#xff0c;人们对生活质量的追求也多种多样。尤其在人们生活节奏不断加快的当下&#xff0c;人们更趋向于足不出户解决生活上的问题&#xff0c;线上管理系统展现了其蓬勃生命力和广阔的前景。与此同时&#xff0c;在此…

通俗易懂的大模型原理

十分钟揭秘DeepSeek原理&#xff0c;通俗易懂的大语言模型科普&#xff01;_哔哩哔哩_bilibili 最基础原理&#xff0c;x是输入&#xff0c;y是输出。上百万和上百亿的参数 将一句话转化为数字向量 一句话就是向量矩阵 输入矩阵和参数矩阵进行计算得出输出矩阵&#xff0c;因为…

热门索尼S-Log3电影感氛围旅拍LUTS调色预设 Christian Mate Grab - Sony S-Log3 Cinematic LUTs

热门索尼S-Log3电影感氛围旅拍LUTS调色预设 Christian Mate Grab – Sony S-Log3 Cinematic LUTs 我们最好的 Film Look S-Log3 LUT 的集合&#xff0c;适用于索尼无反光镜相机。无论您是在户外、室内、风景还是旅行电影中拍摄&#xff0c;这些 LUT 都经过优化&#xff0c;可为…

【jQuery】插件

目录 一、 jQuery插件 1. 瀑布流插件&#xff1a; jQuery 之家 http://www.htmleaf.com/ 2. 图片懒加载&#xff1a; jQuery 插件库 http://www.jq22.com/ 3. 全屏滚动 总结不易~ 本章节对我有很大收获&#xff0c;希望对你也是~~~ 一、 jQuery插件 jQuery 功能…

MATLAB导入Excel数据

假如Excel中存在三列数据需要导入Matlab中。 保证该Excel文件与Matlab程序在同一目录下。 function [time, voltage, current] test(filename)% 读取Excel文件并提取时间、电压、电流数据% 输入参数:% filename: Excel文件名&#xff08;需包含路径&#xff0c;如C:\data\…

孤码长征:破译PCL自定义点云注册机制源码迷局——踩坑实录与架构解构

在之前一个博客《一文搞懂PCL中自定义点云类型的构建与函数使用》中&#xff0c;清晰地介绍了在PCL中点云的定义与注册方法。我的一个读者很好奇其内部注册的原理以及机制&#xff0c;再加上最近工作中跟猛男开发自定义点云存储的工作&#xff0c;借着这些需求&#xff0c;我也…

Centos 7 搭建 jumpserver 堡垒机

jumpserver 的介绍 1、JumpServer 是完全开源的堡垒机, 使用 GNU GPL v2.0 开源协议, 是符合4A 的专业运维审计系统 1)身份验证 / Authentication 2)授权控制 / Authorization 3)账号管理 / Accounting 4)安全审计 / Auditing 2、JumpServer 使用 Python / Django 进行开…

封装了一个优雅的iOS全屏侧滑返回工具

思路 添加一个全屏返回手势&#xff0c;UIPangesturerecognizer, 1 手势开始 在手势开始响应的时候&#xff0c;将navigationController的delegate代理设置为工具类&#xff0c;在工具类中执行代理方法&#xff0c;- (nullable id )navigationController:(UINavigationControll…

HCIP-6 DHCP

HCIP-6 DHCP DHCP&#xff08;Dynamic Host Configuration Protocol&#xff0c;动态主机配置协议&#xff09; 手工配置网络参数存在的问题 灵活性差 容易出错 IP地址资源利用率低 工作量大 人员素质要求高 DHCP服务器按照如下次序为客户端选择IP地址: ①DHCP服务器的数…