029—pandas 遍历行非向量化修改数据

news2026/2/13 16:21:06

前言

在 pandas 中，向量化计算是指利用 pandas 对象的内置方法和函数，将操作应用到整个数据结构的每个元素，从而在单个操作中完成大量的计算。
但在一些需求中，我们无法使用向量化计算，就需要迭代操作，本例就是这样的一种情况。

需求：

第一行的值为所在行的 a + b
第二行及以后的值为上一行的 c + a

思路：

本例不是一个向量化的计算，因为第一行的计算逻辑与其他行的计算逻辑不同。针对，这样的情况，我们可以用迭代的方法进行灵活的操作。
先根据第一行的计算逻辑增加 c 列，然后迭代并排除第一行，对其他行按计算逻辑进行修改。

二、使用步骤

读入数据

代码如下（示例）：

import pandas as pd

df = pd.DataFrame({'a': [5, 6, 7], 'b': [3, 5, 8]})
df

在这里插入图片描述

# 按第一行的计算逻辑增加 c 列：
df['c'] = df.a+df.b
df

在这里插入图片描述

# 迭代计算修改其他行：
# 遍历df的每一行，返回一个命名元组，命名元组的字段包括Index和DataFrame中的各列
for i in df.itertuples():
    if i.Index != 0:
        df.loc[i.Index, 'c'] = i.a + df.loc[i.Index-1, 'c'] # 当前行的'a'列值与上一行的'c'列值相加，并将结果赋值给当前行的'c'列

# 以上代码，df.itertuples() 产生一个可迭代 map 对象，每行是一个 namedtuple 类型数据。即：

for i in df.itertuples():
    print(i)

在这里插入图片描述

# 接着判断如果索引不是第一行（值为 0）就用 loc 获取定位并进行修改，最后得到的数据为：

df

在这里插入图片描述

总结

以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1521147.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

029—pandas 遍历行非向量化修改数据

前言

需求：

思路：

二、使用步骤

读入数据

总结

相关文章

【研发日记】Matlab/Simulink技能解锁(二)——在Matlab Function编辑窗口Debug

AI - 决策树模型

如何在CasaOS系统玩客云中安装内网穿透工具实现远程访问内网主机下载资源

【SpringCloud微服务实战07】Sentinel 服务保护

动态库和静态库的新理解

分布式调用与高并发处理（二）| Dubbo

[ C++ ] STL---string类的使用指南

Linux课程_____用户的管理

Arduino IDE的下载和安装

mysql5.7离线安装 windows

CTF-希尔加解密

PHP异世界云商系统开源源码

【python】自动化工具Selenium与playwright去除webdriver检测

Docker基本配置及使用

C++进阶：详解多态（多态、虚函数、抽象类以及虚函数原理详解）

P3374 【模板】树状数组动态求连续区间和刷题笔记

NVENC 视频编码器 API 编程指南 ( 中文转译 )

低压保护测控产品解决方案【Acrel-2000M马达监控系统】

数位排序——数组及lambda表达式应用

从零开始利用MATLAB进行FPGA设计（四）生成优化HDL代码