[Pandas] 构建DataFrame数据框

news2026/2/12 14:36:04

DataFrame是二维数据结构，数据以行和列的形式排列

构建DataFrame最基本的定义格式如下

df = pd.DataFrame(data=None, index=None, columns=None)

参数说明

data: 具体数据

index: 行索引，如果没有指定，会自动生成RangeIndex(0,1,2,...,n)

columns: 列索引(表头)，如果没有指定，会自动生成RangeIndex(0,1,2,...,n)

我们可以直接使用pd.DataFrame()创建一个空的DataFrame数据框

import pandas as pd
df = pd.DataFrame()
'''
Empty DataFrame
Columns: []
Index: []
'''
print(df)

以下给出常用的构建DataFrame数据框的方法

方法1: 使用字典dict构建DataFrame数据框

字典中的键为列名，值一般为一个列表、元组或ndarray数组对象，是具体的数据

import pandas as pd
import numpy as np

data = {'a':[1, 2, 3, 4],  # 列表
        'b':(4, 5, 6, 7),  # 元组
        'c':np.array([8, 9, 10, 11])  # ndarry数组
}
# 创建Dataframe
df1 = pd.DataFrame(data)

df1

可以看到，一个新的DataFrame数据框已经创建成功了，系统默认为我们生成了行索引，而列索引就是字典dict里的key，我们也可以在创建Dataframe时手动指定行索引，只需修改参数index即可

import pandas as pd
import numpy as np

data = {'a':[1, 2, 3, 4],  # 列表
        'b':(4, 5, 6, 7),  # 元组
        'c':np.array([8, 9, 10, 11])  # ndarry数组
}
# 创建Dataframe
df1 = pd.DataFrame(data,index=['one','two','three','four'])

df1

我们也可以使用Series组成的字典构建DataFrame数据框

字典里的一个键值对为一列数据，键为列名，值是一个Series

import pandas as pd

data = {"x": pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']), 
        "y": pd.Series([5, 6, 7, 8], index=['a', 'b', 'c', 'd'])}

# 创建DataFrame
df2 = pd.DataFrame(data)

df2

方法2: 使用列表构建Dataframe数据框

我们可以使用字典组成的列表构建DataFrame，每个字典是一行数据

import pandas as pd

# 定义一个字典列表
data = [{'x':1, 'y':2, 'z':3},
        {'x':4, 'y':5, 'z':6}]

# 创建DataFrame
df3 = pd.DataFrame(data, index=['a','b'])

df3

我们也可以使用二维列表创建DataFrame数据框

import pandas as pd
data = [['Alex',10],['Bob',12],['Clarke',13]]
df4 = pd.DataFrame(data,columns=['Name','Age'])

df4

提示Tips

在实际业务中一般不需要我们来生成数据，而是有已经采集好的数据集，直接加载到DataFrame即可

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/483615.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

[Pandas] 构建DataFrame数据框

相关文章

mongoose使用详细 -- 如何通过mongoose搭建服务器

[Pandas] 查看DataFrame的常用属性

C++练级之初级：第六篇

【JavaEE】_1.多线程（1）

【数据结构】八大排序(一)

【刷题之路Ⅱ】LeetCode 61. 旋转链表

【Python | matplotlib】matplotlib.cm的理解以及举例说明

软件工程实验：原型设计

深入探索PyTorch中的自动微分原理及梯度计算方法

如何完全卸载linux下通过rpm安装的mysql

Tomcat整体架构解析

电话号码的字母组合

【Linux专区】环境搭建 | 带你白嫖七个月阿里云服务器

物联网系统中常见的通信协议分析

[架构之路-185]-《软考-系统分析师》-3-操作系统基本原理 - 文件索引表

CSI指纹预处理（中值、均值、Hampel、小波滤波）

云原生Istio架构和组件介绍

Eclipse改SSH项目，修改java代码无效

LeetCode279之完全平方数(相关话题：动态规划，四平方和定理)

【Android构建篇】MakeFile语法