pandas入门

news2026/2/15 11:01:54

Pandas 是在 Numpy 上的封装。继承了 Numpy 的所有优点，但是这种封装有好有坏
我们对比一下两者创建的形式和效果

import pandas as pd
import numpy as np
a=np.array([[1,2],[3,4]])
b=pd.DataFrame(
    {
        "a":[1,2],
        "b":[3,4]
    }
)
print(a,"\n",b)

在这里插入图片描述
Pandas 就像字典一样，还记录着数据的外围信息，比如标签（Column 名）和索引（Row index）

可以简单理解为Numpy 是 Python 里的列表，而 Pandas 是 Python 里的字典

Pandas 和 NumPy 都是Python中用于数据处理和分析的重要库，但它们具有不同的优点和缺点，适用于不同类型的任务和应用场景。

Pandas的优点：

表格数据处理: Pandas以DataFrame的形式支持表格型数据处理，这种结构非常适合处理多维数据，例如SQL数据库或电子表格。DataFrame允许你轻松地执行各种操作，如筛选、合并、聚合、透视等。
标签: Pandas提供了丰富的标签，可以用于行和列，使得数据的访问和操作更加直观和容易理解。
缺失数据处理: Pandas提供了有效的方法来处理缺失数据，这在实际数据分析中非常常见。你可以轻松地填充、删除或插入缺失的数据。
时间序列数据: Pandas对时间序列数据的支持非常强大，包括日期范围生成、滚动窗口、时间重采样等功能。
数据可视化: Pandas可以与其他数据可视化库（如Matplotlib和Seaborn）结合使用，以便快速生成图表和可视化数据。

Pandas的缺点：

NumPy的优点：

性能: NumPy是一个高性能的数值计算库，它用C语言编写，并且对数组操作进行了优化。对于大型数据集和数值计算任务，NumPy通常比Pandas更快。
多维数组: NumPy的核心数据结构是多维数组（ndarray），它非常适合进行数学和科学计算，如线性代数、统计分析和信号处理。
广泛的数学函数: NumPy提供了大量的数学和统计函数，包括线性代数、傅立叶变换、随机数生成等。
与其他库的集成: NumPy与许多其他科学计算库（如SciPy、scikit-learn）以及数据可视化库（如Matplotlib）紧密集成，使得它成为构建复杂数据分析和科学计算应用的基础。

NumPy的缺点：