Python大数据之pandas快速入门(一)

news2026/2/16 11:34:18

文章目录

pandas快速入门
- 学习目标
- 1. DataFrame 和 Series 简介
- 2. 加载数据集(csv和tsv)
- - 2.1 csv和tsv文件格式简介
  - 2.2 加载数据集(tsv和csv)

pandas快速入门

学习目标

能够知道 DataFrame 和 Series 数据结构
能够加载 csv 和 tsv 数据集
能够区分 DataFrame 的行列标签和行列位置编号
能够获取 DataFrame 指定行列的数据

1. DataFrame 和 Series 简介

pandas是用于数据分析的开源Python库，可以实现数据加载，清洗，转换，统计处理，可视化等功能。

pandas最基本的两种数据结构：

1）DataFrame

用来处理结构化数据（SQL数据表，Excel表格）
可以简单理解为一张数据表(带有行标签和列标签)

2）Series

用来处理单列数据，也可以以把DataFrame看作由Series对象组成的字典或集合
可以简单理解为数据表的一行或一列

2. 加载数据集(csv和tsv)

2.1 csv和tsv文件格式简介

csv 和 tsv 文件都是存储一个二维表数据的文件类型。

注意：其中csv文件每一列的列元素之间以逗号进行分割，tsv文件每一行的列元素之间以\t进行分割。

2.2 加载数据集(tsv和csv)

1）首先打开jupyter notebook，进入自己准备编写代码目录下方，创建01-pandas快速入门.ipynb文件：

注意：提前将提供的 data 数据集目录放置到 01-pandas快速入门.ipynb 同级目录下，后续课程会加载 data 目录下的数据集。

2）导入 pandas 包

注意：pandas 并不是 Python 标准库，所以先导入pandas

# 在 ipynb 文件中导入 pandas
import pandas as pd

3）加载 csv 文件数据集

tips = pd.read_csv('./data/tips.csv')
tips

4）加载 tsv 文件数据集

# sep参数指定tsv文件的列元素分隔符为\t，默认sep参数是,
china = pd.read_csv('./data/china.tsv', sep='\t')
china

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1050514.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Python大数据之pandas快速入门(一)

文章目录

pandas快速入门

学习目标

1. DataFrame 和 Series 简介

2. 加载数据集(csv和tsv)

2.1 csv和tsv文件格式简介

2.2 加载数据集(tsv和csv)

相关文章

Windows11安装MySQL8.1

设计模式4、建造者模式 Builder

【Spring Cloud】Ribbon 实现负载均衡的原理，策略以及饥饿加载

《The Rise and Potential of Large Language Model Based Agents: A Survey》全文翻译

【文档智能】：GeoLayoutLM：一种用于视觉信息提取（VIE）的预训练模型

c/c++中如何输入pi

如何使用记事本制作一个简陋的小网页（2）——表格的建立

Docker 容器跨主机通信 - Flannel

java mongodb 并表 group 查询 Bson

什么是 DNS 泛洪攻击（DNS 泛洪）

【HUAWEI】单臂路由

面试官：谈谈 Go 泛型编程

js 时差计算根据时间戳获取相差时间几时几分几秒

No148.精选前端面试题，享受每天的挑战和学习

No150.精选前端面试题，享受每天的挑战和学习

MacBook Pro 电池电量限制充电怎么设置AlDente Pro for Mac最大充电限制工具

led灯什么牌子的质量好？Led护眼台灯排行榜

如何改变讨好型人格，做回真正的自己

Java实现使用多线程，实现复制文件到另一个目录，起不一样的名字，创建100万个数据

大数据分布式处理框架Hadoop