文章目录
- 专栏导读
- 1、DataFrame简介
- 2、DataFrame创建
- 2.1字典创建DataFrame
- 2.2列表创建DataFrame
- 2.3ndarrays 创建DataFrame
- 2.4CSV文件创建DataFrame
- 3、DataFrame基本操作
- 3.1添加列
- 3.2删除列
专栏导读
✍ 作者简介:i阿极,CSDN Python领域新星创作者,专注于分享python领域知识。
✍ 本文录入于《数据分析之道》,本专栏针对大学生、初级数据分析工程师精心打造,对python基础知识点逐一击破,不断学习,提升自我。
✍ 订阅后,可以阅读《数据分析之道》中全部文章内容,包含python基础语法、数据结构和文件操作,科学计算,实现文件内容操作,实现数据可视化等等。
✍ 其他专栏:《数据分析案例》 ,《机器学习案例》😊😊😊如果觉得文章不错或能帮助到你学习,可以点赞👍收藏📁评论📒+关注哦!👍👍👍
📜📜📜如果有小伙伴需要数据集和学习交流,文章下方有交流学习区!一起学习进步!💪
1、DataFrame简介
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
参数说明:
-
data:一组数据(ndarray、series, map, lists, dict 等类型)。
-
index:索引值,或者可以称为行标签。
-
columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
-
dtype:数据类型。
-
copy:拷贝数据,默认为 False。
2、DataFrame创建
Pandas DataFrame是一种二维标签化数据结构,可以将其看作一个电子表格或SQL表。每列可以有不同的数据类型(数值,字符串,布尔值等),也可以有行和列标签。
在Pandas中创建DataFrame有多种方法,下面介绍其中的几种方法。
2.1字典创建DataFrame
使用Python的字典可以很方便地创建DataFrame,其中字典的键作为列标签,值作为列数据。
示例如下:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Los Angeles']}
df = pd.DataFrame(data)
print(df)
2.2列表创建DataFrame
从多个列表创建DataFrame也是很常见的方法。在这种情况下,每个列表代表一个列,可以通过将这些列表组合成字典,然后传递给pd.DataFrame()函数来创建DataFrame。
示例如下:
import pandas as pd
names = ['Alice', 'Bob', 'Charlie', 'David']
ages = [25, 32, 18, 47]
cities = ['New York', 'Paris', 'London', 'Los Angeles']
data = {'name': names, 'age': ages, 'city': cities}
df = pd.DataFrame(data)
print(df)
2.3ndarrays 创建DataFrame
import pandas as pd
data = {'age':[25, 32,18,47], 'name':['Alice','Bob','Charlie','David']}
df = pd.DataFrame(data)
print (df)
2.4CSV文件创建DataFrame
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
data.csv是一个包含数据的CSV文件。如果CSV文件不包含列标签,则可以将header=None传递给read_csv()函数。如果CSV文件使用其他分隔符,则可以将sep参数设置为相应的分隔符。
3、DataFrame基本操作
3.1添加列
可以使用df[‘new_column’] = values的方式添加新列,其中values是一个与行数相同的列表或数组。
示例如下:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Los Angeles']}
df = pd.DataFrame(data)
df['gender'] = ['F', 'M', 'M', 'M']
print(df)
3.2删除列
使用df.drop(‘column_name’, axis=1)的方式删除指定列。其中,axis=1表示沿着列的方向删除,axis=0表示沿着行的方向删除。
示例如下:
df = df.drop('gender', axis=1)
print(df)
📢文章下方有交流学习区!一起学习进步!💪💪💪
📢首发CSDN博客,创作不易,如果觉得文章不错,可以点赞👍收藏📁评论📒
📢你的支持和鼓励是我创作的动力❗❗❗