本文通过一道题来对创建DataFrame知识点进行拓展,方便以后直接调用。下面先对知识点进行介绍:
在Python中,使用pandas库创建DataFrame有多种方法,这里列举几种常见的创建方式:
一、常见创建方式
1. 从二维列表创建
import pandas as pd
data = [
[1, 'Alice', 24],
[2, 'Bob', 30],
[3, 'Charlie', 22]
]
columns = ['student_id', 'name', 'age']
df = pd.DataFrame(data, columns=columns)
2. 从字典创建
import pandas as pd
data = {
'student_id': [1, 2, 3],
'name': ['Alice', 'Bob', 'Charlie'],
'age': [24, 30, 22]
}
df = pd.DataFrame(data)
结果同上。
3. 从Series创建
import pandas as pd
s1 = pd.Series([1, 2, 3], name='student_id')
s2 = pd.Series(['Alice', 'Bob', 'Charlie'], name='name')
s3 = pd.Series([24, 30, 22], name='age')
df = pd.DataFrame({'student_id': s1, 'name': s2, 'age': s3})
结果同上。
4. 直接从CSV文件创建
import pandas as pd
df = pd.read_csv('students.csv')
5. 从Excel文件创建
import pandas as pd
df = pd.read_excel('students.xlsx', sheet_name='Sheet1')
二、每日一题
编写一个解决方案,基于名为
student_data
的二维列表 创建 一个 DataFrame 。这个二维列表包含一些学生的 ID 和年龄信息。
import pandas as pd
# 示例使用
student_data = [
[1, 20],
[2, 22],
[3, 19],
[4, 21]
]
# 将二维列表转换为DataFrame
df = pd.DataFrame(student_data , columns=['student_id', 'age'])
print(df)
输出结果为:
或通过定义函数:
import pandas as pd
def createDataframe(student_data: List[List[int]]) -> pd.DataFrame:
df = pd.DataFrame(student_data,columns = ['student_id','age'])
return df
df = createDataframe(student_data)
print(df)
函数定义:它接受一个类型为 List[List[int]] 的参数 student_data
,并返回一个 pandas DataFrame。