我们在处理dataframe测试时,发现,总需要重新构造一个新的dataframe,每次想找个现成的就想抓狂。
所以,为了方便随用随拿,我在这里直接保存一个直接生成dataframe 的方法。
1. 生成一个随机dataframe的方法:
这里有个最简单的,用于测试的dataframe:
df1 = pd.DataFrame({'Column1': range(5), 'Column2': range(5, 10)})
生成的dataframe结果:
这个是纯数字的,如果是想要纯文本的话:
import pandas as pd
# 创建一个包含纯文本数据的DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': ['25', '30', '35'],
'Occupation': ['Teacher', 'Doctor', 'Artist']
})
print(df)
如果想要里面既含有字符串,又有数字(包括浮点数和整数型)的,可以参考下面的方法:
import pandas as pd
import numpy as np
# 设置随机种子以便每次生成相同的随机数(可选)
np.random.seed(0)
# 定义DataFrame的列名
columns = ['Column1', 'Column2', 'Column3', 'Column4']
# 定义DataFrame的行数
num_rows = 10
# 生成随机数据
data = {
'Column1': np.random.randn(num_rows),
'Column2': np.random.randint(1, 100, size=num_rows),
'Column3': np.random.rand(num_rows) * 100,
'Column4': np.random.choice(['A', 'B', 'C', 'D'], size=num_rows)
}
# 创建DataFrame
df = pd.DataFrame(data)
# 显示DataFrame
print(df)
2. 生成多个dataframe,可以用于遍历每一个dataframe
如果要测试多个dataframe的话,就可以用列表存入多个dataframe:
生成多个内容一样的dataframe:
import pandas as pd
df1 = pd.DataFrame({'Column1': range(5), 'Column2': range(5, 10)})
df2 = pd.DataFrame({'Column1': range(10, 15), 'Column2': range(10, 15)})
df3 = pd.DataFrame({'Column1': range(20, 25), 'Column2': range(20, 25)})
dataframes = []
dataframes.append(df1)
dataframes.append(df2)
dataframes.append(df3)
结果: