美国总统身高统计与分析
- 1.安装依赖
- 2.下载数据集
- 3.数据处理
- 4.结果展示
1.安装依赖
pip install pandas
pip install numpy
pip install matplotlib
2.下载数据集
链接:https://pan.baidu.com/s/1aZLtkLyvQvRLb9tJ-B1krA
提取码:thms
–来自百度网盘超级会员V6的分享
3.数据处理
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
plt.rcParams['axes.unicode_minus']=False #这两行需要手动设置
# 数据处理函数
def handleData():
# 使用pands读取csv数据
data = pd.read_csv('president_heights.csv')
# 使用numpy将数据提取出来并保存为数组
height = np.array(data['height(cm)'])
# 计算平均值
print('平均值', height.mean())
# 计算标准差
print('标准差', height.std())
# 计算最大值
print('最大值', height.max())
# 计算最小值
print('最小值', height.min())
# numpy数据处理
# 计算总统中20%的人的身高上限
print('20%:', np.percentile(height, 20))
# 计算总统中80%的人身高上限
print('80%:', np.percentile(height, 80))
# 计算中位数
print('中位数:', np.median(height))
# 调用数据可视化函数
plot(height)
# 数据可视化
def plot(height):
# 直方图绘制
plt.hist(height)
# 设置图形名称
plt.title('美国总统身高统计')
# 设置x轴名称
plt.xlabel('高度')
# 设置y轴名称
plt.ylabel('数量')
# 图形展示
plt.show()
if __name__ == '__main__':
handleData()
4.结果展示
数据处理结果
可视化结果