👉博__主👈:米码收割机
👉技__能👈:C++/Python语言
👉公众号👈:测试开发自动化
👉荣__誉👈:阿里云博客专家博主、51CTO技术博主
👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。
python全国数据人均消费数据分析(代码+报告+数据)
目录
- python全国数据人均消费数据分析(代码+报告+数据)
- 1. 导入模块
- 2. 读取csv文件
- 3. 分析数据
- 3.1 计算出2023年4月全国的平均消费值
- 3.2计算出2023年3月消费前十名的省
- 3.3 计算算各省市的2022年4月到2023年4月消费均值
- 3.4 显示北京从2022年4月到2023年4月消费
- 3.5 2023年4月全国平均消费折线图
- 3.6 绘制2023年3月消费前十名的省份柱状图
- 3.7 饼状图显示北京从2022年4月到2023年4月消费
- 3.8 折线图显示各省市的2022年4月到2023年4月消费均值
- 4 结语
- 👇👇👇关注公众号,回复 “python全国数据人均消费数据分析” 获取源码👇👇👇
1. 导入模块
将下载好的csv文件保存至C盘,导入该模块。
2. 读取csv文件
导入待处理的数据,并显示所有行。从文件系统中读取名为’data.csv’的CSV文件并将其内容载入一个Pandas DataFrame。这个DataFrame(df)是后续所有数据分析的基础。
代码如下:
import pandas as pd
import matplotlib.pyplot as plt
# 读取CSV文件
df = pd.read_csv('居民人均消费分省月度数据.csv', encoding='gbk')
# 2. 计算出2023年4月全国的平均消费值
avg_national_consumption_2023_Apr = df['2023年4月'].mean()
print(f"2023年4月全国平均消费值为:{avg_national_consumption_2023_Apr}")
3. 分析数据
3.1 计算出2023年4月全国的平均消费值
调用DataFrame的mean()函数来计算2023年4月全国的平均消费值,并将结果打印出来。
3.2计算出2023年3月消费前十名的省
DataFrame的nlargest()函数找出了2023年3月消费前十名的省份,并将这些省份打印出来。
3.3 计算算各省市的2022年4月到2023年4月消费均值
3.4 显示北京从2022年4月到2023年4月消费
这段代码首先计算了DataFrame中每一行(即每个省市)的平均值,得出了各省市从2022年4月到2023年4月的消费均值。然后将这个平均消费值作为新的一列添加到原始的DataFrame中,最后打印出了包含各省市及其消费均值的数据。
3.5 2023年4月全国平均消费折线图
3.6 绘制2023年3月消费前十名的省份柱状图
3.7 饼状图显示北京从2022年4月到2023年4月消费
3.8 折线图显示各省市的2022年4月到2023年4月消费均值
4 结语
该代码主要基于Python语言,借助于Pandas和Matplotlib库来处理和分析从2022年到2023年各省市的人均消费数据,并以图形的方式可视化结果。
首先,代码通过Pandas的read_csv()函数读取了包含各省市人均消费数据的CSV文件。然后,对’2023年4月’列的数据进行平均计算,得出全国2023年4月的平均消费值,利用Matplotlib将这部分数据绘制成折线图,清晰地展现了各地区在这个月份的消费水平。(部分)