前言
大家早好、午好、晚好吖 ❤ ~欢迎光临本文章
今天案例难度指数: ☆☆☆
准备
环境使用:
在开始写我们的代码之前,我们要准备好运行代码的程序
-
Anaconda (python3.9)
–> 识别我们写的代码
开发工具:
-
jupyter notebook
–> 代码编辑功能敲代码的工具
不会安装的可以文末名片+我获取哦 😎
相关模块:
-
pandas pyecharts
—> pip install 模块
第三方安装模块:win + R 输入cmd 输入安装命令 pip install 模块名
如果出现爆红 可能是因为 网络连接超时 切换国内镜像源
一、什么是数据分析
明确目的–获得数据(爬虫,现有,公开的数据)–数据预处理——数据可视化——结论
二、步骤
-
读取数据
-
数据预处理
-
可视化
代码展示
导入模块
import pandas as pd
读取数据
df = pd.read_html('http://tjj.hunan.gov.cn/hntj/ttxw/202105/t20210519_19050124.html')
df = df[0]
df
数据清洗
-
删除 del remove drop()
-
重命名列索引字段 热,rename()
重命名
df = df.rename(columns={0:'城市',1:'人口数',2:'城市比重',3:'乡村比重'})
df
df.index[[0,1,2]]
df = df.drop(df.index[[0,1,2]])
df
重新设置行索引
df = df.reset_index(drop=True)
df
可视化
导入模块
import pyecharts
pyecharts.__version__
from pyecharts.charts import Bar # V1.0+
# c = Bar() # 实例化
# c.add_xaxis()
# c.add_yaxis()
链式调用
c = (
Bar()
.add_xaxis(df['城市'].tolist())
.add_yaxis('人口数',df['人口数'].tolist())
.reversal_axis()
)
显示图形
c.render('人口数.html')
# c.render_notebook()
地图
from pyecharts.charts import Map
a = (
Map()
.add('人口数',maptype='湖南',data_pair=[ list(i) for i in zip(map_show.index,map_show.values)])
)
a.render_notebook()
# from pyecharts import Bar # V0.5+
转化为列表
df['城市'].tolist()
df['人口数'].tolist()
df.columns
分组
map_show = df.groupby('城市')['人口数'].sum()
map_show
map_show.index
map_show.values
推导式
[ list(i) for i in zip(map_show.index,map_show.values)]
for i in zip(map_show.index,map_show.values):
print(list(i))
尾语 💝
好了,今天的分享就差不多到这里了!
完整代码、更多资源、疑惑解答直接点击下方名片自取即可。
对下一篇大家想看什么,可在评论区留言哦!看到我会更新哒(ง •_•)ง
喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!