前言
嗨喽~大家好呀,这里是魔王呐 ❤ ~
今天案例难度指数: ☆☆☆
准备
环境使用:
-
Anaconda (python3.9)
–> 识别我们写的代码
开发工具:
-
jupyter notebook
–> 代码编辑功能敲代码的工具
相关模块:
-
pandas pyecharts
—> pip install 模块
一、什么是数据分析
明确目的–获得数据(爬虫,现有,公开的数据)–数据预处理——数据可视化——结论
二、步骤
-
读取数据
-
数据预处理
-
可视化
代码展示
导入模块
import pandas as pd
读取数据
df = pd.read_html('http://tjj.hunan.gov.cn/hntj/ttxw/202105/t20210519_19050124.html')
df = df[0]
df
数据清洗
-
删除 del remove drop()
-
重命名列索引字段 热,rename()
重命名
df = df.rename(columns={0:'城市',1:'人口数',2:'城市比重',3:'乡村比重'})
df
df.index[[0,1,2]]
df = df.drop(df.index[[0,1,2]])
df
重新设置行索引
df = df.reset_index(drop=True)
df
🎯 文章素材、解答、源码、教程领取处:点击
可视化
导入模块
import pyecharts
pyecharts.__version__
from pyecharts.charts import Bar # V1.0+
# c = Bar() # 实例化
# c.add_xaxis()
# c.add_yaxis()
链式调用
c = (
Bar()
.add_xaxis(df['城市'].tolist())
.add_yaxis('人口数',df['人口数'].tolist())
.reversal_axis()
)
显示图形
c.render('人口数.html')
# c.render_notebook()
地图
from pyecharts.charts import Map
a = (
Map()
.add('人口数',maptype='湖南',data_pair=[ list(i) for i in zip(map_show.index,map_show.values)])
)
a.render_notebook()
# from pyecharts import Bar # V0.5+
转化为列表
df['城市'].tolist()
df['人口数'].tolist()
df.columns
分组
map_show = df.groupby('城市')['人口数'].sum()
map_show
map_show.index
map_show.values
推导式
[ list(i) for i in zip(map_show.index,map_show.values)]
for i in zip(map_show.index,map_show.values):
print(list(i))
推荐往期文章
对python感兴趣的小伙伴也可以看一下博主其他相关文章哦~
python小介绍:
python是什么?工作前景如何?怎么算有基础?爬数据违法嘛?。。
python数据分析前景:
用python分析“数据分析”到底值不值得学习,以及学完之后大概能拿到多少工资
python基础自测题:
Python 800 道习题 (°ー°〃) 测试你学废了嘛
最后推荐一套Python视频给大家,希望对大家有所帮助:
全套教程!你和大佬只有一步之遥【python教程】
尾语
要成功,先发疯,下定决心往前冲!
学习是需要长期坚持的,一步一个脚印地走向未来!
未来的你一定会感谢今天学习的你。
—— 心灵鸡汤
本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦 😝