作者:艾文,计算机硕士学位,企业内训讲师和金牌面试官,公司资深算法专家,现就职BAT一线大厂。
邮箱:1121025745@qq.com
博客:https://wenjie.blog.csdn.net/
内容:跟艾文学编程《Python数据可视化》
目标
- plotly基础概念介绍
- plotly绘图控件介绍
- plotly安装
- 绘制一个plotly图可视化
-
可视化图表(直方图,柱状图,散点图,饼状图,热力图,时序图,箱线图等)
内容
- 介绍¶
以Python为基础进行数据分析,Matplotlib存在不够美观、静态性、不易分享等缺点,限制了Python在数据可视化中的发展。为了解决这个问题,新型的动态可视化开源模块Plotly应运而生。由于Plotly具有动态、美观、易用、种类丰富等特性。项目案例包括泰坦尼克号数据、鸢尾花数据、航班数据、金融类数据进行可视化图表分析,可以快速让大家如何掌握项目中的数据分析如何处理。
项目实战内容:泰坦尼克号数据、鸢尾花数据、航班数据、金融类数据
- 要求
无论你是零基础的人员还是有一定的Python 基础的学员,都可以通过该课程进行学习。本课程重点以实战教程为基础,让你快速掌握Python 工具的 使用和如何通过jupyter-notebook 进行数据分析,真对业务理解可以通过交互试图表plotly 进行分析。 这些课程尤其对于AI 产品经理也很有帮助,可以本课程,可以让你在公司数据分析中可以更快、效率 更高、工作收获最大。
- 受益
快速掌握Plotly库的使用方法,熟练绘制各种数据分析中常用图表
掌握python数据分析的方法
plotly介绍
python绘图:matplotlib,seaborn,plotly
数据分析的一个业务场景就是用数据讲故事,交互信息可视化的工具就在此凸显出了优势。
Python可视化的库还有很多,熟练掌握matplotlib和seaborn,针对具体业务用好plotly足以从容面对大多数的数据分析场景。
Plotly是一个非常著名且强大的开源数据可视化框架,它通过构建基于浏览器显示的web形式的可交互图表来展示信息,可创建多达数十种精美的图表和地图,
下面我们以jupyter notebook为开发工具数据分析。Matplotlib存在不够美观、静态性、不易分享等缺点,限制了Python在数据可视化中的发展。为了解决这个问题,新型的动态可视化开源模块Plotly应运而生。
由于Plotly具有动态、美观、易用、种类丰富等特性。
可以说,plotly 在Python 绘制图表的时候,是一种顶层的绘制方式。
我们首先通过plotly官方网站看看数据可视化效果图,这里截取了一部分的效果,发现真是无比强大,并且还支持数据/图片在线编辑。
plotly绘图控件
基本图表:20种
统计和海运方式图:12种
科学图表:21种
财务图表:2种
地图:8种
3D图表:19种
报告生成:4种
连接数据库:7种
拟合工具:3种
流动图表:4种
JavaScript添加自定义控件:13种
plotly 安装
pip install plotly
完成ploytly 安装程秀后,我们需要检查是否安装,通过下面操作下进行
第一个plotly 图可视化
- 导入相关包
- 第一个绘制图形
显示结果如下
可视化图表数据案例
本课程所有的项目案例的数据包括: 泰坦尼克号的数据、iris 数据、航班数据、金融累的数据,通过这些数据分析,可以 快速的让大家掌握项目中plotly 进行数据绘图分析。
- 加载数据
- 查看4类数据(默认5条)
这里flights 通过pivot 函数处理
金融类数据展示
项目案例1: 泰塔尼克号 直方图
在分析一组数据的时候,看的就是变量的分布规律,而直方图提供这样非常简单的功能。
通过观察数据,对age进行直方图的展示,实际age 数据存在missing,先用dropna函数删除missing 的数据,否则无法绘制 出图形。
项目案例2: 泰塔尼克号 柱状图
这里我们统计每类仓位等级 对应的幸存下来的人数数据分析
项目案例3: 泰塔尼克号 分组柱状图
我们x轴 仓位等级class,我们将sex 在进行细化,完成分组柱状图的效果
项目案例4: iris 散点图
散点图: 主要用于分析数据的集中程度。
项目案例5: 航班数据 折线图
主要分析数据的一些变化趋势,我们这里分析航班的数据,主要查看每年每月乘客数的一些变化
上面的操作非常的麻烦,定义一个函数封装每年的数据,然后就可以把所有的数据都显示出来
项目案例6: 泰塔尼克号 饼状图
通过饼状图,主要用于分析不同类别数据占比情况
分析 不同的embarked 人员的幸存人数占比
项目案例7: 泰塔尼克号 箱线图
是一种作用与数据分析是否异常点数据或者离群点,它能显示一组数据的最大数值,最小数值,中位数以及上下四分位数据。 都可以通过 这种图表观察到这种数据
我们统计不同仓位级别的年龄分布情况
我们可以对我们上述的代码进一步优化调整,使得我们的代码更加容易查看,代码量比较少
项目案例8:航班数据 热力图
通常用来表示特征之间的相关性,一般通过颜色的深浅来表示数值的大小或者相关性的高低
我们先通过一个简单的数据示例来观察如何生成一个热力图,重点构建 x,y,z 三个变量的数据
接下来我们通过pandas 加载我们一个航班的数据,每年每月的乘客数,这就一个热力图的实际应用
我们构建热力图 所需要的是三个维度的数据信息
x: 月份标签
y: 年份标签
z: 年份和月份对应的乘客数
项目案例9:金融数据 时序图
我们可以通过时序图每个时间点数据变化,例如: 在金融领域,可以通过该方法用于分析每天的股价的变化趋势
统计下金融数据每天的股价的变化趋势
接下来,我们在进一步功能优化
更多内容学习,请关注,多评论多支持,让我们一起加油。