PyGWalker
可以简化Jupyter
笔记本的数据分析和数据可视化工作流程,方法是将panda
数据帧转换为Tableau
风格的用户界面进行可视化探索。
PyGWalker
(发音像“Pig Walker
”,只是为了好玩)被命名为“Graphic Walker
的Python
绑定”的缩写。它集成了Jupyter
笔记本(或其他基于Jupyter
的笔记本)和Graphic Walker
,后者是Tableau
的另一种开源替代品。它允许数据科学家通过简单的拖放操作分析数据并可视化模式。
安装
在使用pygwalker之前,请确保使用pip通过命令行安装软件包。
pip install pygwalker
对于早期试用,您可以使用
pip-install-pygwalker
进行安装–升级以使您的版本与最新版本保持最新,甚至是pip-install-git+https://github.com/Kanaries/pygwalker@main
获取最新功能和bug
修复。
在Jupyte
r笔记本中使用pygwalker
将pygwalker
和panda
导入您的Jupyter
笔记本以开始。
import pandas as pd
import pygwalker as pyg
您可以在不破坏现有工作流的情况下使用pygwalker
。例如,您可以通过以下方式调用加载数据帧的Graphic Walker
:
df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)
你甚至可以在网上尝试,只需访问Binder
、Google Colab
或Kaggle Code
。
就是这样。现在您有了一个类似Tableau
的用户界面,可以通过拖放变量来分析和可视化数据。
你可以用Graphic Walker做一些很酷的事情:
- 您可以将标记类型更改为其他类型以制作不同的图表,例如,折线图:
- 要比较不同的度量值,可以通过将多个度量值添加到行/列中来创建凹面视图。
- 若要创建由维度中的值划分的多个子视图的分面视图,请将维度放入行或列中以创建分面视图。规则类似于Tableau。
- 您可以查看表中的数据框架,并配置分析类型和语义类型。