目录
- 遇见 Mito
- 如何启动 Mito
- 数据透视表
- Mito 令人印象深刻的功能
- 可视化数据
- 自动代码生成
- Mito 安装
JupyterLab 是 Jupyter 主打的最新数据科学生产工具,某种意义上,它的出现是为了取代Jupyter Notebook。
它作为一种基于 web 的集成开发环境,你可以使用它编写notebook、操作终端、编辑markdown文本、打开交互模式、查看csv文件及图片等功能。
JupyterLab 最棒的体验就是有丰富的扩展插件,我记得过去我们不得不依赖 numpy 和 matplotlib 进行探索性数据分析。对我们来说幸运的是,那些日子早已一去不复返了。
Mito 来了!
遇见 Mito
Mito 是一个免费的 JupyterLab 扩展程序,可以使用 Excel 轻松探索和转换数据集。
当你启动 Mito 时,它会显示一个 Pandas Dataframe 的电子表格视图。只需单击几下,你就可以执行创建、读取、更新、删除操作。
如何启动 Mito
使用 Mito 加载数据并显示电子表格视图非常简单:
import mitosheet import pandas as pd url = 'https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv' iris = pd.read_csv(url) mitosheet.sheet(iris)
Mito 打开一个强大的电子表格查看器,它可以过滤、排序和编辑数据。
数据透视表
只需点击几下,Mito 就可以创建一个数据透视表。它支持许多常见的聚合,如 sum、median、mean、count、unique 等。
数据透视表是一个分组值表,它聚合了一个或多个离散类别中更广泛的表的各个项目。
Mito 令人印象深刻的功能
电子表格公式
动态公式是 Excel 的杀手级功能。Excel 可以让不熟悉编程的人轻松创建复杂的电子表格。如果我告诉你 Mito 以 Excel方式支持动态公式会怎样。 这个功能真的让我很惊讶。
看看下面的动图,看看 Mito 的求和公式怎么工作:
可视化数据
近年来,Python 数据可视化库层出不穷,从 matplotlib 到 seaborn、plotly,只需几条命令就可以在 Python 中实现令人惊叹的可视化。
Mito 可以在不编写任何代码的情况下可视化你的数据,它支持条形图、箱线图、直方图和散点图。
自动代码生成
Mito 可以将每个操作转换为 Pandas 代码,然后你可以与同事共享这些代码。这对于经验不足的数据科学家来说,是一个很棒的功能。我做了一些点击,Mito 生成了以下代码片段:
Mito 安装
首先,你需要使用以下命令下载 Mito 的安装程序:
python -m pip install mitoinstaller
然后安装它,只需运行:
python -m mitoinstaller install