在编写Python程序时需要用到相应的编程工具,PyCharm和Jupyter Notebook是最常用2款软件。
PyCharm是很强大的综合编程软件,代码提示、代码自动补全、语法检验、文本彩色显示等对于新手来说实在太方便了,但在做数据分析时发现不太方便,就是有时候需要查看数据表格时,只能使用print打印出来黑白文字,输出窗口又小,看起来非常不友好,特别是数据表格较多时,密密麻麻的内容看的眼花缭乱。而且一个程序文件只能一次性从头到尾执行完,修改局部以后又要从头来一遍,如果是读取几百兆的excel文件,需要等待很长时间。在使用输出图形图表时需要调用另外的窗口。
PyCharm社区版界面:
但是如果使用Jupyter Notebook却可以非常漂亮的表格形式展示原始数据,而且一次加载后,如果需要修改程序或对数据进行显示、加工,增加单元格就可以,关键是可以一个单元格一个单元格的分开运行程序,对于程序调试和数据分析非常方便。另外,在输出数据图表时,可以在代码下面即时显示,非常友好方便。
Jupyter Notebook图文并茂的输出界面
Jupyter Notebook的缺点是不支持代码提示、颜色区分、语法检查等,对于不熟悉Python的新手来说,非常痛苦。而且程序被分割成一个个单元格,不太好管理。所以必须要安装代码补全插件,安装以后就可以实现代码提示和补全,大大方便了新手。
让人迷惑的是,同样的大量数据处理,使用Jupyter Notebook有时候要等很久,但是用PyCharm就快很多,搞不明白是程序的问题还是两个环境的问题。
由于Jupyter Notebook是基于Web方式,使用Jupyter Notebook可以实现在一个普通网页浏览器进行Python编程和数据分析。我们可以把Jupyter Notebook安装在一个公网服务器上,配置好后可以在任何地方通过电脑或移动设备通过网页浏览器远程编程,随时随地移动办公室,非常方便。
两者也可以相互结合,核心代码使用Pycharm编写成库文件,然后在Jupyter Notebook里通过import导入的方式进行调用。
像Google等公司还提供了直接使用、直接运行、免安装的Jupyter Notebook 服务:https://colab.research.google.com/,拿来就用,所有数据存储在云端,而且可以像其他人分享,大大降低了Python编程门槛。