0、前言:
- 数据分析三大模块知识:numpy(数组计算)、pandas(基于numpy开发,用于数据清洗和数据分析)、matplotlib(实现数据可视化)
1、Anaconda安装:
- 安装Anaconda
- 注意安装路径不一定是c盘,但是安装目录不要有英文
- 在弹出来的选项框中,记得打勾“将Anaconda3添加到系统变量中1”
- 在Anaconda中自带python,不用再单独下载python了(所以装Anaconda时要根据你需要的python版本来装)
- Anaconda命令行窗口:
- Anaconda换源
打开Anaconda Prompt(Anaconda命令行窗口),从下面镜像中挑一个
清华镜像源 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
阿里云镜像源 pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
输入以下命令:
2、Jupyter使用:
- 前言:通过设置环境变量将jupyter界面变成中文(这种方法不是每个系统都适用):在用户变量新建一个名为LANG,变量值为:zh_CN.UTF8。
- 作用:做数据分析和机器学习基本都是用jupyter notebook。
- 打开jupyter notebook的方法(前提是装好了Anaconda)。
- 在对应文件的目录中输入jupyter notebook
- 在终端输入jupyter notebook
- 最终页面如下(切记不能关闭掉cmd终端)
- 在对应文件的目录中输入jupyter notebook
- jupyter notebook中一些插件安装(注意插件安装结束要关掉jupyter和cmd窗口,然后重新启动)
插件是通过Anaconda Prompt(Anaconda命令行窗口)中执行pip指令安装的(安装前,先确保pip换源到国内,不然速度很慢),要安装的部分插件如下:
1、Jupyter Notebook 扩展包的安装:
pip install jupyter_contrib_nbextensions(在Anaconda命令行窗口中执行)
jupyter contrib nbextension install --user(在Anaconda命令行窗口中执行)
pip install jupyter_nbextensions_configurator(在Anaconda命令行窗口中执行)
jupyter nbextensions_configurator enable --user(在Anaconda命令行窗口中执行)
2、代码自动美化
jupyter nbextension enable code_prettify/autopep8(在Anaconda命令行窗口中执行)
3、代码自动提示
jupyter nbextension enable hinterland/hinterland(在Anaconda命令行窗口中执行)
- nbextensions 是jupyter notebook 的一个扩展,可以有很多有用的功能
3、jupyter notebook中的魔法命令:
-
查看所有魔法命令:%lsmagic
-
测试一个单元格代码执行时间:%%time,注意%time是行魔法命令,就是测试一行代码用了多少时间。
-
如果要查看一个魔法命令的作用,可以在写完魔法命令之后在后面加一个英文字符的问号,然后执行就能弹出该命令的官方文档。要查看一些python模块,也可以用在模块名后面加问号来查看。
-
查看一个函数的作用,可以把光标点到函数括号中,然后按shift+tab键,就会弹出提示
-
在jupyter中写好的python代码可以在jupyter的命令行模式下按下ctrl+L键来自动排版(前提是之前已经装好了对应插件)
-
补充:jupyter的基本知识:
- 命令行模式:蓝色
- 编辑模式:绿色
- 命令行模式按下Enter(或点击单元格内部)进入编辑模式。
- 编辑模式按下Esc(或点击单元格外部)进入命令行模式。
- 编辑模式:编辑code,在命令行模式下按y,编辑markdown,命令行模式下按m。
- 在上方插入一个单元格:a,在下方插入一个单元格:b。
- 运行所有单元格:ctrl+enter;运行选中单元格并自动选择下一个:shift+enter;运行单元格并在下面插入一个单元格:alt+enter。
4、jupyter notebook中读写文件:
- %%writefile 文件名.后缀:会把写在单元格中的内容写到对应文件中去。
- %run 文件名.后缀:用来运行文件,一般用来跑python文件。
- %load 文件名.后缀:用来加载文件(就是在单元格中把文件的内容加载出来)。
- %who:查看当前jupyter中的变量信息。(%whos是查看变量的具体信息)
- %reset:清除变量信息