注:本文内容仅为个人学习笔记,教程为黄海广老师主讲的机器学习入门系列,
课程链接(中国大学慕课,有习题和证书)
课程资源(pdf版本课件和代码)公布在Github链接
课程视频也可以在b站观看(观看方便,但无课后习题和证书)
本笔记仅简单记录关于python需要熟悉掌握的内容点,不详细展开记录
python环境安装
python环境安装网上教程很多不做赘述,推荐黄海广老师发布的安装教程:Python环境的安装(Anaconda+Jupyter notebook+Pycharm)
python基础
python基础的语法使用的教程不在此展开,简单罗列一下包含的知识点,语言基础必须打好否则后面程序内容很容易跟不上
主要数据类型
字符串、整数与浮点、布尔值、日期与时间、其他
数据结构
列表list符号[]、元祖tuple符号(),集合set()、字典dict符号{}
控制流
顺序、循环、分支结构,break、continue、pass,列表生成式
函数
调用、定义函数、匿名函数
主要涉及的模块
以下仅为简单介绍在本教程中需要熟悉使用的模块如Numpy、Pandas、Scipy、Matplotlib、Scikit-learn等,不具体说明使用,会在python学习笔记中更新入门例程
Numpy
NumPy是一个用Python实现的科学计算的扩展程序库,包括:
1、一个强大的N维数组对象Array;
2、比较成熟的(广播)函数库;
3、用于整合C/C++和Fortran代码的工具包;
4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。
NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些本来使用C++,Fortran或Matlab等所做的任务
Pandas
Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
SciPy
SciPy是构建在NumPy的基础之上的,它提供了许多的操作NumPy的数组的函数。
SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包,它包括了统计、优化、整合以及线性代数模块、傅里叶变换、信号和图像图例,常微分方差的求
解等
Matplotli
Matplotlib 是一个 Python 的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。
通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。