Anaconda说明
- 学习Python的时候,使用者需要耗费时间下载对应的库(理解为Python的武器)......
- 一家数据公司想让Python的使用更加便利,于是anaconda诞生了
- anaconda相当于一辆运输车,不仅包含了Python,还附有Python所有的库
- anaconda = python + 第三方库 + IDE(jupyter notebook和spyder)
- 新手建议直接安装Python使用,在需要安装库的时候安装,不在环境上耗费过多精力
conda说明
一个开源的软件包管理系统和环境管理系统
包管理:安装、更新、卸载软件包;具有不同的软件源;自动解决包的依赖关系
环境管理:允许创建多个独立环境,每一个环境可以有不同的Python版本和不同的软件包组合,避免了项目之间的软件冲突;方便切换、复制、分享环境
跨平台支持:可以为不同平台的用户提供一致的使用体验
总而言之,conda是一个工具(可执行程序),核心功能是包管理和环境管理,对虚拟环境的创建和删除等操作需要conda命令
tensorflow说明
- 谷歌基于DistBelief研发的第二代人工智能学习系统
- 被广泛应用的开源机器学习框架
- 核心概念:张量、计算图
- 应用领域:机器学习、自然语言处理、计算机视觉、医疗影像分析......
环境使用说明
配置Anaconda源:
- Anaconda的下载源默认在国外,我们需要配置我们国内的源,否则下载速度非常缓慢,并且可能会因为网速过慢而下载失败
- 配置方法:打开 Anaconda prompt 执行以下命令,将清华镜像配置添加到Anaconda中
- 然后我们可以输入conda info命令,查看channel URLs,观察是否成功更换Anaconda源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
创建虚拟环境:
- 我们创建一个虚拟环境之后,可以在这个环境中配置我们需要的包,运行我们的程序
- 创建虚拟环境的命令:conda create -n 环境名 python=x.x.x -y
- 激活虚拟环境的命令(虚拟环境激活后才能使用,也可以理解为进入这个虚拟环境):activate 环境名
- 激活虚拟环境之后,我们可以看到虚拟环境从base变成了test,接下来我们可以在这个虚拟环境中安装我们需要的安装包,命令为 conda install 包名称
使用conda安装第三方包
- 使用conda在当前虚拟环境下载第三方包:conda install 包名称
- pip只是包管理器,无法对环境进行管理。因此如果想在指定环境中使用pip进行安装包,则需要先切换到指定环境中,再使用pip命令安装包(conda可以指定环境安装第三方包)
- pip无法更新python,因为pip并不将python视为包
- 在某一个虚拟环境安装的第三方包,无法在其他虚拟环境中使用
- 查看虚拟环境安装的第三方包:conda list
- 测试第三方包是否安装成功:进入包所在的虚拟环境中;进入Python环境;输入命令import 包名称;如果没有报错,则说明成功导入了这个第三方包
- 退出当前环境:conda deactivate(如果你之前用过conda activate xxx多次进入不同的环境操作之后,然后使用conda deactivate是返回上一层的环境)
- 删除当前环境的包:conda remove 包名称
机器学习绪论
达特茅斯会议
- 人工智能的起点
- 主题:用机器来模仿人类学习以及其他方面的智能
- 1956年成为了人工智能元年
人工智能、机器学习和深度学习的关系
- 机器学习是人工智能的一个实现途径
- 深度学习由机器学习的一个方法(人工神经网络)发展而来
机器学习的领域
- 传统预测
- 图像识别
- 自然语言处理
机器学习:从数据中自动分析获得模型,然后利用模型对未知数据进行预测
人类从大量的日常经验中归纳规律,当面临新的问题时,就可以利用以往总结的规律去分析现实的状况,采取最佳策略
机器从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的规律),从而使机器拥有识别猫和狗的能力
机器从数据(房屋的各种信息)中自动分析获得模型(判断房屋价格的规律),从而使机器拥有预测房屋价格的能力
如下图所示
历史数据的格式:数据集 = 特征值 + 目标值
每一行数据我们可以称之为样本
有一些数据集可以没有目标值
机器学习算法分类
监督学习:
定义:输入数据是由输入特征值和目标值所组成,函数的输出可以是一个连续的值(回归),或者是有限个离散值(分类)
目标值为类别(判断图片是猫还是狗),属于分类问题
分类算法:k-近邻算法、贝叶斯算法、决策树与随机森林、逻辑回归
目标值为连续性数据(预测房价),属于回归问题
回归算法:线性回归、岭回归
无监督学习:
输入数据是由输入特征值所组成
没有目标值
算法:聚类k-means
机器学习开发流程
学习心得体会:
- 算法是核心,数据与计算是基础
- 找准定位(使用算法而非设计算法)
- 先学习相关视频入门,后学习实战类书籍,再提升内功(弄懂原理)
- 机器学习框架:tensorflow