机器学习1综述

news2024/11/29 10:51:11

文章目录

  • 一、综述
    • 学习环境:
  • 二、机器学习方法的分类
    • 1、监督学习;
    • 2、非监督学习;
    • 3、半监督学习;
    • 4、增强学习;
  • 三、机器学习方法分类
    • 2、批量学习(离线学习)Batch Learing;
    • 3、参数学习;
    • 4、非参数学习;
    • 5、参数学习:

一、综述

学习入门机器学习经典算法(KNN、线性回归、多项式回归、逻辑回归、模型正则化、PCA、SVM、决策树、随即森林、集成学习、模型选择、模型调整)与应用;
学习如何使用算法,如何评价算法的好坏,如何解决过拟合和欠拟合,如何调节算法的参数,如何验证算法的正确性

学习环境:

1、语言:python3;
2、框架:Scikit-learn;
3、其他:numpy,matplotlib…

二、机器学习方法的分类

机器学习方法的分类(从机器算法本身进行分类):

1、监督学习;

监督学习是指给机器的训练数据拥有“标记”或者“答案”;主要处理两大类问题分别是分类问题和回归问题;(大部分算法都属于监督算法)

2、非监督学习;

非监督学习的训练数据没有任何“标记”或者“答案”;对没有“标记”的数据进行分类-聚类分析;非监督学习的意义:对数据进行降维处理 ,特征提取:信用卡的信用评级和人胖瘦无关?特征压缩:PCA;降维处理的意义:方便可视化或者异常检测;

3、半监督学习;

半监督学习:面对的数据集一部分有“标记”或者“答案”,另一部分数据没有;更常见:各种原因产生的标记缺失;对于半监督学习来说我们都可以先使用无监督学习手段对数据进行处理,之后使用监督学习手段做模型的训练和预测

4、增强学习;

增强学习:根据周围环境的情况(反馈),采取行动,根据采取行动的结果,学习行动方式。

三、机器学习方法分类

1.在线学习Online Learing;

2、批量学习(离线学习)Batch Learing;

批量学习:如图所示,模型一旦建立不再改动;
优点:简单;
问题:如何适应环境变化?
解决方案:定时重新批量学习;
缺点:每次重新批量学习,运算量巨大;
另外在某些环境变化非常快的情况下,甚至这个解决方案的实现已然不可能;
在这里插入图片描述

3、参数学习;

参数学习:结果时刻向前反馈,机器学习算法时刻改进,模型也时刻改进;
优点:可以及时反映新环境的变化;
问题:新的数据有可能带来不正确或者不好的变化;
在这里插入图片描述

4、非参数学习;

非参数学习:不对模型进行过多的假设,非参数学习不等于没有参数,只是不把问题当成一个建模,不把整个问题理解成学习一些参数,但是在学习过程中仍然是需要参数的参与;

5、参数学习:

一旦学到了参数,就不再需要原有的数据集;对模型进行统计上的假设;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/41517.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

二叉树的递归问题

目录 一、相同的树 二、另一棵树的子树 三、翻转二叉树 四、平衡二叉树 五、对称二叉树 一、相同的树 给你两棵二叉树的根节点 p 和 q ,编写一个函数来检验这两棵树是否相同。 如果两个树在结构上相同,并且节点具有相同的值,则认为它们是…

【毕业设计-课程设计】-超声波测距

资源链接在文章最后,订阅查看获取全部内容及资料,如需可私信提供硬件。 目 录 1 绪论 2 1.1 项目研究背景及意义 2 2 总体设计方案及论证 2 2.1 总体方案设计 2 3 硬件实现及单元电路设计 3 3.1 主控制模块 3 3.2 电源设计 4 3.3 超声波测试模块 4 3.3.1 超声波的特性 5 3.3…

【Python】顺序、条件、循环语句

文章目录一. 顺序语句二. 条件语句1. 什么是条件语句2. 缩进和代码块3. 空语句 pass4. 练习三. 循环语句1. while 循环2. for 循环一. 顺序语句 默认情况下,Python 的代码执行顺序,是从上到下依次执行的: 执行结果一定为 “123”&#xff0…

【工具门户】Backstage配置使用PostgreSQL(三)

先决条件 If the database is not hosted on the same server as the Backstage app, the PostgreSQL port needs to be accessible (the default is 5432 or 5433) PostgreSQL数据库默认端口为5432或5433,如果数据库与Backstage应用不在同一台机器上,需开放PostgreSQL端口…

MyBatis框架一二级缓存含代码演示

目录 1.什么是缓存? 2. Mybatis的一级缓存 2.1实验一: 2.2实验二: 3.Mybatis的二级缓存 3.1 二级缓存需要配置才可以使用: 3.2 实验开始!! 4.总结 1.什么是缓存? 缓存就是数据交换的缓冲区(称作Cache),当某一…

学习Python中turtle模块的基本用法(2:基本绘图函数测试)

个人感觉turtle模块中的绘图函数是按人手拿着画笔一笔一画地画图的思路定义的,这与C#中的GDI函数、html5中canvas的绘图函数及Tkinter中Canvas的绘图函数的定义思路存在差异,但也能完成后面绝大部分的绘图功能(目前看到的turtle文章及帮助文档…

安装OpenGL

提示错误信息: (base) C:\Users\Tina\PycharmProjects\FunnyToys-main>conda install opengl Collecting package metadata (current_repodata.json): done Solving environment: failed with initial frozen solve. Retrying with flexible solve. Collecting…

python 栈空间不足异常 Process finished with exit code: -1073741571

问题现象 在pycharm使用debug模式调试代码时,异常退出,且错误码为-1073741571。除了错误码外,并没有看到其它报错。 分析 查阅资料: Process finished with exit code -1073741571 (0xC00000FD) when trying to implement ab…

AxureRP9的新特性介绍和技巧分享

AxureRP自去年8月第一个测试版本发布以来,已经一年多了,官方版本已经发布了近半年,但这个版本的用户声誉是褒贬不一的。许多用户反馈了他们对新版本的喜欢和肯定,但一些老用户仍然不愿意接受它,甚至保持抵制。 根据我…

【Hack The Box】linux练习-- Tabby

HTB 学习笔记 【Hack The Box】linux练习-- Tabby 🔥系列专栏:Hack The Box 🎉欢迎关注🔎点赞👍收藏⭐️留言📝 📆首发时间:🌴2022年11月22日🌴 &#x1f36…

【数据结构】基础:二叉树

【数据结构】基础:二叉树基础 摘要:本文将会介绍二叉树的基础内容,首先引入树的概念,了解树的基本概念与性质,再对二叉树的概念和性质进行分析,最后对其方法进行实现,最重要的是理解对于二叉树方…

世界65个国家贸易开放度数据 2005-2019年

一、数据介绍 数据名称:UNtrade数据库 数据年份:2005-2019年 数据范围:世界65个国家 数据来源:各地方统计局 部分数据如下: 二、参考文献 用途:研究人民币实际汇率与贸易差额之间的关系等。 [1]卢向…

R语言文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究

数据集中的Usenet公告板包括新汽车,体育和密码学等主题。最近我们被客户要求撰写关于主题建模的研究报告,包括一些图形和统计输出。我们对20个Usenet公告板的20,000条消息进行分析。 相关视频:文本挖掘:主题模型(LDA&a…

SpringBoot SpringBoot 原理篇 2 自定义starter 2.1 记录系统访客独立IP访问次数案例介绍

SpringBoot 【黑马程序员SpringBoot2全套视频教程,springboot零基础到项目实战(spring boot2完整版)】 SpringBoot 原理篇 文章目录SpringBootSpringBoot 原理篇2 自定义starter2.1 记录系统访客独立IP访问次数案例介绍2.1.1 介绍2.1.2 需求…

SpringCloud 组件Gateway服务网关【断言工厂过滤器工厂】

目录 1:断言工厂 2:过滤器工厂 2.1:路由过滤器的种类 2.2:请求头过滤器 2.3:默认过滤器 2.4:总结 1:断言工厂 路由断言工厂Route Predicate Factory 路由配置包括: 1. 路由…

C++_串口编程_官方示例:监视通信事件

这是微软官方的一个例子,这个例子中,如果不做修改,那么他是可以异步运行的,会出现一个错误:官方也说了一下,但是不太好懂,我拷贝过来放在这里,作为参考。 如果无法立即完成重叠的操作…

1_MyBatis入门

原生JDBC实现CURD的问题 1 编码繁琐 2 需要我们自己将结果集映射成对象 3 性能不太好 连接池 缓存 4 SQL语句和java代码的耦合度特别高 5 … … MyBatis 本是Apache的一个开源项目iBatis, 2010年这个项目由Apache Software Foundation 迁移到了Google Code,且改名为…

python学习笔记(10)

目录 第八章 函数 1.模块化程序设计(模块化---封装、复用、可替代) 2.定义函数 3.函数调用 4.return语句 5.函数参数 6.变量作用域 7.函数的递归调用 8.匿名函数 9.迭代器 10.生成器 11.装饰器 第八章 函数 1.模块化程序设计(…

【线性表】—不带头单向非循环链表的增删查改

小菜坤日常上传gitee代码:https://gitee.com/qi-dunyan(所有的原码都放在了我上面的gitee仓库里) 数据结构知识点存放在专栏【数据结构】后续会持续更新 ❤❤❤ 个人简介:双一流非科班的一名小白,期待与各位大佬一起努…

dns网络服务器未响应是什么原因(如果各自方法都尝试后无法使用,请尝试重启猫)

事件起因:周六晚上,看法国对丹麦世界杯,突然网页浏览器无法工作。 1.然后尝试修改dns路由修改为114.114.114.114,又还原system32/driver/hosts仍然无法使用 2.查看是否有浏览器代理,查询无 3.查看是否有可疑进程&…