机器学习基本算法:算法流程和算法分类

news2024/9/29 7:29:54

1、算法流程   

       机器学习的过程是一个完整的项目周期,其中包括数据的采集、数据的特征提取与分类,之后采用何种算法去创建机器学习模型从而获得预测数据。

算法流程

从上图可以看出一个完整的机器学习项目包含以下这些内容:

  1. 输入数据:通过自然采集的数据集,包含被标识的和未被标识的部分,作为机器学习的最基础部分。
  2. 特征提取:通过多种方式对数据的特征值进行提取,一般而言,包含特征越多的数据,机器学习设计出的模型就越精确,处理难度也越大。因此合适地寻找一个特征大小的平衡点是非常重要的。
  3. 模型设计:模型设计是机器学习中最重要的部分,根据现有的条件,选择不同的分类,采用不同的指标和技术。模型的训练更多的是依靠数据的收集和特征的提取,这一点需要以上各部分的支持。
  4. 数据预测:通过对已训练模式的认识和使用,使得学习机器能够用于研究开发、模拟和扩展人的多重智能的理论、方法和技术。
     

2、算法分类 

        根据输入的不同数据和对数据的处理要求,机器学习会选择不同种类的算法对模型进行训练,一般来说算法的训练没有固定的模式,只需考虑输入数据的形式和复杂度以及使用模型者的经验,以此为为参考进行算法训练,最终到达最好的学习效果。

根据算法模式的不同,将算法分成以下几类:

算法分类
  • 无监督学习:完全黑盒训练的一种训练方法,对于输入的数据在运行结束前没有任何区别和标识,也无法进行分类。完全由机器对数据进行识别和分类,形成特有的分析模型。训练过程完全没有任何指导,分析结果也是不可控的。
  • 有监督学习:输入的数据被人为地分类,被人为地标记和识别。通过对人为标识的数据进行学习,不断修正和改进模型,使模型能够对给定的标识后的数据进行正确分类,达到分类的标准。
  • 半监督学习:通过混合有标识数据和无标识数据,并创建同一模型对数据进行分析和识别,算法的运行介于有监督和无监督之间,最终使得全部输入数据能够被区分。半监督学习主要是用于有特征值缺失的数据分析。
  • 强化学习:通过输入不同的标识数据,使用已有的机器学习数据模型,通过不同的数据进行学习、反馈和修正现有模型,从而建立一个新的能够识别输入数据的模型算法。


 总结

       对于机器学习来说,最重要的部分就两个,一是数据的收集,二是算法的设计。在实际应用中,数据收集一般要求有具体的格式和要求,因此对其限制较多。而对于算法的选择则较为灵活,可以根据需要选择适合数据流程的算法,基本都可以较好的实现学习目的。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1379205.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JAVA毕业设计121—基于Java+Springboot的房屋租赁管理系统(源代码+数据库+9000字文档)

毕设所有选题: https://blog.csdn.net/2303_76227485/article/details/131104075 基于JavaSpringboot的房屋租赁管理系统(源代码数据库9000字文档)121 一、系统介绍 本项目还有ssm版本,分为用户、房东、管理员三种角色 1、用户: 注册、登…

Ubuntu 卸载重装 Nvidia 显卡驱动

问题描述 我使用 airsim 的时候,发现 UE4 没法使用显卡,导致非常卡顿 输入 nvidia-smi 有显卡型号等信息的输出,但是进程 process 里面没有显示 airsim 和其他软件占用显卡情况 因此,我选择了卸载重装 一.卸载旧版本的驱动 …

Komodor:Kubernetes 监控工具全面指南

为了方便起见,Komodor 提供了一个简单的 Web 界面,以帮助您监控 Kubernetes 集群的状态。它拥有付费和免费增值计划,除了在出现问题时通知用户外,还拥有一系列方便的工具,用于跟踪和管理集群中部署的资源的状态。让我们…

Python集合(set)

目录 集合创建集合访问集合向集合中添加和删除元素集合的 交集,并集,差集运算**交集****并集****差集** 集合方法 集合 集合是无序和无索引的集合。在 Python 中,集合用花括号编写。 创建集合 创建集合: thisset {"a"…

RISC-V Bytes: Caller and Callee Saved Registers

原文链接1:https://danielmangum.com/posts/risc-v-bytes-caller-callee-registers/ 原文链接2:https://zhuanlan.zhihu.com/p/77663680 //主要讲栈帧 原文链接3:https://www.jianshu.com/p/b666213cdd8a //主要讲栈帧 This is part of a new…

Ftrans飞驰云联荣获“CSA 2023安全创新奖”

2023年12月21日,第七届云安全联盟大中华区大会在深圳成功举办。会上,CSA大中华区发布了多个研究成果并进行 CSA 2023年度颁奖仪式,Ftrans飞驰云联以其突出的技术创新能力和广泛的市场应用前景,荣获备受瞩目的“CSA 2023安全创新奖…

redis夯实之路-哨兵(Sentinel)机制详解

Sentinel(哨兵)保证了redis的高可用性,一个Sentinel或多个Sentinel组成的系统监视多个主从服务器,当主服务器下线时,自动将一个从服务器升级为主服务器。 sentinel的主要功能 集群监控:负责监控redis mas…

imgaug库指南(20):从入门到精通的【图像增强】之旅

引言 在深度学习和计算机视觉的世界里,数据是模型训练的基石,其质量与数量直接影响着模型的性能。然而,获取大量高质量的标注数据往往需要耗费大量的时间和资源。正因如此,数据增强技术应运而生,成为了解决这一问题的…

【Python】使用Opencv裁剪指定区域,再重构大小和保存示例

在Python中,使用OpenCV库可以很方便地截取图像的某一区域,然后尺寸重构,最后保存为新的图像文件。以下是一个示例代码,演示如何实现这一操作: import cv2# 读取图像 img cv2.imread(img.jpg)# 定义截取的区域&#x…

Istio 实战:WasmPlugin(Proxy-Wasm 插件)开发(实现限流和修改请求和响应的 header)

更多 istio 文章:Istio 专栏目录 WasmPlugin 的典型应用 限流:当前 envoy 提供的限流能力虽然比较强大,但主要提供了一些 api,在使用上对用户不够友好,且全局限流对每个请求都调用一次限流服务,性能损耗较…

SSM-SpringMVC+Spring+Mybatis

创建项目 创建好 项目后, 项目目录分析 数据库设计 我们采用员工表 Employee 与 部门表 Department 部门表 表设计--- 员工表 --表设计 因为有文件上传操作,因此 建立 info表 (其中 员工只能隶属一个部门,因此 两张表之间 有外键关系) java 代码 设计 数据库建立完毕后,需要…

自定义数据实现SA3D

SA3D:Segment Anything in 3D with NeRFs 实现了3D目标分割 原理是利用SAM(segment anything) 模型和Nerf分割渲染3D目标, SAM只能分块,是没有语义标签的,如何做到语义连续? SA3D中用了self-prompt, 根据前一帧的mask…

C#编程-了解线程的优先级

了解线程的优先级 控制线程行为的一个属性是它的优先级。.NET运行时环境基于它们的优先级执行线程。CPU一次仅执行一个线程。因此,处于执行的可运行状态的线程,排队等待轮到被处理器执行。线程是固定优先级调度的。带有优先级的每个线程在处理器的线程队列中有自己的位置。 …

Java面试之虚拟机

1、前言 本篇的面试题基于网络整理,和自己编辑。在不断的完善补充哦。 2、什么是虚拟机? Java 虚拟机,是一个可以执行 Java 字节码的虚拟机进程。Java 源文件被编译成能被 Java 虚拟机执行的字节码文件( .class )。 Java 被设计成允许应用程…

老胡的周刊(第124期)

老胡的信息周刊[1],记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 🎯 项目 QAnything[2] 开源的企业级本地知识库问答解…

Java入门IDEA基础语法

1:Java入门 1.1 Java简介 Java是什么: Java是一门非常优秀的计算机语言 语言:人与人交流沟通的表达方式 计算机语言:人与计算机之间进行信息交流沟通的一种特殊语言 Java之父:詹姆斯高斯林(James Gosli…

深入理解计算机系统(2):信息的表示和处理

信息存储 大多数计算机使用 8 位的块,或者字节(byte),作为最小的可寻址的内存单位,而不是访问内存中单独的位。机器级程序将内存视为一个非常大的字节数组,称为虚拟内存(virtual memory)。内存的每个字节都由一个唯一的数字来标识…

Elasticsearch:是时候离开了! - 在 Elasticsearch 文档上使用 TTL

作者:来自 Elastic David Pilato 想象一下,圣诞老人必须向世界上所有的孩子们分发礼物。 他有很多工作要做,他需要保持高效。 他有一份所有孩子的名单,并且知道他们住在哪里。 他很可能会将礼物按区域分组,然后再交付。…

2024上半年教资笔试报名详细教程1月12日开始报名啦

重点提醒: 1、注册开放时间:2024年1月10日开始。 (参加过笔试的考生,需要重新注册, 不影响已获得的笔试成绩。名额少的考点建议提前注册抢名额) 2、网上报名时间:2024年1月12日至15日。 千万不…

【IDEA--dubug相关】-- 1. 取消debug的所有断点 2. debug侧边栏消失问题

下面是一些经常在日常debug时用到的场景,方便查看、与君共勉! 文章目录 1. 如何取消所有断点2. debug底部左边侧边栏消失 1. 如何取消所有断点 如图我们可能在项目中给很多代码行添加了断点,一个一个点取消麻烦 在debug运行中点击选中底部…