机器学习入门

news2024/11/26 20:44:46

AI人工智能

ANI 弱人工智能,狭义人工智能,指的是一种针对特定任务或领域进行优化的人工智能,例如语音识别、图像识别、自然语言处理、推荐系统

AGI 通用人工智能,强人工智能,

ASI 超级人工智能,超人工智能

机器学习分类

1、数据集,一批具有特征和标签的数据的集合叫做数据集。又分为训练数据集、验证数据集、测试数据集。训练数据集作为训练的数据,通过训练数据集找到一个函数,同时会使用验证数据集验证和评估函数。测试数据就负责对训练和评估后的函数进行测试。

2、监督学习 ,训练数据集全部都有标签,根据标签特点,又分为回归问题和分类问题;回归问题:标签是连续的数值,是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析,说白了就是当自变量变化的时候,研究以下因变量是怎么跟着变化的,比如电商场景中的销量预测、客户生命周期价值预测。分类问题:标签是离散数值,就是将数据分为不同的类别标签,通常用于图像识别、文本分类等分类问题。

3、无监督学习,训练数据集全部没有标签

4、半监督学习,训练数据集有的有标签,有的没有标签

5、强化学习

6、深度学习

机器学习步骤

1、数据收集

2、数据预处理:

数据可视化(发现数据中的规律和问题)可视化工具 Matplotlib Seaborn、

数据清洗(让数据更干净)使用工具Pandas库下的DataFrame、

特征工程(让数据易于被机器理解,并发掘重要特征)特征工程简单讲就是发现对因变量y有明显影响作用的自变量x,特征工程的目的就是发现重要特征,基于业务特性,从众多的特征中发现对标签有明显作用的特征,而摒弃掉无用的特征,降低特征的维度,提升机器学习模型的性能。

创建特征集和标签集、数据集分特征集和标签集,把数据喂给模型,特征集就是自变量x的数据的集合,标签集就是因变量Y的数据的集合。举个例子猫狗分类,特征,像素值、颜色通道

拆分训练集验证集测试集(训练、验证、评估、测试模型),一些特征和标签组成了数据集,接下来就是拆分数据集,拆分原则一般20%或30%的数据集留做测试,剩余的70%和80%留作训练数据集和验证数据集。使用工具scikit-learn里的数据集拆分工具train-test-split。

3、选择算法,我们应该确定问题的类型,在四种机器学习类型中,确定问题属于哪种学习问题类型,然后确定数据集特征和标签的关系,是属于回归问题还是分类问题,然后就可以针对不同的问题类型,选择相应的算法建立模型。如果是简单的问题,一般使用线性回归算法可以取得较好的效果。
在这里插入图片描述
在这里插入图片描述
4、训练模型,确定好算法之后,就可以通过训练数据集中的特征和标签,根据样本数据的损失来拟合函数模型,来获取最优的模型参数来建立模型。拟合模型指通过训练数据集来找到一个能够最好描述数据之间关系的函数,通俗的说就是让,机器学习算法学习输入数据与输出数据之间的关系,并生成一个可以对新数据进行预测的模型。

机器学习每训练一次,就会计算损失,逐渐减小训练集上的损失的过程,就是寻找最优模型参数的过程。过拟合 和欠拟合,过拟合是机器学习模型在训练数据上表现良好,但在测试数据上表现较差的现象。过拟合是指模型在训练数据上过度拟合,导致不能很好泛化到测试数据和实际数据中。

5、评估、优化模型,训练模型是算法寻找最优的模型的内部参数,评估和优化模型是在验证集或测试集上进行模型效果评估的过程中,对模型的外部参数进行优化,超参数,是指在模型训练之前需要设置的参数,用户控制模型结构和训练过程中的一些超参数。常用的超参数:神经网络的层数、学习速率、优化器,这些超参数的选择会影响模型的复杂度和性能,因此需要进行调整和优化获取更好的模型性能。

评估模型优劣,使用scikit-learn 中常用的工具和指标,对验证集和测试集进行评估,进而计算当前的误差,比如r2 或者MSE指标,可以用于评估回归分析模型的优劣。

模型评估分数不理想,需要重新调整模型的超参数、来重新训练模型,如果还是不理想,就要更换算法。

6、部署模型

当模型经过评估和优化后满足业务诉求,之后就可以部署模型,部署模型就是将训练好的模型应用于生产环境中,需要考虑多个因素,包括模型的性能、可靠性、安全性、扩展性、可维护性。

广泛用于语音识别、计算机视觉、自然语言处理、智能机器人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/718436.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Erupt框架学习

Erupt框架学习 Erupt框架Erupt简介学习EruptEruptFieldErupt的逻辑删除Erupt的自定义按钮多数据源配置 Erupt框架 Erupt简介 最近因为工作所以接触到了一个低代码框架Erupt。这是一个通用的配置管理框架,主打就是零前端代码,急速开发通用管理框架。 Er…

C# 如何调用python,避免重复造轮子

文章目录 原因资源调用python文件需求解决方案1、C#里面运行python引入python文件,再调用其中的方法启动python脚本,监听返回值改造一下,可以入参的python调用查看是否等待python运行完成之后再运行C#如果参数比较复杂 开一个python网络后端 …

如何用Airtest脚本无线连接Android设备?

1. 前言 之前我们已经详细介绍过如何用AirtestIDE无线连接Android设备: 手把手教你用AirtestIDE无线连接手机! ,它的关键点在于,需要先 adb connect 一次,才能点击 connect 按钮无线连接上该设备: 但是有很…

​浅谈大型语言模型

大型语言模型(Large Language Models,LLMs)是一类强大的人工智能模型,具有出色的自然语言处理能力。它们在许多任务中表现出色,如机器翻译、文本摘要、对话生成和情感分析等。下面我们将介绍大型语言模型的训练和生成过…

海康监控摄像机接入NTV GBS GB28181平台实现远程调取监控视频

海康威视各种型号监控摄像头或硬盘录像机(NVR/HVR)接入NTV GBS GB28181平台配置过程都非常简单明了,但有些细节需要注意,避免走弯路踩泥坑。 1、基本要求 1)网络要求 总体来说,只要监控设备和GB28181平台的网络是连通的,设备可以主…

MATLAB基础篇(上)

一、MATLAB简介 MATLAB(Matrix Laboratory, 即矩阵实验室)是MathWork公司推出的一套高效率的数值计算和可视化软件.MATLAB是当今科学界最具影响力、也是最具活力的软件, 它起源于矩阵运算, 并已经发展成一种高度集成的计算机语言.它提供了强大的科学运算、灵活的程序设计流程、…

保姆级python环境配置(anaconda+pycharm+cuda+cudnn+pytorch)

文章目录 前言一、如何下载anaconda1、下载网址2、版本选择3、下载流程4、注意事项 二、如何下载pycharm1、下载网址2、下载流程 三、更新NVIDIA驱动1、下载网址2、选择相应配置进行下载 四、如何下载cuda1、查看可安装的cuda版本号2、下载网址3、下载流程4、注意事项 五、如何…

牛客网数据库sql实战基础知识

sql基础知识 1.concat(a,“-”,b): 将a和b列,连接成字符串,用-分割后输出成一列。(分隔符在参数中间) 2.insert into values(),(): 插入多列时用逗号分割,不需要在最外层加再加括号。 3.inse…

工信部新材料大数据创新联盟成立,龙讯旷腾作为首批会员单位参与大会

近日,“新材料大数据创新联盟”成立大会暨第一届理事会在京召开。为深入贯彻国家创新驱动发展战略,联盟在工业和信息化部指导下,由北京科技大学、中国钢研科技集团有限公司、中关村材料试验技术联盟联合材料和信息技术领域重点高校、科研院所…

浅学CSS

目录 CSS 是什么 基本语法规范 引入方式 内部样式表 行内样式表 外部样式 代码风格 样式格式 样式大小写 空格规范 选择器 选择器的功能 选择器的种类 基础选择器 标签选择器 类选择器 id 选择器 通配符选择器 基础选择器小结 复合选择器 后代选择器 子选…

<C语言> 指针(上)

1.指针是什么? 指针(Pointer)是一种特殊的变量类型,它存储了一个内存地址。可以将指针视为存储了另一个变量的地址的变量。通过指针,可以直接访问和修改内存中的数据。 指针提供了一种间接访问内存的方式&#xff0c…

SpringCloud源码探析(七)-整合Elasticsearch

1.概述 ElasticSearch是一个基于Lucene的搜索服务器,提供了一个分布式多用户能力的全文搜索引擎。它是基于JAVA语言开发,并且是基于RESTful web接口进行查询和结果返回,是一款非常流行的企业级搜索引擎。Elasticsearch的核心功能包括存储数据…

Redis缓存问题与缓存更新机制

目录 ​编辑 一、缓存问题 1.1 缓存穿透 1.1.1 问题来源 1.1.2 解决方案 1.1.2.1 缓存空对象 1.1.2.2 使用布隆过滤器 1.2 缓存击穿 1.2.1 问题来源 1.2.2 解决方案 1.2.2.1 设置热点数据永远不过期 1.2.2.2 新增后台定时更新缓存线程(逻辑不过期) 1.2.…

详解Java Synchronized锁升级原理

✅作者简介:热爱Java后端开发的一名学习者,大家可以跟我一起讨论各种问题喔。 🍎个人主页:Hhzzy99 🍊个人信条:坚持就是胜利! 💞当前专栏:JAVA多线程 🥭本文内…

蓝桥杯专题-试题版含答案-【猴子吃桃问题】【小光棍数】【九九乘法表】【谁是最好的Coder】

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列点击跳转>蓝桥系列 👉关于作者 专注于Android/Unity和各种游…

(Linux) 套接字socket基础

文章目录 前言基本原理 Codeserverclient 核心函数socketbindlistenacceptrecvsendconnectclose 多线程改进END 前言 本文将以纯C语言描述,编译器gcc。 C/C没有标准的网络库,因为都需要用到各个平台的接口才行。 本文讲解Linux下最基础的socket编程&a…

uniapp 常用提示弹框整理

一. 加载提示弹框 在执行数据查询、页面数据渲染等过程中弹出提示。以页面渲染为例: //前端数据请求时,显示加载提示弹框 uni.showLoading({title: 加载中... }); // 数据从后端接口返回后,提示弹框关闭 uni.hideLoading();效果如下&#x…

Sui Builder House京都站|创意大赛获奖名单公布

Sui Builder House京都站于6月30日(周五)圆满结束,这是一次Sui生态系统项目演示和展示各自产品的良好机会。构建者们向大家展示了游戏、NFT、DeFi和基础设施赛道的项目,同时现场演讲还介绍了Sui的最新进展以及有关AI和用户体验设计…

React环境安装配置

React环境安装配置 一、前提二、React安装 一、前提 安装本地React环境需要Node.js,如果具有Node环境跳过即可。如果没有安装则可参考该篇文章安装Node环境,点击查看 二、React安装 全局安装React 首先打开命令行,建议以管理员身份输入命…