机器学习丨1. 机器学习概述

news2026/3/26 6:36:43

Author：AXYZdong 硕士在读工科男
有一点思考，有一点想法，有一点理性！
定个小小目标，努力成为习惯！在最美的年华遇见更好的自己！
CSDN@AXYZdong，CSDN首发，AXYZdong原创
唯一博客更新的地址为： 👉 AXYZdong的博客 👈
B站主页为：AXYZdong的个人主页

AI专栏

⭐⭐⭐【AI常用框架和工具】（点击跳转）
包括常用工具Numpy、Pandas、Matplotlib，常用框架Keras、TensorFlow、PyTorch。理论知识结合代码实例，常用工具库结合深度学习框架，适合AI的初学者入门。

文章目录

- - AI专栏
1 什么是机器学习
- 1.1 机器学习概念
- 1.2 机器学习、人工智能和深度学习关系
- 1.3 机器学习的发展史
- 1.4 机器学习应用场景
2 机器学习分类
- 2.1 机器学习算法划分
- 2.2 机器学习一般过程
- 2.3 常见算法
3 基本术语和概念

1 什么是机器学习

1.1 机器学习概念

在这里插入图片描述

历史数据训练，得出模型算法
新的数据输入到模型算法，进行预测得出未知属性

1.2 机器学习、人工智能和深度学习关系

在这里插入图片描述
交叉的领域

微积分（偏导数、向量-值函数、方向梯度）
概率论（贝叶斯定理、组合学、抽样方法）
计算科学
凸分析
算法复杂度

1.3 机器学习的发展史

1950，阿兰·图灵创造了“图灵测试”。
1957，Frank Rosenblatt设计出第1个计算机神经网络一感知机。
1981，Gerald Dejong提出基于解释的学习(ExplanationBased Learning,EBL)这一概念。
1990年代机器学习的方法从知识驱动转为数据驱动。
2016，谷歌的人工智能算法打败了围棋专业选手。

1.4 机器学习应用场景

属性预测，价值评估，客户分层，异常检测，疾病检测，风险管理，个性化推荐，垃圾信息识别，智能排序，等级评分，流失预警，文本识别，图像识别，量化交易分析，用户画像，路径优化，店铺选址，资源优化，作诗作歌词，恶意软件识别，精准营销，智能投顾搜索优化，诈骗检测，关联匹配等等。

2 机器学习分类

2.1 机器学习算法划分

监督学习（Supervised Learning）
- 回归（Regression）
- 分类（Classification）
半监督学习（Semi-supervised Learning）
Training Data有少量的Labelled data和大量的Unlabeled data。
在半监督学习的技术中，这些没有label的data，它们可能也是对学习有帮助。
无监督学习（Unsupervised Learning）
没有任何label，机器可以无师自通。
强化学习（Reinforcement Learning）
又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

有监督：是指在未加标签的数据中，根据数据本身之间的属性对数据进行分类，相似相近的数据分在同一类;不相似或不相近的数据分在不同的类中。

无监督：通过已知数据以及其对应的输出来训练，得到一个最优模型，再利用这个模型将所有新的数据样本映射为相应的输出结果，对输出结果进行简单的判断从而实现分类。

2.2 机器学习一般过程

数据采集
通过爬虫、API和数据库的方式进行数据收集。
数据处理
特征选择、预处理以及将其转换为对于机器学习算法有益处的格式。
算法选择
从机器学习的算法开始，将训练数据的算法特征应用到算法中。
结果实施
训练、评估、参数选择、模型使用。

强化学习训练过程：

在这里插入图片描述

2.3 常见算法

有监督学习常见算法
- 线性回归
- 决策树
- 逻辑回归
- SVM
- 装袋算法
- 随机森林
- KNN
- 朴素贝叶斯
- 集成算法系列
- GBDT
无监督学习常见算法
- K-Means
- K-Mediods
- DBSCAN
- Aprior
- FP-Growth

3 基本术语和概念

数据集
训练集\验证集\测试集
训练模型的数据集合
样本/示例
行Record
一个事件或对象
属性/特征
列 feature
性质
样本空间
属性长成的空间
训练数据/训练样本
模型训练
学习/训练
从数据集中学
得模型的过程
模型/学习器
训练后的结果
目标函数
算法学习后得到的
参数、阀值、比例等构成的函数
模型评价
评估模型性能优劣过程
损失函数/代价函数
评估原始数据与预
测数据差距的函数
评估模型效果
偏差：算法的期望预测与真实值之间的偏差程度，反映了模型本身的拟合能力。
方差：方差度量了同等大小训练集的变动导致学习性能的变化，刻画了数据扰动所导致的影响。
泛化能力：机器学习的目标是使学得的模型能够很好地适用于新的样本，而不是仅仅在训练样本上工作的很好，学得的模型适用于新样本的能力称为泛化能力。
误差：学习到的模型在样本上的预测结果与样本的真实结果之间的差。
- 训练误差：在训练集上
- 泛化误差：在新样本上
过拟合和欠拟合
- 在回归问题中（从左到右：欠拟合、正常拟合、过拟合）
- 在分类问题中（从左到右：欠拟合、正常拟合、过拟合）

Reference

[1] https://connect.huaweicloud.com/courses/learn/Learning/sp:cloudEdu_?courseNo=course-v1:HuaweiX+CBUCNXE086+Self-paced&courseType=1

—— END ——

如果以上内容有任何错误或者不准确的地方，欢迎在下面 👇 留言。或者你有更好的想法，欢迎一起交流学习~~~

更多精彩内容请前往 AXYZdong的博客

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/885919.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

IT团队如何引领企业走向创造价值的新途径?

IT团队如何引领企业走向创造价值的新途径?

随着疫情结束带来的经济回暖，我们无疑已做好了更充分的准备。信息技术使许多企业能够在关门歇业的情况下继续运营，以防止大规模集会并强制执行社会隔离。得益于信息技术支持团队，许多企业能够动员其员工进行远程工作，有些甚至只需…

阅读更多...

C++ template 循环

C++ template 循环

在元编程循环中，我们不需要用while，for来循环，一般情况下都要用递归，例如： #include <iostream> using namespace std; template <int Head, int...Data> constexpr static int num Head num<Data..…

阅读更多...

企业类型的软件著作权证书申请，一次通过十几张

企业类型的软件著作权证书申请，一次通过十几张

大家好，我是小悟关于软件著作权证书申请的内容，已经聊过很多次了，之前申请的都是个人类型，尝试了一下申请企业类型的，一口气提交了多张，也都顺利通过了。其实个人和企业类型所需要的资料并没有什么差别&…

阅读更多...

flutter 常见的状态管理器

flutter 常见的状态管理器

flutter 常见的状态管理器前言一、Provider二、Bloc三、Redux四、GetX总结前言当我们构建复杂的移动应用时，有效的状态管理是至关重要的，因为应用的不同部分可能需要共享数据、相应用户交互并保持一致的状态。Flutter 中有多种状态管理解决方案&#…

阅读更多...

Ubuntu安装Apache+Php

Ubuntu安装Apache+Php

环境：ubuntu 22.04 虚拟机首先更新一下 sudo apt-get update sudo apt-get upgrade安装Apache2： sudo apt-get install apache2 输入y，继续。等着他恐龙抗浪抗浪的下载安装就好了打开浏览器访问http://localhost/ 安装php： …

阅读更多...

Java学习路线来啦！看到就是赚到

Java学习路线来啦！看到就是赚到

“Java学习路线来啦”，Java作为一门常用的编程语言，因其广泛使用和应用，在IT行业中备受青睐。无论是初学者还是有一定基础的开发者，学习Java的路线和步骤都是必须的。下面小编将为大家推荐几个Java学习的必经之路。一、Java编程基…

阅读更多...

微信小程序纯前端从阿里云OSS下载json数据-完整版

微信小程序纯前端从阿里云OSS下载json数据-完整版

起因因为云开发开始收费（貌似很久了），准备改造在以前的小程序，数据转到oss上，小程序使用原生，不算专业领域，所以先百度.... 网上的教程真的是千篇一律，大部分开局就是require(ali-oss); 好点的npm install ali-oss --save开局，拼凑操作到最后发现要用云开发，因为云…

阅读更多...

【KVM虚拟化环境部署】

【KVM虚拟化环境部署】

环境部署 KVM虚拟化环境 1、装系统时手动选择安装 2、CentOS 7 最小化安装 yum install qemu-kvm qemu-img libvirt -y yum install virt-install libvirt-python virt-manager python-virtinst libvirt-client -y安装好CentOS 7后，去设置里面点击处理器&#x…

阅读更多...

智能水表抄表解决方案

智能水表抄表解决方案

对于传统的水表抄表方式存在的繁琐、耗时以及人为误差等问题，提出了智能水表抄表解决方案，让水表管理更加智能高效。以智能抄表TSM-MR为例：采用最新的人工智能图像识别技术，能识别各类水表数据，辅助大数据进行纠错&a…

阅读更多...

【C语言程序设计】一、算法基础（思考题）

【C语言程序设计】一、算法基础（思考题）

思考题 1、算法的特性是什么？ 有穷性、确定性、可行性、输入性、输出性 2、举例说明什么是可计算和不可计算问题？ 可计算问题是指可以用计算机算法解决的问题，即可以通过编写程序来得到问题的解决方案。例如，求两个数的和、找出一…

阅读更多...

golang操作excel的高性能库——excelize/v2

golang操作excel的高性能库——excelize/v2

目录介绍文档与源码安装快速开始创建 Excel 文档读取 Excel 文档打开数据流流式写入 [相关 Excel 开源类库性能对比](https://xuri.me/excelize/zh-hans/performance.html) 介绍 Excelize是一个纯Go编写的库，提供了一组功能，允许你向XLAM / XLSM / XLS…

阅读更多...

redis主从复制、哨兵服务、持久化、数据类型

redis主从复制、哨兵服务、持久化、数据类型

Top NSD DBA DAY10 案例1：配置主从复制案例2：配置带验证的主从复制案例3：哨兵服务案例4：使用RDB文件恢复数据案例5：AOF案例6：字符类型案例7：列表类型案例8：散列类型案例9&#xff…

阅读更多...

服务管理|反弹shell|计划任务|救援启动级别

服务管理|反弹shell|计划任务|救援启动级别

服务管理 systemctl cd /usr/lib/systemd/system systemd这个服务管理的后续服务，都是有配置⽂件的 systemd是linux系统第一个运行的进程，用来创建系统的守护进程来管理整个linux系统。systemd取代init的一个优势就是他集合了丰富的功能，同…

阅读更多...

如何通过观测云的RUM找到前端加载的瓶颈--可观测性入门篇

如何通过观测云的RUM找到前端加载的瓶颈--可观测性入门篇

声明与保证本文写作于2023年6月，性能优化的评价标准和优化方式仅适用于当前观测云控制台，当然随着产品迭代及技术更新，本文也会应要求适当更新。创建、修订时间创建修改人版本2023/6/24观测云***v1.0.0 1.网站性能评价的发展史&#xff…

阅读更多...

2023/8/16总结

2023/8/16总结

这几天完成了私信的功能点，用websocket做的。这是大概的界面，参考的是微信用户可以搜索好友： 如果不存在是下面这样，存在就会在左边的聊天里面显示有这个人选项发送消息接下来需要把推荐算法给做了

阅读更多...

Dynamic Web TWAIN Crack,支持向图像添加彩色矩形

Dynamic Web TWAIN Crack,支持向图像添加彩色矩形

Dynamic Web TWAIN Crack,支持向图像添加彩色矩形 Dynamic Web TWAIN用于快速部署 Web 应用程序的文档扫描 SDK，文档扫描SDK，，超过 5300 家公司信任 Dynamic Web TWAIN ，因其稳健性和安全性而受到超过 5300 家公司的信赖&#xff…

阅读更多...

VS重新生成之后Debug文件夹中无lib文件，错误提示：无法打开~.cu.obj

VS重新生成之后Debug文件夹中无lib文件，错误提示：无法打开~.cu.obj

情况： 改动代码后程序运行依旧为更新，之后变重新生成， 多个项目问题： case1. 当重新生成单个改动的项目时，错误提示：错误 716 error LNK1181: 无法打开输入文件“F:\。。。。。。。\Debug\LSVM_generat…

阅读更多...

excel隔行取数求和/均值

excel隔行取数求和/均值

问题描述如图有好多组数据，需要求每组数据对应位置的平均值解决方法 SUM(IF(MOD(ROW(C$2:C$81), 8) MOD(ROW(C2), 8), C$2:C$81, 0))/10然后下拉右拉扩充即可，其中需要根据自身需要修改一些数据 SUM(IF(MOD(ROW(起始列$起始行:结束列$结束行), 每…

阅读更多...

成集云 | 电子签署集成腾讯云企业网盘 | 解决方案

成集云 | 电子签署集成腾讯云企业网盘 | 解决方案

源系统成集云目标系统方案介绍电子签署是通过电子方式完成合同、文件或其他文件的签署过程。相较于传统的纸质签署，电子签署具有更高效、更便捷、更安全的优势。在电子签署过程中，使用电子签名技术来验证签署者的身份并确保签署文件的完整性。电子…

阅读更多...

【k8s、云原生】基于metrics-server弹性伸缩

【k8s、云原生】基于metrics-server弹性伸缩

第四阶段时间：2023年8月17日参加人：全班人员内容： 基于metrics-server弹性伸缩目录一、Kubernetes部署方式 （一）minikube （二）二进制包 （三）Kubeadm 二…

阅读更多...

推荐文章

最新文章