Python 人工智能 Machine Learning 机器学习基础知识点详细教程(更新中)

news2024/9/21 22:55:28

人工智能基本介绍

人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它试图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能的研究领域涵盖了机器人、语言识别、图像识别、自然语言处理和专家系统等。

人工智能是计算机科学的一个分支,它涉及到计算机科学、心理学、哲学和语言学等学科。可以说,人工智能几乎涉及到了自然和社会科学的所有学科,其范围已远远超出了计算机科学的范畴。

人工智能应用领域
在这里插入图片描述
人工智能发展必备三要素:数据、算法、计算力

首先,数据是人工智能发展的基础,包括海量的数据和高质量的数据。因为神经网络算法的层数为了达到良好效果,往往需要很多层,且参数量巨大,需要避免过拟合等问题,这些都需要海量的数据。没有足够的数据,即使有再好的算法也无法发挥其作用。

其次,算法是人工智能发展的核心,包括机器学习算法、深度学习算法等。算法本身的突破是人工智能发展的关键,因为只有好的算法才能够从海量的数据中提取出有价值的信息,进而实现智能化。

最后,计算力是人工智能发展的保障。随着数据量和算法复杂性的增加,人工智能需要更高的计算力来处理这些数据和算法。计算力包括硬件支撑和软件优化等方面,硬件支撑包括CPU和GPU等计算设备,软件优化则可以提高算法的执行效率和准确性。

总之,人工智能的发展需要数据、算法和计算力三个要素的共同作用。只有具备了这三个要素,才能够推动人工智能技术的不断进步和应用场景的不断拓展。

计算机中的两种重要处理器:CPU 和 GPU

CPU,也称为中央处理器或微处理器,是计算机的主要处理单元。它通过顺序执行指令来执行计算任务,并具有高度的灵活性,可以处理各种任务。CPU基于冯·诺依曼体系结构,包含控制单元、算术逻辑单元和缓存等部分。它通常用于诸如比特币挖矿、视频编辑等任务。

GPU,全称图形处理器,主要应用于图形处理和并行计算。基于数据流体系结构,GPU的并行计算能力是CPU的几倍甚至几十倍,可以处理大量的数据和计算任务。GPU设计目的是高效处理大规模并行计算和图形渲染,对于复杂的计算任务,如数据科学领域的分析程序,GPU能够提供更快的计算效率和速度。

总的来说,CPU和GPU各有其优点和缺点。CPU适合处理各种任务,具有高度的灵活性和高精度,而GPU则更适合处理大规模并行计算和图形渲染任务。

CPU:主要适合 I /O 密集型的任务
GPU:主要适合计算密集型任务

人工智能、机器学习、深度学习

在这里插入图片描述

机器学习基本概念

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究如何通过使用计算机模拟或实现人类学习行为,从而获取新的知识或技能,并重新组织已有的知识结构,以改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径。
在这里插入图片描述

机器学习工作流程

在这里插入图片描述

什么是特征工程?

特征工程是指将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。它包括特征构建、特征提取和特征选择三个部分,是机器学习中不可或缺的数据预处理和特征提取过程。

特征工程技术有哪些主要步骤?

数据探索:在任何数据分析和机器学习任务中,数据探索都是至关重要的第一步。它帮助我们理解数据的特性,确定是否存在缺失值或异常值,以及数据中可能存在的模式和趋势。
数据预处理:这是清理和准备数据的步骤,以便输入到模型中。它包括处理缺失值、异常值、离群值、错误和进行必要的类型转换。
特征构建:这个步骤通常涉及到从原始数据中创建新的特征。这可以通过各种方式实现,例如使用基本数学运算、计算统计量、文本处理等。
特征选择:这是一个从所有特征中选择最相关的特征的过程,以减少输入数据的维度并消除噪声。它有助于简化模型、提高效率,并可能改善模型的性能。
特征转换:在这个步骤,可能会使用一些数学或统计方法来转换已有的特征,以便更好地捕捉数据的结构或关系,或者提高模型的预测能力。
特征学习:这是一个使用特定算法从数据中学习有用特征的步骤。这通常涉及到神经网络或其他复杂的机器学习模型。

什么是监督学习?

在这里插入图片描述

监督学习:线性回归、逻辑回归、决策树、神经网络(卷积神经网络、循环神经网络)
无监督学习:聚类算法

什么是强化学习?

在这里插入图片描述

监督学习、无监督学习、半监督学习、强化学习
在这里插入图片描述

模型评估

模型评估(Model Evaluation)是检查模型在训练和测试数据集上的性能和效果的过程。模型评估的目的是了解模型是否能够有效地对新数据进行预测和分类。在模型评估中,通常会使用各种度量指标来评估模型的性能。

准确度(Accuracy):衡量模型正确预测的比例。
精度(Precision):衡量模型预测为正的样本中真正为正的比例。
召回率(Recall):衡量模型正确找出正样本的比例。
F1分数(F1 Score):综合考虑准确度和召回率,用来评估模型的整体性能。
ROC曲线(ROC Curve):以假阳性率(False Positive Rate)为横轴,真阳性率(True Positive Rate)为纵轴绘制的曲线,用于评估模型的分类性能。
AUC值(Area Under Curve):ROC曲线下的面积,衡量模型整体的分类性能。
交叉熵损失(Cross-Entropy Loss):衡量模型预测与实际之间的差异。
在实际应用中,根据不同的任务和数据集,需要选择合适的评估指标。同时,为了更全面地评估模型性能,还可以进行多种评估指标的组合使用。

过拟合和欠拟合

欠拟合是指模型在训练集、验证集和测试集上均表现不佳的情况。这主要是由于学习不足造成的,具体可以通过增加特征、使用较复杂的模型,或者减少正则项来解决此问题。

过拟合是指模型在训练集上表现很好,到了验证和测试阶段就很差,即模型的泛化能力很差。这主要是由于模型复杂度过高,导致模型对训练数据过拟合,无法泛化到新的数据。

增加训练数据:这种方法可以增加模型的多样性和复杂性,从而降低过拟合的可能性。
简化模型:可以通过减少模型的复杂度,如减少神经网络的隐藏层数和隐藏单元数等,来降低过拟合。
正则化:正则化是一种通过在损失函数中添加一项,来惩罚模型的复杂度的方法。它的主要作用是避免模型学习过多的细节,从而降低过拟合。常用的正则化项包括L1正则和L2正则等。
早停法:这种方法是指在训练过程中,监视模型在验证集上的性能,当模型的验证性能开始下降时,就停止模型的训练。这样可以避免模型对训练数据过拟合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1080455.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

echart双柱状图

1.效果 2.代码 const option {baseOption: {// backgroundColor: #0e2147,timeline: {show: false,},color: [#f14f75, #2c7efa],title: {text: 自动派单使用情况分析,textStyle: {rich: {a: {fontSize: 16,fontWeight: 600,},},},subtext: "2023~2024",top: 3%,l…

redis 哨兵 sentinel(一)配置

sentinel巡查监控后台master主机是否故障,如果故障根据投票数自动将某一个从库转换为新主库,继续对外服务 sentinel 哨兵的功能 监控 监控主从redis库运行是否正常消息通知 哨兵可以将故障转移的结果发送给客户端故障转移 如果master异常,则…

传奇XO引擎架设教程

本教程只限于技术研究使用,请勿用于商业用途。 本站教程、资源皆在单机环境进行,仅供单机研究学习使用,下载后请于24小时内删除,或购买正版。 XO三端引擎架设教程 演示系统:Windows Server2012 演示地址:…

Day 4 C++

算术运算符重载 种类&#xff1a; - * / % #include <iostream>using namespace std;class Cacu {friend const Cacu operator(const Cacu &l,const Cacu &r);friend const Cacu operator-(const Cacu &l,const Cacu &r);friend const Cacu operator*…

这可是全网最全的华为认证零基础学习路线整理,最新版分享

网络工程师愈发重要的新时代&#xff0c;华为认证已经成为学习网工的重中之重。 全球企业数字化转型呈现从慢速试点到今天的倍增创新&#xff0c;技术应用从单一孤立的到各类技术的融合&#xff0c;网络作为企业数字化运营的基石&#xff0c;迎来联接和数据的爆炸式增长&#x…

归并排序 nO(lgn)

大家好&#xff0c;我是蓝胖子&#xff0c;我一直相信编程是一门实践性的技术&#xff0c;其中算法也不例外&#xff0c;初学者可能往往对它可望而不可及&#xff0c;觉得很难&#xff0c;学了又忘&#xff0c;忘其实是由于没有真正搞懂算法的应用场景&#xff0c;所以我准备出…

【竞赛题目】木块(C语言详解)

" 木块 " 是【第二届全国高校计算机技能竞赛】里的一道竞赛题目&#xff0c;博主觉得很新颖想推荐给大家&#xff1b; 题目描述 为了提高词汇量&#xff0c;小理得到了一套四块木块&#xff0c;其中每块都是一个立方体&#xff0c;六面各写着一个字母。他正在通过将…

SQL利用Case When Then多条件判断

CASE WHEN 条件1 THEN 结果1 WHEN 条件2 THEN 结果2 WHEN 条件3 THEN 结果3 WHEN 条件4 THEN 结果4 ......... WHEN 条件N THEN 结果N ELSE 结果X END Case具有两种格式。简单Case函数和Case搜索函数。 --简单Case函数 CASE sex WHEN 1 THEN…

MyBatis-Plus为简化开发而生

简介 MyBatis-Plus 简称 MP是一个 MyBatis 的增强工具&#xff0c;在 MyBatis 的基础上只做增强不做改变&#xff0c;为简化开发、提高效率而生。 他们的愿景是成为 MyBatis 最好的搭档&#xff0c;就像魂斗罗中的 1P、2P&#xff0c;基友搭配&#xff0c;效率翻倍。 特性 无…

JWT 使用入门(一)配置与示例

文章目录 1、用途✨2、实现流程&#x1f440;3、JWT介绍3.1、构成3.1.1、header3.1.2、载荷3.1.3、签证 4、java实现4.1、引入依赖4.2、测试案例 官网链接&#xff1a;https://github.com/jwtk/jjwt 1、用途✨ JWT主要作用分为以下两种&#xff1a; 1&#xff1a;作为在前后端…

css修改滚动条

系统默认的滚动条可能不是很美观&#xff0c;有时候我们想要自己进行样式的修改&#xff0c;就可以用到下面的方法 设置滚动条的属性为overflow&#xff0c;取值是x轴和y轴 如果想单独设置某个轴&#xff0c;可以使用overflow-x,overflow-y <!DOCTYPE html> <html …

测试老鸟整理,Pytest自动化测试框架的一些关键点,一文贯通...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 Pytest自动化框架&…

Python自动查重之原理、方法与实践详解

什么是自动查重&#xff1f; 自动查重是指使用计算机程序来比较两个或多个文件的内容&#xff0c;判断它们之间是否存在相似或相同的部分&#xff0c;从而检测出抄袭或重复的情况。自动查重可以用于学术论文、代码、文本等各种类型的文件&#xff0c;帮助提高原创性和质量。 为…

kepler.gl 笔记:Layer

Point S2Layer Icon Line Cluster Polygon 一个路径型的GeoJSON图层可以显示诸如行程路线或等值线的数据。轮廓的颜色可以使用数值字段进行设置。 一个多边形型的GeoJSON图层本质上是一种区域填充图层&#xff0c;最适合用于呈现地理围栏。填充颜色或高度可以使用数值字…

HarmonyOS/OpenHarmony原生应用-ArkTS万能卡片组件Toggle

组件提供勾选框样式、状态按钮样式及开关样式。该组件从API Version 8开始支持。 仅当ToggleType为Button时可包含子组件。 一、接口 Toggle(options: { type: ToggleType, isOn?: boolean }) 从API version 9开始&#xff0c;该接口支持在ArkTS卡片中使用。 参数: Toggle…

Mac M1安装MongoDB6、后台运行

MongoDB&#xff0c;版本6.02 记录两种使用MongoDB的方法&#xff0c;安装包和docker docker mongo&#xff1a;Mac M1运行、连接 Docker MongoDB7。导出、恢复数据库 一、安装包&#xff0c;以mac M1为例 1、下载对应平台的安装包 M1选择ARM版本 https://www.mongodb.com/t…

SecureCRT 特点介绍 SecureCRT的安装和使用

SecureCRT 是一款支持SSH&#xff08;SSH1和SSH2&#xff09;的终端仿真程序&#xff0c;简单地说是Windows下登录UNIX或Linux服务器主机的软件&#xff0c;优点是可以一次创建多个 Tab Page&#xff0c;连接多台远程主机。 这里使用的是Mac版本的不过不影响&#xff0c;在Win…

RK3568平台开发系列讲解(驱动篇)RK3568 PWM详解

🚀返回专栏总目录 文章目录 一、什么是PWM二、RK3568 PWM2.1、PWM 通道与引脚2.2、PWM 简介2.3、PWM 设备节点沉淀、分享、成长,让自己和他人都能有所收获!😄 📢 PWM 是很常用到功能,我们可以通过 PWM 来控制电机速度,也可以使用 PWM 来控制 LCD 的背光亮度。 一、什…

每日一题 2512. 奖励最顶尖的 K 名学生(中等,模拟,排序)

思路&#xff1a; 对于每一个学生的评价&#xff0c;使用 split 方法提取评价中的每一个字符&#xff0c;然后逐个判断是否是正面或者负面词汇来计算分数对id按照要求进行排序。为了加快字符的正负判断速度&#xff0c;先将 positive 和 negative 两个列表转化为 set 这样就可…

智能文件管理助手,轻松实现按数量平均分类文件,高效整理新文件夹!

在我们的电脑或移动设备中&#xff0c;文件管理是我们日常工作和生活中不可或缺的一部分。有时候&#xff0c;我们可能需要将一个文件夹中的大量文件按照数量平均分配到多个新的文件夹中&#xff0c;以便更好地进行整理和管理。现在&#xff0c;我们为您提供了一款智能文件管理…