机器学习主要内容的思维导图

news2025/1/23 7:05:38

 机器学习

369ad1d974b54cb0b3ed9a3b49cf9961.jpg

机器学习:

定义:能够从经验中学习从而能够 把事情不断做好的计算机程序

人工智能的一个分支和 实现方式

理论基础:概率论 数理统计 线性代数 数学分析 数值逼近 最优化理论 计算复杂理论

核心要素:数据 算法  模型 

机器学习 ≠ 人工智能

艺术创作 金融领域 医疗领域 自然语言处理 网络安全 工业领域 娱乐行业

机器学习的一般流程: 明确分析目标、 收集数据 、数据预处理、 建模分析、 结果评估 、部署使用、 学习更新。

86ef3251263b40de8ba7927b6cada8a2.jpg

统计分析:统计学是研究如何收集资料、整理资料和进行量化分析、推断的一门学科 概念;  在科学计算、工业和金融领域有着重要的应用 ; 统计分析是机器学习的基本方法 。

高维数据降维:采用某种映射方法,降低随机变量的数量。(PCA\LDA\)

线性回归分析:

回归分析 分析一个变量与其他一个(或几 个)变量之间的相关关系的统计方法

种类

线性回归、多元回归、非线性回 归、广义线性回归(对数、possion )

主要内容

1. 确定连续变量之间的相关关系

2. 建立回归模型

3. 检验变量之间的相关程度

4. 应用回归模型对变量进行预测

69f44417b60a4132b85ad33345118273.jpg

决策树算法: 一种有监督的学习 从数据中推导函数的技术 (ID3算法、C4.5算法、CART算法)。使用于组合的算法是弱学习算法, 即分类正确率仅比随机猜测略高的 学习算法,但是组合之后的效果仍 可能高于强学习算法,即集成之后 的算法准确率和效率都很高。

集成学习(Ensemble learning): 是用多种学习方法的组合来获取比 原方法更优的结果(装袋法、提升法、随机森林)。

c7ae27d8f54247f9a70ae75dbe0ba146.jpg

聚类分析

把数据对象划分成子集  簇中对象相似  簇间对象不相似

无监督学习  无标签  数据驱动 

聚类方法分类

基于划分的方法 基于层次的方法 基于密度的方法 基于网格的方法 基于模型的方法

良好聚类算法的特征

聚类高维数据的能力 处理噪声数据的能力 良好的伸缩性 处理不同类型数据的能力 发现任意形状的聚类 易解释性和易用性 对样本顺序的不敏感性 约束条件下的表现

基于划分的聚类----K均值算法

基于划分的聚类----k-mediods算法

基于划分的聚类----k-prototype算法

基于密度的聚类方法----DBSCAN算法

基于层次的聚类----类间距离计算方法

基于模型的聚类----期望最大化算法(EM算法)

基于模型的聚类----Kohonen神经网络聚类

6eaf9fad11a04a7db8782eae6aff7cf5.jpg

文本分析的基本问题

将文本中抽取出的特征词进行向量化表示

将非结构化的文本转化为结构化信息

找出最具代表性的文本特征TF-IDF、信息增益和互信息等

采用向量空间模型(VSM)来描述文本向量

建立文本的数学模型实现对文本的计算、识别、分类等操作 

文本特征提取及表示----TF-IDF

文本特征提取及表示----信息增益

文本特征提取及表示----互信息

文本特征提取及表示----卡方统计

文本特征提取及表示----词嵌入

文本特征提取及表示----语言模型

文本特征提取及表示----向量空间模型

词法分析----文本分词

词法分析----命名实体识别

词法分析----语义消歧

句法分析----依存结构句法分析

句法分析----短语结构句法分析

dea450789e0d448ea30e82213bf61b4a.jpg

神经网络介绍

并行处理 神经元以分布式的方式处理信息

用途 1. 用神经网络模拟生物学习过程并建模 2. 获得高效的分类器 

神经网络介绍----感知机

神经网络介绍----梯度下降

神经网络介绍----批量学习

神经网络介绍----随机学习

神经网络介绍----感知机

神经网络介绍----多层感知机

神经网络介绍---- Sigmoid函数

神经网络介绍----BP神经网络

神经网络介绍----埃尔曼网络

神经网络介绍----霍普菲尔网络

c2115f9fb8a74fb7933cbfdca3ecc27e.jpg

贝叶斯网络定义 使用有向无环图来表示变量间依赖关系的概率图模型

贝叶斯网络的构建

根据问题和领域专家 知识手工构建 通过对数据进行分析得到 贝叶斯网络 结合领域专家知识和数据分 析得到贝叶斯网络 

 

38c4f5e4daa344cb8cf3e582a0a31001.jpg

支持向量机模型----线性分类器

支持向量机模型----点到超平面的距离

支持向量机模型----分类器的选择

支持向量机模型----拉格朗日乘数法

支持向量机模型----核函数

 

19aea139ceb7444289a347e7d5c73767.jpg

Holland在上世纪60年代提出了遗传算法

进化计算的一个分支

一种模拟自然界生物进化过程的随机搜索算法 遗传算法

首先对问题进行编码

然后随机初始化种群,每个个体对应一个编码

通过适应度函数以及选择函数来进行对个体的淘汰

保留优良个体基因,产生新的子代 

选择算子 根据适应值把个体按比例进行淘汰,从而提高群体的适应值

交叉算子 种群中随机选择2个个体,交换染色体部分编码,产生2个新 的子个体

变异算子 以一个很小的概率随机改变染色体上的某个基因来 增加群体的多样性

 010d82ac105c41a0a98dbf9c14611a43.jpeg

核心问题

01 如何提高各分布式任务节点之间的网络传输效率

02 如何解决参数同步问题

03 如何提高分布式环境下的容错能力 

分布式机器学习基础----参数服务器

解决分布式学习里面的一致性、扩展性和稳定性问题 作用

支撑并行训练,存储模型参数和状态 功能

高效通信、宽松一致性、灵活可扩展、容错能力强、易用

特点

灵活可扩展 训练过程中支持动态扩展节点,不需要重启训练任务就可以动 态插入新节点到集合中,可节省大量训练时间

容错能力强 在大型服务器集群中,由于节点较多,小概率故障往往常态化 需要节点恢复时间要短,不能中断训练过程

易用 为了减少学习难度,尽可能使用常用语言或将参数表示成通用的 形式,如向量、矩阵等,与现有机器学习框架无缝拼接

5fc9c97fc9e04af2ae8fdadc4e26d7ac.jpg

应用背景

推荐系统是信息过滤器 推荐系统是一种营销手段 应用背景 帮助用户快速发现有用信息的工具 提高产品销量

应用场景

电商平台  “猜你喜欢”

个性化电影网站  根据观看历史推荐

社交网络 推荐互加好友

音乐歌单 协同过滤推荐

99c70c4de1584e4087d717de4dd4ec3a.jpg

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/363781.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【极海APM32替代笔记】HAL库外部定时器、系统定时器阻塞、非阻塞延时

【极海APM32替代笔记】HAL库外部定时器、系统定时器阻塞、非阻塞延时 外部定时器 采用定时器做延时使用时 需要计算好分频和计数 另外还要配置为不进行自动重载 对于50MHz的工作频率 分频为50-1也就是50M/501M 一次计数为1us 分频为50000-1也就是1k 一次计数为1ms 我配置的是…

论文解读 | [AAAI2020] 你所需要的是边界:走向任意形状的文本定位

目录 1、研究背景 2、研究的目的 3、方法论 3.1 Boundary Point Detection Network(BPDN) 3.2 Recognition Network 3.3 Loss Functions 4、实验及结果 论文连接:https://ojs.aaai.org/index.php/AAAI/article/view/6896 1、研究背景 最近,旨在…

2023美赛C题Wordle二三问分布预测和难度分类预测

文章目录前言题目介绍人数分布预测首先建立字母词典,加上时间特征数据预处理训练和预测函数保存模型函数位置编码模型及其参数设置模型训练以及训练曲线可视化预测人数分布难度分类预测总结前言 2023美赛选了C题,应该很多人会选,一看就好做&…

电动汽车充放电的优化调度(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

深度学习无监督磁共振重建方法调研(二)

深度学习无监督磁共振重建方法调研(二)Self-supervised learning of physics-guided reconstruction neural networks without fully sampled reference data(Magnetic Resonance in Medicine 2020)模型设计实验结果PARCEL: Physi…

如何保证数据的安全?对称和非对称加密,身份认证,摘要算法,数字证书等傻傻分不清?波哥图解带你彻底掌握

支付安全 1.基础概念 明文:加密前的消息叫“明文”(plain text) 密文:加密后的文本叫“密文”(cipher text) 密钥:只有掌握特殊“钥匙”的人,才能对加密的文本进行解密,…

功能测试三年,是时候做出改变了

前言 测试行业3年多经验,学历大专自考本科,主要测试方向web,PC端,wap站,小程序公众号都测试过,app也测过一些,C端B端都有,除功能外,接口性能也有涉猎,但是不…

day32 多线程(上)

文章目录相关概念codeThreadTest01ThreadTest02 编写一个类,直接继承java.lang.Thread,重写run方法ThreadTest03 实现线程的第二种方法ThreadTest04 采用匿名内部类的方式ThreadTest05 获取线程名字ThreadTest06 sleep方法sleep面试题ThreadTest08 终止线…

不同路径-力扣62-java 动态规划

一、题目描述一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。问总共有多少条不同的路径&#xff1f…

H12-831题库(有详细的解析)

1.(单选)某工程师利用2台路由器进行IPv6业务测试,通过运行BGP4模拟总部与分支的互联互通。如图所示,某工程师抓包查看R1发出的update报文。关于该报文信息的描述,以下哪个说法是正确的? A.该报文描述的路由的下一跳地址为:2001:db8::2345:1::1 B.该报文…

基于Pytorch,从头开始实现Transformer(编码器部分)

Transformer理论部分参考知乎上的这篇文章 Transformer的Attention和Masked Attention部分参考知乎上的这篇文章 Transformer代码实现参考这篇文章,不过这篇文章多头注意力实现部分是错误的,需要注意。 完整代码放到github上了,链接 Trans…

ASE50N06-ASEMI低压MOS管ASE50N06

编辑-Z ASE50N06在TO-252-2L封装里的静态漏极源导通电阻(RDS(ON))为15mΩ,是一款N沟道低压MOS管。ASE50N06的最大脉冲正向电流ISM为200A,零栅极电压漏极电流(IDSS)为1uA,其工作时耐温度范围为-55~175摄氏度。ASE50N06…

2年手动测试,裸辞后找不到工作怎么办?

我们可以从以下几个方面来具体分析下,想通了,理解透了,才能更好的利用资源提升自己。一、我会什么?先说第一个我会什么?第一反应:我只会功能测试,在之前的4年的中我只做了功能测试。内心存在一种…

LDPC码的编译码原理简述

关于fpga调用ldpc IP core的相关参数问题可以看我的另一篇文章 LDPC码由Gallager在1962年提出,全称为 Low Density Parity-check Codes 低密度奇偶校验码 它的译码性能可以逼近Shannon信道容量限,广富盛名的Turbo码也被证明是LDPC码的一个特例。并且LDPC…

软件测试简单么,如何自学?

软件测试是不是简单其实需要自己学习了才知道,难易程度对于不同的人来说都是不一样的。都是需要实际去尝试了之后才知道。也要看是和谁对比,对于java这种来说肯定是容易多了。 软件测试其实算是互联网三大技术岗位中最轻松的工种,但是你学起…

idea中的Maven导包失败问题解决总结

idea中的Maven导包失败问题解决总结 先确定idea和Maven 的配置文件settings 没有问题 找到我们本地的maven仓库,默认的maven仓库路径是在\C:\Users\用户名.m2下 有两个文件夹,repositotry是放具体jar包的,根据报错包的名,找对应文…

重识html

html 重识html 万维网用url统一资源定位符标识分布因特网上的各种文档 各种概念 URL: 统一资源定位器 它是WWW的统一资源定位标志,就是指网络地址 在WWW上,每一信息资源都有统一的且在网上唯一的地址 网页: 由文字 图片 视频 音乐各种元素排列组…

面试热点题:stl中vector与list的优缺点对比、以及list的迭代器与vector迭代器的区别

vector的优点 下标随机访问 vector的底层是一段连续的物理空间,所以支持随机访问尾插尾删效率高 跟数组类似,我们能够很轻易的找到最后一个元素,并完成各种操作cpu高速缓存命中率高 因为系统在底层拿空间的时候,是拿一段进cpu&am…

软件测试5年,一路走来的艰辛路程

前言 不论你是什么时候开始接触测试这个行业的,你首先听说的应该是功能测试。通过一些测试手段来验证开发做出的代码是否符合产品的需求?当然你也有自己对功能测试的理解,但是最近两年感觉功能测试好像不太受欢迎,同时不少同学真的…

JavaEE简单示例——动态SQL之更新操作<set>元素

简单介绍: 在之前我们做的学生管理系统的时候,曾经有一个环节是修改学生的数据。我们在修改的时候是必须将student对象的三个属性全部填入信息,然后全部修改才可以,这样会造成一个问题就是在我们明明只需要修改一个属性的时候却要…