Day 60 小结

news2025/3/5 2:21:08

1.惰性学习(消极学习):在训练数据集的时候不会创建目标函数,只是简单将训练样本存储。后期需要对新样本进行判断的时候分析新样本和已存储的样本之间的关系,并以此确定新样本的输出值。例如:knn算法。

2.急切学习(积极学习):根据训练数据的训练得到一个目标函数,后期对新样本进行判断的时候利用该目标函数进行判断,并得到输出值。例如:决策树。

3.knn算法原理:当预测一个新样本时,将新样本与所有点进行距离计算,再排序选择与新样本距离最近的k个训练样本(如果是二分类问题,k一般为奇数),根据这k个样本中出现频率最高的类别即是该新样本的所属类别。

4.常用距离公式(参考原帖):

        欧氏距离:

        

 

        曼哈顿距离:

         

5.leave-one-out 测试(留一法LOO):每次只留一个样本作为验证集,其余N-1个样本作为测试集,不重复地循环N次直至所有样本都做过验证集。存在缺点:计算量过大。

6.k-Flod交叉验证(k折交叉验证):在进行验证之前将数据集分成k个子集,不重复地将每个子集作为验证集,其余k-1个子集作为训练集。根据经验一般k选择5或10。

7.评价指标(具体问题具体分析,选取或自定义所需评价指标,参考原文):

        分类器:准确率、F1、召回率、ROC曲线等;

        回归问题:MAE、MSE、RMSE等;

        聚类问题:内部评价指标、外部评价指标。

8.M-distance算法原理:根据平均分来计算两个用户(或项目)之间的距离,与预测用户(或项目)平均值的差值达到一定阈值或者选取差值最小的k个值对应的用户(或项目),再回到原数据中求得的均值即为该预测值的输出值。

9.kMeans聚类算法原理(参考原文):

Step 1. (确定老大) 随机选择 k个点作为中心点.
Step 2. (分派别) 对于任意对象, 计算它到这 k个点的距离, 离谁最近, 就与它属于同一簇.
Step 3. (重新选择老大) 每个簇求虚拟中心, 将其作为老大.
Step 4. (判断是否收敛) 如果本轮的中心点与上一轮的中心点相同, 则结束; 否则转 Step 2.

注:step3中选择的为虚拟中心,即不一定刚好是数据集中真实存在的数据点;但是可以通过换成最近的点作为实际中心再聚类。

10.Naive Bayes算法原理:基于概率学的算法,基于贝叶斯定理和特征条件独立假设的分类方法。通过该公式(参考原文)

计算得出输出值,其中argmax 表示哪个类别的相对概率高, 我们就预测为该类别。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/762763.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode:4. 寻找两个正序数组的中位数

🍎道阻且长,行则将至。🍓 🌻算法,不如说它是一种思考方式🍀 算法专栏: 👉🏻123 题解目录 一、🌱[4. 寻找两个正序数组的中位数](https://leetcode.cn/proble…

微信朋友圈同步你知道怎么设置吗?

微信关于朋友圈同步 其实没有什么其他方法 但是不想一直复制粘贴 繁琐又麻烦 对于要发布很多条的情况下 就很不方便 如果是有可以同步朋友圈的功能 我们可以先选择一个好友 然后设置好跟圈任务 好友发啥你就会跟TA发出一模一样的朋友圈

CEASC项目环境搭建(训练VisDrone数据集)

CEASC项目环境搭建(训练VisDrone数据集) 论文地址:https://openaccess.thecvf.com/content/CVPR2023/papers/Du_Adaptive_Sparse_Convolutional_Networks_With_Global_Context_Enhancement_for_Faster_CVPR_2023_paper.pdf Code&#xff1a…

同比环比数据可视化

引言 数据分析和可视化在现代商业环境中变得越来越重要。随着数据的迅速增长,我们需要有效的工具来解释和理解这些数据。 数据可视化提供了一种直观的方式,帮助我们从海量数据中提取有意义的见解,以支持业务决策。 同比环比图作为一种常见的…

AI制图工具丨Midjourney产品功能介绍

了解如何使用Discord上的Midjourney Bot通过简单的文本提示创建自定义图像 Midjourney是一款AI制图工具,只要关键字,就能透过AI算法生成相对应的图片,只需要不到一分钟。 可以选择不同画家的艺术风格,例如安迪华荷、达芬奇、达利…

JavaScript中的JSON

一:分类  简单值:字符串、数值、布尔值和 null 可以在 JSON 中出现,就像在 JavaScript 中一样。特殊 值 undefined 不可以。 对象:第一种复杂数据类型,对象表示有序键/值对。每个值可以是简单值,也可以…

如何通过三级缓存解决 Spring 循环依赖

以下内容基于 Spring6.0.4。 这个其实是一个特别高频的面试题,松哥也一直很想和大家仔细来聊一聊这个话题,网上关于这块的文章很多,但是我一直觉得要把这个问题讲清楚还有点难度,今天我来试一试,看能不能和小伙伴们把…

一张证,三年月薪翻三倍!

18年9月,我获取了PMP(项目管理)认证,19年6月获取了PgMP(项目集群管理)认证。考证过程并不是很难,月薪却从1万突破3万,也找到了自己喜欢和擅长的工作领域,获益无穷。 什么…

Navicat 用户权限功能 | 预防 MySQL 删库风险

近期,我们后台收到一位用户的问询,有关于误删库的解决办法。对于企业来说,这可能是一个大事故!但幸运的是,该用户在不久之前看了我们的 Navicat 自动备份功能文章,并且实施了数据库备份操作,所以…

如何下载SRA存放在AWS的原始数据

通常,我们都是利用prefetch从NCBI上获取数据,然后用fasterp-dump/fastq-dump 转成fastq。但遗憾的SRA的数据是原数据的有损压缩,比如说我19年参与发表的文章里单细胞数据上传的是3个文件,但是当时的faster-dump/fastq-dump只能拆出…

MongoDB源码安装

文章目录 MongoDB源码安装:注:下载:解压:创建数据目录:创建软链接:创建变量脚本:执行脚本:启动mongodb:检查:连接mongodb: MongoDB源码安装: 注&…

Flutter系列文章-Flutter基础

Flutter是Google推出的一种新的移动应用开发框架,允许开发者使用一套代码库同时开发Android和iOS应用。它的设计理念、框架结构、以及对Widget的使用,都让开发者能更有效率地创建高质量的应用。 一、Flutter设计理念 Flutter的设计理念是“一切皆为Wid…

安装hive数据仓库

部署hive数据库 环境准备 需要安装部署完成的Hadoop的环境如果不会搭建的可以参考: 安装mysql 卸载Centos7自带的mariadb rpm -qa|grep mariadbrpm -e mariadb-libs-5.5.64-1.el7.x86_64 --nodepsrpm -qa|grep mariadb mariadb-libs-5.5.64-1.el7.x86_64是使用…

ToT: 利用大语言模型进行有意识的问题解决(上)

ToT 摘要介绍利用大语言模型进行有意识的问题解决1. 思维分解2. 思维产生 G(p,s,k)3. 状态评估V(p,S)4. 搜索算法 实验相关工作讨论 原文: 摘要 语言模型正在迅速成为一般问题解决的部署,但在推理过程中仍然局限于 标记级别(token-level&…

uniapp左右滑动切换月份

左右滑动触发事件 给组件绑定事件,主要利用组件的触摸开始和触摸结束事件来实现: <view @touchstart="touchStart" @touchend="touchEnd"> 2,声明初始化点击位置变量startX data() {return {list:[],pageNum:1,pageSize:10,//初始化点击位置…

手撕Spring06

概述 该章节通过各种Context解决上下文问题&#xff0c;使用模版方法的设计模式&#xff0c;并增加了bean实例化之前、beanc初始化前后的扩展点整体设计 知识点补充 类图 context context包下主要是传递上下文、调用core.io、beans等包下的实际功能完成&#xff0c;配置文件…

12.11 FS4412开发环境搭建

目录 开发边硬件资源介绍 地址映射表 硬件控制原理 load/store 地址映射表4个G包括 开发边硬件资源介绍 地址映射表 硬件控制原理 1.数据运算指令&#xff08;CPU内部&#xff09; 2.跳转指令&#xff08;CPU内部&#xff09; 3.load/store&#xff08;通过读写对硬件…

测试的基本概念(测试系列2)

目录 前言&#xff1a; 1.什么是需求 1.1需求的定义 1.2为什么有软件需求 1.3测试人眼里的需求 2测试用例 2.1什么是测试用例 2.2为什么要有测试用例 3.软件错误&#xff08;BUG&#xff09; 3.1什么是bug 4.软件的生命周期 5.开发模型 5.1瀑布模型 5.2螺旋模型 …

【PHP源码】手术麻醉管理系统介绍

手术麻醉管理系统是什么&#xff1f; 手术麻醉信息管理系统是数字化手段应用于手术过程中的重要组成部分&#xff0c;用数字形式获取并存储手术相关信息&#xff0c;既便捷又高效。既然是管理系统&#xff0c;那就是一整套流程&#xff0c;管理患者手术、麻醉的申请、审批、安…

c#语法问题记录

1.using using 语句定义一个范围&#xff0c;在此范围的末尾将释放对象。using 指令为命名空间创建别名&#xff0c;或导入在其他命名空间中定义的类型。 2. internal sealed partial class internal&#xff1a; 关键字是类型和类型成员的访问修饰符。sealed &#xff1a;应…