绪论——算法设计原则【数据科学与工程算法基础】

news2025/1/11 16:50:50

一、题记

        最近情绪不太稳定,些许烦躁,也就一直没践行前边说的“学习记录”的想法。现在开始做了,春华易逝,正当时,有想法就去做,踌躇懊悔是这个年纪最不该做的事。

二、前言

        之前说了分块做这个系列,今天就是第一章节——绪论。


详情可参考: 数据科学的算法基础——学习记录跳转中心


 三、正篇 

        1.数据分析处理阶段

        绪论嘛,以最简练的话讲了几个老步骤:采集、预处理、存储管理、分析挖掘、可视化。大数据学生表示耳朵已经听出茧了,希望可以优化课程尽快先实操。

        2.算法设计原则

        好,有考点——如何对算法进行评价? 

        (1)效率指标

        耗时少、耗钱少。

        (2)精度指标

                《1》分类问题

混淆矩阵:

  首先给出四种情况,分别对应图中abcd:

  TP(真阳性)——a      FP(假阳性)——c     TN(真阴性)——d    FN(假阴性)——b

对于称呼有很多不同叫法,我们这里就按教材成为真假、阴阳。

英文名只有一个T——true   F——false   P——positive   N——negative,方便记忆


        解释一下:先看预测值(注意看预测值和真实值的位置,这是不固定的),预测值决定P与N,真实值决定T与F也就是先看预测的,预测的是“正”,哦!那就是阳性的,是真是假呢?看真实值,真是正,那就是真阳性,真实值是负,那就是假阳性(FP)。阴性同理。

         接下来就是用这四个值计算精度指标:

        emmm字丑下次一定注意,实在不想打公式了,而且感觉自己记得更易理解。 

 解释:查全嘛,就是要查得全;查准嘛,就是要查得准。看公式即知。

  最下面一行F值——综合考量查全率和查准率,称为他们的加权调和平均数(通常\beta取1)。

                《2》回归问题

        回归问题主要是进行预测,所以指标较简单:

 平均绝对误差(mean absolute error):

 ———预测值与真实值的绝对误差求和再除以样本个数

 均方误差(mean square error):

均方根误差(root mean square error):

                《3》排序问题 

        同回归类似,也很简单,直接套公式:       

平均精度均值(mean average precision,MAP):

                                                                              |

——Q个查询,第i个有n个查询结果,结果的排序为 r_{j},后面有例题

 归一化折损累计增益(normalized discounted cumulative gain,NDCG):

  

——结合例题理解 

 排序倒数均值(mean reciprocal rank):

 四、例题

        1.MAP

        假设有两个查询,查询1有4个相关网页,查询2有5个相关网页。检索算法在查询1上检索得到4个相关网页,其排序分别为1,2,4,7;检索算法在查询2上检索得到3个相关网页,其排序分别为1,3,5   试计算该检索算法的平均精度均值。

2.MRR

        假设某检索算法响应用户的4个查询,该算法返回4个查询的结果中第一个正确答案的排名分别为1,3,4,2,试计算该检索算法的排序倒数均值。 

3.NDCG 

假设两个推荐算法推荐Top5产品相关程度依次分别为{3,2,0,1,2}和{2,3,1,2,1}。

(1)分别计算这两个推荐算法的归一化折损累计增益。

(2)基于归一化折损累计增益指标,比较这两个推荐算法的优劣。

只是我写字大,很简单地 

 五、总结

        记公式……

                                                                                                   ————跳转下一章节:抽样算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1519833.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动态规划:4种遍历方向图解+Python实现

前言 动态规划类题型在遍历过程中,根据状态转移函数的不同,代码实现时遍历的方向也会有所差异。总的来说,一共可以总结为下图四种模式: 红色五角星表示当前要计算的状态值;白底箭头代表哪些状态要提前算出来&#xf…

VSCode ARM CortexM 开发

VSCode ARM CortexM 开发: http://coffeelatte.vip.cpolar.top/post/software/applications/vscode/vscode_arm_cortexm_开发/ 文章目录 VSCode ARM CortexM 开发: <http://coffeelatte.vip.cpolar.top/post/software/applications/vscode/vscode_arm_cortexm_%E5%BC%80%E5%…

三星计划将其NAND闪存芯片价格上调最高20%

韩国媒体一份报告显示&#xff0c;三星电子的内存业务成功挺过了去年的市场低迷时期。最近&#xff0c;其减产策略终于见效&#xff0c;芯片价格随之上升。 据报导&#xff0c;今年第一季度&#xff0c;三星计划将其NAND闪存芯片价格上调最高20%&#xff0c;目标是恢复其内存芯…

【析】一类动态车辆路径问题模型和两阶段算法

一类动态车辆路径问题模型和两阶段算法 摘要 针对一类动态车辆路径问题&#xff0c;分析4种主要类型动态信息对传统车辆路径问题的本质影响&#xff0c;将动态车辆路径问题(Dynamic Vehicle Routing Problem, DVRP)转化为多个静态的多车型开放式车辆路径问题(The Fleet Size a…

Java基础-复制

复制 前言引用拷贝浅拷贝深拷贝重写clone()方法序列化 前言 在编码中,我们可能会遇到需要将对象的属性复制到另一个对象中,这种情况叫做拷贝. 拷贝与Java内存结构有密切关系,拷贝有三种情况,引用拷贝,深拷贝和浅拷贝,下面来了解一下. 引用拷贝 引用拷贝会生成一个新的对象引…

微信小程序基础面试题

1、简述微信小程序原理 小程序本质就是一个单页面应用&#xff0c;所有的页面渲染和事件处理&#xff0c;都在一个页面内进行&#xff0c;但又可以通过微信客户端调用原生的各种接口&#xff1b;它的架构&#xff0c;是数据驱动的架构模式&#xff0c;它的UI和数据是分离的&am…

Windows上Git LFS的安装和使用

到Git LFS官网下载 传送门 初始化GitHub LFS和Git仓库 在仓库目录中运行&#xff1a; git lfs install再运行&#xff1a; git init跟踪大文件 git lfs track "*.zip"添加并提交文件 git add . git commit -m "Add large files"上传到我的github 配…

3.15作业

什么是IP地址&#xff1a;IP地址的作用是在网络中唯一标识和定位设备 IP地址和MAC地址的区别&#xff1a;IP地址是逻辑地址&#xff0c;网络层标识设备&#xff0c;可以更改&#xff0c;是全球互联网的唯 一 标识 MAC地址是物…

【CTF笔记】 CTF web方向笔记分享 免费 附预览图

个人不怎么记东西&#xff0c;笔记不多&#xff0c;师傅们凑合看… 百度网盘&#xff1a;https://pan.baidu.com/s/1PspihUX28Y_AOQZPurHqKA 麻烦各位师傅帮忙填写一下问卷&#xff0c;提取码在问卷填写结束后显示~ 【https://www.wjx.cn/vm/mBBTTKm.aspx# 】 &#xff08;…

大型政企寻求“智能化配方”,谁是“偏方”,谁是“验方”?

文 | 智能相对论 作者 | 叶远风 两会落幕&#xff0c;“人工智能”已成为国策&#xff0c;而全面推进智能化建设&#xff0c;大型政企首当其冲、责无旁贷——它们既是智能化转型升级的重要构成部分&#xff0c;也能直接在垂直领域形成价值引领、以点带片。 当智能成为大型政…

某鱼弹幕逆向

声明: 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;不提供完整代码&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01;wx a15018…

对称加密算法(DES、AES)

加密密钥 解密密钥 DES现在基本不再使用 3DES处理速度慢 AES通常用于移动通信系统加密以及基于SSH协议的软件

使用docker-compose部署Redis集群

一、部署三主三从的Redis集群 分别为6个节点建立挂载目录&#xff0c;每个目录下建立数据、配置、日志文件夹。 docker-compose内容如下&#xff1a; version: 3 services:redis1:image: redis:6.2.3restart: alwaysports:- "6379:6379"- "16379:16379"v…

【LeetCode热题100】138. 随机链表的复制(链表)

一.题目要求 给你一个长度为 n 的链表&#xff0c;每个节点包含一个额外增加的随机指针 random &#xff0c;该指针可以指向链表中的任何节点或空节点。 构造这个链表的 深拷贝。 深拷贝应该正好由 n 个 全新 节点组成&#xff0c;其中每个新节点的值都设为其对应的原节点的值…

【Javascript】变量和数据类型

目录 1.JavaScript介绍 内部JavaScript 外部JavaScript 内联JavaScript JavaScript输入输出语法 2.变量 2.1定义变量 2.2变量的命名规则和规范 2.3let和var区别 3.数据类型 3.1数字类型 3.2 字符串类型 3.3 布尔类型&#xff08;boolean&#xff09; 3.4 未…

表单修饰符和事件修饰符

表单修饰符和事件修饰符 表单修饰符 v-model.lazy v-model.lazy 失去焦点后再收集数据 <div id"app"><textarea name"" id"" cols"30" rows"10" v-model.lazy"a"></textarea>{{a}}<textar…

一键分割,瞬间转换!轻松驾驭视频的无限可能

在数字化的世界里&#xff0c;视频内容已成为我们日常生活与工作中不可或缺的一部分。然而&#xff0c;处理这些多媒体文件时&#xff0c;常常需要花费大量的时间和精力进行分割、转换和编辑。现在&#xff0c;有了这款强大的“一键分割与转换”工具&#xff0c;你将能够轻松驾…

达梦数据库安装使用

一、Windows端 打开iso文件 前面呆瓜式安装下一步 Oracle的特性与达梦特性大致一样 MySQL与Oracle区别 MySQL&#xff1a;安装一个服务&#xff0c;新建多个数据库 达梦&#xff1a;只安装底层服务&#xff0c;数据库需要单独创建 现在服务安装好了但是没有安装数据库 如果…

【JetsonNano】onnxruntime-gpu 环境编译和安装,支持 Python 和 C++ 开发

1. 设备 2. 环境 sudo apt-get install protobuf-compiler libprotoc-devexport PATH/usr/local/cuda/bin:${PATH} export CUDA_PATH/usr/local/cuda export cuDNN_PATH/usr/lib/aarch64-linux-gnu export CMAKE_ARGS"-DONNX_CUSTOM_PROTOC_EXECUTABLE/usr/bin/protoc&qu…

Spirngboot中文乱码解决方案

在使用springboot的时候,如果我们直接在控制器里面返回中文, 则默认可能会是乱码,因为默认的编码是ISO8859-1, 要解决这个问题, 就需要我们通过重写springboot里面的configureMessageConverters方法来将默认的编码设置为utf-8即可解决, 当然你的类文件编码也必须要是utf-8的, …