【小笔记】面对一个没搞过的任务,如何选择合适的算法模型?

news2024/10/5 23:27:51

【学而不思则罔,思而不学则殆】
9.28
在这里插入图片描述

1.确定问题定义

确定要解决的问题是一个什么类型,在算法中有没有一个专业的任务名定义它,确定了问题类型就明确了问题解决方向。
有时候我们要解决的问题可能有多种解决问题的角度,此时可能就会对应多个任务类型。
举例:
实体抽取是知识图谱中的一个任务,可以将其视为序列标注任务,也可以将其视为一个阅读理解任务。
有时候待解决的问题可以作为一个复杂的任务,也可以拆分为多个子任务
举例:
实体抽取即可以作为一个完整的任务,也可以拆分为实体边界识别和实体类别分类两个子任务;知识抽取可以作为一个实体-关系联合抽取任务,也可以拆分为实体抽取和关系抽取两个任务。

可以将自己的问题在网上进行搜索,以确定问题定义,最好是找到与场景无关的,更基础的问题定义。
举例:
要做一个文本的情感分类任务,按情感分类任务去查资料可以,但是更建议按文本分类任务去查资料更好,能够获取到更多的模型解决方案。

2.调研baseline模型

确定了问题定义,就去收集它的强baseline模型。多看看网上的资源,比如按“文本分类 baseline”进行查找,在知乎,CSDN,github上都能找到一些资料,多看几篇后,差不多就会有一个初步的认知,至少能获取到一些经典热门的baseline,若想获取到更新更强的baseline模型,则需要查看论文或paperwithcode进行查找。
以文本分类任务为例,通过查资料,会发现fasttext和bert被谈及很多,都可以作为baseline,当有多个模型可供选择时,怎么选?
一种是按照先简后繁的原则,优先选择轻量级的,能快速跑起来看到效果的;一种是按照选新不选旧的原则,即不要选择过时的baseline,选择比较新的。
先用简单模型跑通baseline是非常明智的决定,一方面确定基准,另一方面建立信心。而不是一来就考虑用最牛最复杂的模型,这会花费更多成本。‌

3.模型优化

‌无论是简单的模型还是复杂的模型,都需要优化,且约简单的模型对调参的技巧要求越高,再优化时同样采用先简后繁原则进行模型优化,优先对模型进行调参以提高模型性能,这是一种低成本优化。
当调参后性能无法提升时,则考虑从数据量和模型复杂度连个方面进行高成本优化。

4.增加数据

在模型优化过程中,先用小数据集进行验证,然后不断扩充数据(可以的话),在达到一定数据量后发现性能瓶颈时,再考虑更换模型。
数据决定了算法的上限,当给定的样本数据数量都比较多时,简单如fasttext,也能获得和bert类模型差不多的效果。

5.魔改或更换模型

除了数据,对模型也可以进行适当的修改以更匹配自己的业务场景,比如修改损失函数,修改模型对结构等,当然,这个对技能要求比较高,需要非常了解用的模型和任务特点。
除此外,还可以考虑换模型,比如将bert-base换成roberta,Albert,ERNIE等改进的模型。

6.小结

如何选择合适的算法模型?
确定问题类型,找到强baseline模型,从简到易优化模型,先增数据,后改模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1048991.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java | CMD命令认识Java

文章目录 1. CMD命令2. Java概念1.1 Java是什么?1.2下载和安装1.2.1 下载1.2.2 安装1.2.3 JDK的安装目录介绍 1.3 Java语言的发展1.4 Java的三大平台1.4.1 JavaSE1.4.2 JavaME1.4.3 JavaEE 1.5 Java的主要特性1.5.1 Java语言跨平台的原理 1.6 Java中认识 JRE 和 JDK…

文明城市美丽乡村随手拍小程序开源版开发

文明城市美丽乡村随手拍小程序开源版开发 拍照功能:用户可以通过小程序直接打开手机相机,拍摄当前所见的城市或乡村美景。 美化照片功能:用户可以在拍摄或选择的照片上进行美化处理,如调整亮度、对比度、饱和度,添加滤…

为什么通配符SSL证书如此受欢迎?

SSL证书是网站安全的重要保障,而通配符SSL证书更是其中的一种。那么,通配符SSL证书有哪些作用呢?为什么通配符SSL证书如此受欢迎呢?下面,我们就来一起探讨一下。 通配符SSL证书的作用有哪些? 通配符SSL证书…

如何管理好公司的公海客户呢?

销售周期比较长,线索处理比较繁琐,想知道用哪些系统可解决这一问题? 很简单,针对客户管理繁杂,线索复杂的问题,crm系统中的公海池就可以轻松解决。 接下来我将以简道云为例为大家进行详细的公海池介绍 ht…

美容店预约小程序搭建流程

随着科技的不断发展,小程序已经成为了人们生活中不可或缺的一部分。对于美容店来说,搭建一个预约小程序不仅可以提高工作效率,还可以增加客户数量、提高服务质量。那么,如何搭建一个美容店预约小程序呢?本文将为你详细…

计算机竞赛 深度学习大数据物流平台 python

文章目录 0 前言1 课题背景2 物流大数据平台的架构与设计3 智能车货匹配推荐算法的实现**1\. 问题陈述****2\. 算法模型**3\. 模型构建总览 **4 司机标签体系的搭建及算法****1\. 冷启动**2\. LSTM多标签模型算法 5 货运价格预测6 总结7 部分核心代码8 最后 0 前言 &#x1f5…

【N年测试总结】区块链行业测试特点

一、区块链业务系统简介 转入转出业务:这类业务一般会涉及币的转入和转出,转入的流程一般是用户从第三方钱包往用户在公司的地址转入,系统收到用户的转入操作消息通知后,定时在链上监控该地址相关的交易,通过校验各项…

20分钟彻底理解Pointpillars论文-妥妥的

PointPillars: Fast Encoders for Object Detection from Point Clouds PointPillars:快就对了 摘要(可跳过): 这帮人提出了PointPillars,一种新颖的编码器,它利用PointNets来学习以垂直列组织的点云&am…

LaTex一行排列多个图,并且加入每个图都添加小标题

1、Latex中将字母上下方插入字母数字\mathop{a}\limits_{i1}: a i 1 \mathop{a}\limits_{i1} i1a​ 2Latex罗马数字 大写:\uppercase\expandafter{\romannumeral20} 小写:\romannumeral20 2、LaTex一行排列多个图,并且加入每个…

【轮趣-科大讯飞】M260C 环形六麦测试 1 - 产品介绍与配置

原文发布在飞书上,想要的伙伴请联系我,懒得把飞书链接放这了

RK3568驱动指南|第五期-中断-第47章 工作队列传参实验

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…

微信群发消息如何突破200人?

微信群发怎么设置? 1. 打开微信,点击右下角的“我”,然后选择“设置”。 2. 在设置页面中,选择“通用”选项。 3. 在通用页面中,选择“辅助功能”选项。 4. 在功能页面中,你会看到“群发助手”选项。点…

【Mysql专题】一条SQL在Mysql中是如何执行的

目录 前言前置知识课程内容一、Mysql的内部组件结构1.1 Server层1.2 引擎层(Store层) 二、连接器三、查询缓存(Mysql8.0后已移除)四、分析器4.1 词法分析器原理 五、优化器六、执行器学习总结 前言 知其然,当知其所以…

排序:简单选择排序算法分析

选择排序包括简单选择排序以及堆排序。 1.算法分析 每一趟在待排序元素中选取关键字最小的元素加入有序子序列。 n个元素的简单选择排序需要n-1趟处理。 2.代码实现 //交换 void swap(int &a, int &b) {int temp a;a b;b temp; }//简单选择排序 void SelectSort…

定义豪车新理念 远航汽车亮相2023中国(天津)国际汽车展览会

近年来,随着汽车行业竞争持续加剧,老品牌面临积极转型,新势力则经验不足、实力欠佳,到底是难抵市场的风云变幻。在此背景下,有着“老品牌 新势力”双重基因的远航汽车可谓底气十足。作为大运集团携手博世、华为、阿里斑…

nginx 多层代理 + k8s ingress 后端服务获取客户真实ip 配置

1.nginx http 七层代理 修改命令空间: namespace: nginx-ingress : configmap:nginx-configuration kubectl get cm nginx-configuration -n ingress-nginx -o yaml添加如上配置 compute-full-forwarded-for: “true” forwarded-for-header: X-Forwa…

谱瑞PS186|替代PS186方案|TypeC转HDMI4K视频转换方案设计

谱瑞PS186/PS188/PS176,是一系列Type-C/DP转HDMI 4K60的视频转换芯片,其中PS186是DP 2lane转HDMI 4K60,若是设计Type-C转HDMI方案还需加一颗C转DP协议转换芯片,这样成本更高。而集睿致远CS5366单颗芯片即可实现Type-C转HDMI 4K60HZ设计方案. …

python使用mitmproxy和mitmdump抓包以及对手机

mitmproxy是一个中间人角色,供python抓包使用。 本机环境:win10 64位,python3.10.4。首先安装mitmproxy,参考我的文章 记录一下python2和python3在同一台电脑上共存使用并安装各自的库以及各自在pycharm中使用的方法-CSDN博客 一…

【轮趣-科大讯飞】M260C 环形六麦测试 2 - ROS1功能测试与唤醒、语音识别程序解析

所有内容请看: 博客学习目录_Howe_xixi的博客-CSDN博客https://blog.csdn.net/weixin_44362628/article/details/126020573?spm1001.2014.3001.5502原文在飞书,请联系我获取阅读链接,我太懒了

Acwing 835. Trie字符串统计

Acwing 835. Trie字符串统计 题目描述代码展示 题目描述 代码展示 //这个代码的注释好难写&#xff0c;以自己理解为主 #include<iostream>using namespace std; const int N 100010; int idx; // 各个节点的编号&#xff0c;根节点编号为0 int son[N][26];//Trie 树本…