【小笔记】面对一个没搞过的任务，如何选择合适的算法模型？

【小笔记】面对一个没搞过的任务，如何选择合适的算法模型？

news2026/2/14 14:14:25

【学而不思则罔，思而不学则殆】
9.28
在这里插入图片描述

1.确定问题定义

确定要解决的问题是一个什么类型，在算法中有没有一个专业的任务名定义它，确定了问题类型就明确了问题解决方向。
有时候我们要解决的问题可能有多种解决问题的角度，此时可能就会对应多个任务类型。
举例：
实体抽取是知识图谱中的一个任务，可以将其视为序列标注任务，也可以将其视为一个阅读理解任务。
有时候待解决的问题可以作为一个复杂的任务，也可以拆分为多个子任务
举例：
实体抽取即可以作为一个完整的任务，也可以拆分为实体边界识别和实体类别分类两个子任务；知识抽取可以作为一个实体-关系联合抽取任务，也可以拆分为实体抽取和关系抽取两个任务。

可以将自己的问题在网上进行搜索，以确定问题定义，最好是找到与场景无关的，更基础的问题定义。
举例：
要做一个文本的情感分类任务，按情感分类任务去查资料可以，但是更建议按文本分类任务去查资料更好，能够获取到更多的模型解决方案。

2.调研baseline模型

确定了问题定义，就去收集它的强baseline模型。多看看网上的资源，比如按“文本分类 baseline”进行查找，在知乎，CSDN，github上都能找到一些资料，多看几篇后，差不多就会有一个初步的认知，至少能获取到一些经典热门的baseline，若想获取到更新更强的baseline模型，则需要查看论文或paperwithcode进行查找。
以文本分类任务为例，通过查资料，会发现fasttext和bert被谈及很多，都可以作为baseline，当有多个模型可供选择时，怎么选？
一种是按照先简后繁的原则，优先选择轻量级的，能快速跑起来看到效果的；一种是按照选新不选旧的原则，即不要选择过时的baseline，选择比较新的。
先用简单模型跑通baseline是非常明智的决定，一方面确定基准，另一方面建立信心。而不是一来就考虑用最牛最复杂的模型，这会花费更多成本。‌

3.模型优化

‌无论是简单的模型还是复杂的模型，都需要优化，且约简单的模型对调参的技巧要求越高，再优化时同样采用先简后繁原则进行模型优化，优先对模型进行调参以提高模型性能，这是一种低成本优化。
当调参后性能无法提升时，则考虑从数据量和模型复杂度连个方面进行高成本优化。

4.增加数据

在模型优化过程中，先用小数据集进行验证，然后不断扩充数据（可以的话），在达到一定数据量后发现性能瓶颈时，再考虑更换模型。
数据决定了算法的上限，当给定的样本数据数量都比较多时，简单如fasttext，也能获得和bert类模型差不多的效果。

5.魔改或更换模型

除了数据，对模型也可以进行适当的修改以更匹配自己的业务场景，比如修改损失函数，修改模型对结构等，当然，这个对技能要求比较高，需要非常了解用的模型和任务特点。
除此外，还可以考虑换模型，比如将bert-base换成roberta，Albert，ERNIE等改进的模型。

6.小结

如何选择合适的算法模型？
确定问题类型，找到强baseline模型，从简到易优化模型，先增数据，后改模型。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1048991.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Java | CMD命令认识Java

Java | CMD命令认识Java

文章目录 1. CMD命令2. Java概念1.1 Java是什么？1.2下载和安装1.2.1 下载1.2.2 安装1.2.3 JDK的安装目录介绍 1.3 Java语言的发展1.4 Java的三大平台1.4.1 JavaSE1.4.2 JavaME1.4.3 JavaEE 1.5 Java的主要特性1.5.1 Java语言跨平台的原理 1.6 Java中认识 JRE 和 JDK…

阅读更多...

文明城市美丽乡村随手拍小程序开源版开发

文明城市美丽乡村随手拍小程序开源版开发

文明城市美丽乡村随手拍小程序开源版开发拍照功能：用户可以通过小程序直接打开手机相机，拍摄当前所见的城市或乡村美景。美化照片功能：用户可以在拍摄或选择的照片上进行美化处理，如调整亮度、对比度、饱和度，添加滤…

阅读更多...

为什么通配符SSL证书如此受欢迎？

SSL证书是网站安全的重要保障，而通配符SSL证书更是其中的一种。那么，通配符SSL证书有哪些作用呢？为什么通配符SSL证书如此受欢迎呢？下面，我们就来一起探讨一下。通配符SSL证书的作用有哪些？ 通配符SSL证书…

阅读更多...

如何管理好公司的公海客户呢？

如何管理好公司的公海客户呢？

销售周期比较长，线索处理比较繁琐，想知道用哪些系统可解决这一问题？ 很简单，针对客户管理繁杂，线索复杂的问题，crm系统中的公海池就可以轻松解决。接下来我将以简道云为例为大家进行详细的公海池介绍 ht…

阅读更多...

美容店预约小程序搭建流程

美容店预约小程序搭建流程

随着科技的不断发展，小程序已经成为了人们生活中不可或缺的一部分。对于美容店来说，搭建一个预约小程序不仅可以提高工作效率，还可以增加客户数量、提高服务质量。那么，如何搭建一个美容店预约小程序呢？本文将为你详细…

阅读更多...

计算机竞赛深度学习大数据物流平台 python

计算机竞赛深度学习大数据物流平台 python

文章目录 0 前言1 课题背景2 物流大数据平台的架构与设计3 智能车货匹配推荐算法的实现**1\. 问题陈述****2\. 算法模型**3\. 模型构建总览 **4 司机标签体系的搭建及算法****1\. 冷启动**2\. LSTM多标签模型算法 5 货运价格预测6 总结7 部分核心代码8 最后 0 前言 &#x1f5…

阅读更多...

【N年测试总结】区块链行业测试特点

【N年测试总结】区块链行业测试特点

一、区块链业务系统简介转入转出业务：这类业务一般会涉及币的转入和转出，转入的流程一般是用户从第三方钱包往用户在公司的地址转入，系统收到用户的转入操作消息通知后，定时在链上监控该地址相关的交易，通过校验各项…

阅读更多...

20分钟彻底理解Pointpillars论文-妥妥的

20分钟彻底理解Pointpillars论文-妥妥的

PointPillars: Fast Encoders for Object Detection from Point Clouds PointPillars：快就对了摘要（可跳过）： 这帮人提出了PointPillars，一种新颖的编码器，它利用PointNets来学习以垂直列组织的点云&am…

阅读更多...

LaTex一行排列多个图，并且加入每个图都添加小标题

LaTex一行排列多个图，并且加入每个图都添加小标题

1、Latex中将字母上下方插入字母数字\mathop{a}\limits_{i1}： a i 1 \mathop{a}\limits_{i1} i1a 2Latex罗马数字大写：\uppercase\expandafter{\romannumeral20} 小写：\romannumeral20 2、LaTex一行排列多个图，并且加入每个…

阅读更多...

【轮趣-科大讯飞】M260C 环形六麦测试 1 - 产品介绍与配置

【轮趣-科大讯飞】M260C 环形六麦测试 1 - 产品介绍与配置

原文发布在飞书上，想要的伙伴请联系我，懒得把飞书链接放这了

阅读更多...

RK3568驱动指南｜第五期-中断-第47章工作队列传参实验

RK3568驱动指南｜第五期-中断-第47章工作队列传参实验

瑞芯微RK3568芯片是一款定位中高端的通用型SOC，采用22nm制程工艺，搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码，支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU，可用于轻量级人工…

阅读更多...

微信群发消息如何突破200人？

微信群发消息如何突破200人？

微信群发怎么设置？ 1. 打开微信，点击右下角的“我”，然后选择“设置”。 2. 在设置页面中，选择“通用”选项。 3. 在通用页面中，选择“辅助功能”选项。 4. 在功能页面中，你会看到“群发助手”选项。点…

阅读更多...

【Mysql专题】一条SQL在Mysql中是如何执行的

【Mysql专题】一条SQL在Mysql中是如何执行的

目录前言前置知识课程内容一、Mysql的内部组件结构1.1 Server层1.2 引擎层（Store层） 二、连接器三、查询缓存（Mysql8.0后已移除）四、分析器4.1 词法分析器原理五、优化器六、执行器学习总结前言知其然，当知其所以…

阅读更多...

排序：简单选择排序算法分析

排序：简单选择排序算法分析

选择排序包括简单选择排序以及堆排序。 1.算法分析每一趟在待排序元素中选取关键字最小的元素加入有序子序列。 n个元素的简单选择排序需要n-1趟处理。 2.代码实现 //交换 void swap(int &a, int &b) {int temp a;a b;b temp; }//简单选择排序 void SelectSort…

阅读更多...

定义豪车新理念远航汽车亮相2023中国（天津）国际汽车展览会

定义豪车新理念远航汽车亮相2023中国（天津）国际汽车展览会

近年来，随着汽车行业竞争持续加剧，老品牌面临积极转型，新势力则经验不足、实力欠佳，到底是难抵市场的风云变幻。在此背景下，有着“老品牌新势力”双重基因的远航汽车可谓底气十足。作为大运集团携手博世、华为、阿里斑…

阅读更多...

nginx 多层代理 + k8s ingress 后端服务获取客户真实ip 配置

nginx 多层代理 + k8s ingress 后端服务获取客户真实ip 配置

1.nginx http 七层代理修改命令空间： namespace: nginx-ingress : configmap：nginx-configuration kubectl get cm nginx-configuration -n ingress-nginx -o yaml添加如上配置 compute-full-forwarded-for: “true” forwarded-for-header: X-Forwa…

阅读更多...

谱瑞PS186|替代PS186方案|TypeC转HDMI4K视频转换方案设计

谱瑞PS186|替代PS186方案|TypeC转HDMI4K视频转换方案设计

谱瑞PS186/PS188/PS176,是一系列Type-C/DP转HDMI 4K60的视频转换芯片，其中PS186是DP 2lane转HDMI 4K60，若是设计Type-C转HDMI方案还需加一颗C转DP协议转换芯片，这样成本更高。而集睿致远CS5366单颗芯片即可实现Type-C转HDMI 4K60HZ设计方案. …

阅读更多...

python使用mitmproxy和mitmdump抓包以及对手机

python使用mitmproxy和mitmdump抓包以及对手机

mitmproxy是一个中间人角色，供python抓包使用。本机环境：win10 64位，python3.10.4。首先安装mitmproxy，参考我的文章记录一下python2和python3在同一台电脑上共存使用并安装各自的库以及各自在pycharm中使用的方法-CSDN博客一…

阅读更多...

【轮趣-科大讯飞】M260C 环形六麦测试 2 - ROS1功能测试与唤醒、语音识别程序解析

【轮趣-科大讯飞】M260C 环形六麦测试 2 - ROS1功能测试与唤醒、语音识别程序解析

所有内容请看： 博客学习目录_Howe_xixi的博客-CSDN博客https://blog.csdn.net/weixin_44362628/article/details/126020573?spm1001.2014.3001.5502原文在飞书，请联系我获取阅读链接，我太懒了

阅读更多...

Acwing 835. Trie字符串统计

Acwing 835. Trie字符串统计

Acwing 835. Trie字符串统计题目描述代码展示题目描述代码展示 //这个代码的注释好难写，以自己理解为主 #include<iostream>using namespace std; const int N 100010; int idx; // 各个节点的编号，根节点编号为0 int son[N][26];//Trie 树本…

阅读更多...

推荐文章

最新文章