人工智能_大模型052_模型微调012_模型训练结果对比_模型训练过程梳理---人工智能工作笔记0187

news2024/10/6 8:27:55

前面我们训练以后,然后

可以看到训练以后的结果,

可以用自己训练后的情况和这个对比一下.

看看效果

然后我们来看如果我们自己要训练一个模型,对模型进行微调,那么过程是怎么样的?

## 十二、数据准备与处理

### 12.1、数据采集

- 自然来源(如业务日志):真实数据

- Web 抓取:近似数据

- 人造

可以看到首先是收集数据,这里,收集的手段,比如

自然来源:比如业务的日志,以前旧系统的数据,是真实的数据

web抓取:近似的数据 比如我们要做一个导航的大模型,比如去故宫怎么走,可以百度,找到路线以后,整理出过程来,做为训练数据

人造:最后一个版本就是人为的去造了.如果人多,没人10条,也很快.

### 12.2、数据标注

- 专业标注公司

- 定标准,定验收指标

- 预标注

- 反馈与优化

- 正式标注

- 抽样检查:合格->验收;不合格->返工

准确率要定下来是百分之98还是多少,做预标注,报价,预估一下需要多久.

相互沟通好,保证标注出来的效果.

- 众包

- 定标准,定检验指标

- 抽样每个工作者的质量

- 维系高质量标注者社区

- 主动学习:通过模型选择重要样本,由专家标注,再训练模型

- 设计产品形态,在用户

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1652916.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

当前端Vue3为插槽添加单击事件但会立即执行的代码错误

在你的代码中,你希望根据传入的 record 对象动态生成表格操作的配置数组,并且每个操作都有对应的点击事件处理函数。然而,你的代码中存在一些常见的问题需要解决。让我们逐步来看一下: 问题分析 1. 函数调用问题: …

天天搞3D模型可视化大屏,怎能不懂点three.js知识。

three.js是一个基于WebGL的JavaScript库,用于在网页上创建交互式的3D图形和动画。对于可视化大屏来说,three.js具有以下价值: 丰富的3D效果:通过three.js,可以实现各种丰富多样的3D效果,如旋转、缩放、平移…

IDEA使用Maven生成普通项目没有生成iml文件解决方法

右击主目录选择: Open in Terminal 在生成的控制台输入: mvn idea:module 回车便自动生成iml文件啦! 双击下主目录就可以看见啦

【除了协程还有哪些方式可以实现异步编程】

在Unity中,除了使用协程实现异步编程外,还有以下几种方法: 异步加载资源: 使用UnityWebRequest类进行异步加载资源,这在加载网络资源或动态加载资源时非常有用。 using UnityEngine; using UnityEngine.Networking;…

快速搭建webase-front并且部署合约

PS: 因为我开发时候要用到fisco和webase-front,避免官方文档粘贴, 因此直接整理下面的笔记。开发的时候,好粘贴。1.搭建4节点联盟链 前提 curl 一种命令行工具 apt install -y openssl curl创建操作目录, 下载安装脚本 cd ~ && mkdir -p fisco && cd fisco…

跟我学做零售数据分析报表-商品滞销分析

商品滞销的情况很常见,因此商品滞销分析也是基本属于零售数据分析标配内容之一。那么,商品滞销分析报表该怎么做?要做计算哪些指标,怎么分析滞销趋势?别急,奥威BI零售数据分析方案预设了一张BI商品滞销分析…

【生态系统服务】MAXENT、PLUS、USLE、INVEST、供需、VORS、SRP模型、SolVES、NPP及碳源、碳汇、CENTURY、生态经济学

生态系统服务(ecosystem services)是指人类从生态系统获得的所有惠益,包括供给服务(如提供食物和水)、调节服务(如控制洪水和疾病)、文化服务(如精神、娱乐和文化收益)以…

1.数据结构---顺序表

ArrayList 在new的时候并没有进行内存的分配 此时才进行内存分配 两个结论: 第一次Add的时候分配大小为10的内存 扩容是1.5倍扩容

springboot+vue+mybatis基于协同过滤算法的新闻推荐系统+PPT+论文+讲解+售后

本系统为用户而设计制作新闻推荐系统,旨在实现新闻推荐智能化、现代化管理。本新闻推荐管理自动化系统的开发和研制的最终目的是将新闻推荐管理的运作模式从手工记录数据转变为网络信息查询管理,从而为现代管理人员的使用提供更多的便利和条件。使新闻推…

servlet-会话(cookie与session)

servlet会话技术 会话技术cookie创建Cookieindex.jspCookieServlet 获取Cookieindex.jspshowCookie session创建sessionindex.jsplogin.jspLoginServlet 获取sessionRedurectServket 清除会话login.jspClearItmeServlet 会话技术 两种会话:cookie,sessi…

先发优势奠基,三清互联占据有利市场地位

随着我国配电自动化技术的发展,配电网逐步由自动化迈向数字智能化。配电智能化是运用计算机技术、自动控制技术、电子技术和通信技术等,对配电网进行离线与在线的智能化监控管理,使配电网始终处于安全、可靠、优质、经济、高效的运行状态。其…

Java线程池(更新中)

1.线程池介绍 顾名思义,线程池就是管理一系列线程的资源池,其提供了一种限制和管理线程资源的方式。每个线程池还维护一些基本统计信息,例如已完成任务的数量。 总结一下使用线程池的好处: 降低资源消耗。通过重复利用已创建的…

ethercat :推荐一个不错的ethercat主从站开源项目

一、引言 最近在研究EtherCAT,也极有兴趣想要搞通整个底层协议,将来有机会搞自己的软件EtherCAT产品。这里推荐一个不错的开源项目,与志同道合的朋友共同学习。 Ethercat-master 主站地址:https://github.com/OpenEtherCATsociety/SOEM Eth…

《intel开发手册卷1》学习笔记1

1、操作模式 IA-32架构支持三种基本操作模式:保护模式、实地址模式和系统管理模式。操作模式决定了哪些指令和体系结构功能是可访问的: 1)保护模式:该模式是处理器的自然状态。保护模式的功能之一是能够在受保护的多任务环境中直接执行“实地址模式”80…

视频提取gif怎么制作?试试这个网站一键转换

通过把视频转换成gif动图的操作能够更加方便的在各种平台上分享和传播。相较于视频,gif图片具有较小的文件体积,gif动图能够快速的加载播放,不需要等待就能快速欣赏。很适合从事新媒体之类的小伙伴,可以用来做展示、宣传等。想要实…

Bumblebee X系列用于高精度机器人应用的新型立体视觉产品

Bumblebee X是最新的GigE驱动立体成像解决方案,为机器人引导和拾取应用带来高精度和低延迟。 近日,51camera的合作伙伴Teledyne FLIR IIS推出一款用于高精度机器人应用的新型立体视觉产品Bumblebee X系列。 Bumblebee X产品图 BumblebeeX系列&#xff…

大语言模型LLM入门篇

大模型席卷全球,彷佛得模型者得天下。对于IT行业来说,以后可能没有各种软件了,只有各种各样的智体(Agent)调用各种各样的API。在这种大势下,笔者也阅读了很多大模型相关的资料,和很多新手一样&a…

CR80清洁卡的重要性

在我们日常生活中,身份证、银行卡、信用卡等塑料卡片已经成为了不可或缺的一部分。这些卡片通常符合CR80标准,这意味着它们的尺寸和厚度符合国际标准,为了保证这些卡片的读取和使用效果,清洁维护显得尤为重要。 什么是CR80卡&…

xxl-job跨集群调度改造

这篇文章为大家提供一种在多k8s集群中部署一套xxl-job的方案。 问题背景: 公司生产环境有多套k8s集群,为保证服务可用,容器需要部署到不同集群中。单集群中容器间可直接通过本地ip访问,跨集群容器间调用需通过宿主ip映射端口访问…

脸上长斑怎么办?教你一招——如何用新型揿针治疗黄褐斑?

点击文末领取揿针的视频教程跟直播讲解 你有没有发现,女性一到了30岁,脸上总是很容易长出斑点,特别是黄褐斑。 ​ 俗话说,一白遮百丑,一斑毁所有,长斑真的让人伤不起!很多人因为黄褐斑的出现…