2024-01-06-AI 大模型全栈工程师 - 机器学习基础

news2024/12/23 14:41:23

摘要

2024-01-06 阴 杭州 晴

本节简介:
a. 数学模型&算法名词相关概念;
b. 学会数学建模相关知识;
c. 学会自我思考,提升认知,不要只会模仿;

课程内容

1. Fine-Tuning 有什么作用?

a. 什么是模型训练(Training)
b. 什么是模型预训练(Pre-Training)
c. 微调(Fine-Tuning)
d. 轻量化微调(Parameter Efficient Fine-Tuning,PEFT)

2. 什么是模型?

a. 模型是一个函数(一种逻辑实现)
a.1 接受一定范围内的参数;
a.2 预测输出;

b. 模型训练是什么?
b.1 我们有一系列的入参,比如年龄,收入,性格等指标;
b.2 基于调研和记录采集到了一定参数指标下的观测数据;
b.3 求解二者关系的过程,就是数学建模,不断求解优化的过程就是模型训练;

3. 什么是模型训练?

4. 求解器

为了训练过程取得更好的收益,人们设计了很多复杂的求解器;

重点: 最常用的求解器是 Adam || AdamW

5. 常用的损失函数

a. 两个数值的差距: Min Square Error
b. 两个向量之间的(欧式)距离
c. 两个向量之间的夹角(余弦距离)
d. 概率分支之间的差异: 交叉熵

备注: 损失函数之间可以组合使用,例如预先定义的权重也叫超参;

6. 基于 PyTorch 训练一个最简单的神经网络

代码通过 ChatGPT 自行学习;

7. 自然语言处理常见的网络结构

a. 文本卷积神经网络 TextCNN

b. 循环神经网络 RNN

简易的 RNN 有很多问题,最大的问题就是随着序列长度的增加,将会出现梯度消失或者梯度爆炸的现象。

备注: LSTM 和 GRU 通过 [门] 来控制上下文的状态被记住或是遗忘,同时防止梯度消失或者梯度爆炸。

8. Transformer 江山一统

总结

小结: 机器学习基础,任重道远,但是基本的概念早就了解了,反复碎碎念。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1425071.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot144基于mvc的高校办公室行政事务管理系统设计与实现

简介 【毕设源码推荐 javaweb 项目】基于springbootvue 的 适用于计算机类毕业设计,课程设计参考与学习用途。仅供学习参考, 不得用于商业或者非法用途,否则,一切后果请用户自负。 看运行截图看 第五章 第四章 获取资料方式 **项…

VMware虚拟机安装统信uos桌面专业版操作系统系统

统信uos桌面版版本对比:https://www.uniontech.com/next/product/desktop-contrast专业版只要是面向政企等单位,这里只是用虚拟机安装测试基本功能使用,对于我们个人要长期使用的话可以使用家庭版或者社区版 1镜像下载 1.1打开官网 镜像在统信生态社区下载统信生态社区官网:…

C#,洛布数(Lobb Number)的计算方法与源代码

1 洛布数(Lobb Number) 在组合数学中,洛布数(Lobb Number)L(m,n)计算nm开括号的排列方式,以形成一个有效的平衡括号序列的开始。 Lobb数由两个非负整数m和n参数化,其中n>m>0。…

【金蝶BI方案】用一张报表,分析生产完成情况

当老板问生产完成地怎样?难道还能拿出一叠报表让老板逐个细看?奥威-金蝶BI方案只用一张BI数据可视化报表就把整个生产完成情况给讲明白了。甚至还能满足老板想从不同角度进行分析的需求。 奥威-金蝶BI方案-BI生产完成情况报表 这张报表总结计算了生产合…

微软新的内部开发部门发现了第一个 Windows 12 版本

Windows 11 被证明让很多人有点失望,很多 Windows 10 用户认为没有理由升级。 这意味着有大量用户渴望一些大而令人印象深刻的东西——而这正是 Windows 12 所希望的。 无论您是 Windows 10 的忠实拥趸,还是渴望更新、更闪亮的 Windows 11 采用者&#x…

工具方法 - 找富婆包养的必胜法则

【标准的问题解决方法,以及作业标准与标准作业】 第一步: 明确问题 你的人生轨迹是: 你要解决的问题是,找到自己的爱人。 而立之年,恋爱结婚已成为一大任务! 第二步:了解现状 我们在做计划之前必须进行一…

vit细粒度图像分类(七)TBNet学习笔记

1.摘要 细粒度鸟类图像识别致力于实现鸟类图像的准确分类,是机器人视觉跟踪中的一项基础性工作。鉴于濒危鸟类的监测和保护对保护濒危鸟类具有重要意义,需要采用自动化方法来促进鸟类的监测。在这项工作中,我们提出了一种新的基于机器人视觉…

Qt读写Execl:QXlsx库

Qt三方库开发技术:QXlsx介绍、编译和使用 我自己记录的实例代码:https://download.csdn.net/download/cao_jie_xin/88795216 目录 一、概述二、下载三、编译四、加载QXlsx静态库五、介绍一些常用的功能1、一些头文件和命名空间2、创建一个excel文件3、…

二进制安全虚拟机Protostar靶场(5)堆的简单介绍以及实战 heap0

前言 这是一个系列文章,之前已经介绍过一些二进制安全的基础知识,这里就不过多重复提及,不熟悉的同学可以去看看我之前写的文章 什么是堆 堆是动态内存分配的区域,程序在运行时用来分配内存。它与栈不同,栈用于静态…

外包干了8个月,技术退步明显...

先说一下自己的情况,大专生,18年通过校招进入武汉某软件公司,干了接近4年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落! 而我已经在一个企业干了四年的功能测…

2023安防行业十件大事,一定有你关心的

2023年对我国安防行业来说,可以说是既充满希望又充满不确定性的一年。经历三年的市场低迷,2023年安防市场开始逐渐回暖,行业景气度缓慢上升。 那么,2023年我国安防行业都发生了哪些值得铭记的大事?哪些事件对安防产业…

手把手教测试,全网内容最全最深-jmeter-Throughput Controller(吞吐量控制器)

5.1.6.15.Throughput Controller(吞吐量控制器) 用来控制后代组件的执行的次数。有两种模式:百分比和次数;不会影响取样器的 TPS,只影响执行次数。 1.按照次数执行: 1).勾选Per User: 2).不勾选Per User&#xff1a…

Skywalking trace UI页面中字段信息详解,包括端点、跨度类型和Peer

刚上手Skywalking的同学可能对 trace UI 页面信息中的字段信息不是很了解,在这里就给大家一一讲解,重点关注端点、跨度类型和Peer 服务 :服务的名称 实例:服务对应的实例 端点:端点(Endpoint) 对于特定服务所接收的请求路径, 如…

Wampserver 切换中文时无法启动报错处理

在使用 Wampserver 软件时默认为英语,可以看到有语言选择功能,切换其他语言。但选择中文切换后,软件重启时报如下错误: The configuration file contains a systax error on line 44:[EParseError] Mismatched or misplaced quoue…

【Linux】VMware Workstation16安装银河麒麟高级服务器操作系统V10 SP3 AMD64

目录 一、麒麟服务器概述 二、安装步骤 设置硬盘大小 完成配置 修改内存 处理器等设备配置 选择直接安装 配置磁盘 网络配置 设置root账号密码 开始安装 启动完成 一、麒麟服务器概述 银河麒麟高级服务器操作系统V10是针对企业级关键业务,适应虚拟化、云…

PyTorch 中神经网络库torch.nn的详细介绍

1. torch.nn torch.nn 是 PyTorch 深度学习框架中的一个核心模块,它为构建和训练神经网络提供了丰富的类库。 以下是 torch.nn 的关键组成部分及其功能: nn.Module 类: nn.Module 是所有自定义神经网络模型的基类。用户通常会从这个类派生…

vue3 watch和watchEffect

Watch监听ref定义的数据 1.ref数据基本数据类型 let sumref(0) const stopWatchwatch(sum,(new,old)>{ If(new>10){ stopWatch() } console.log(‘sum数据变化了’) })2.ref数据为对象类型,监听的是对象的地址值,若想监听…

一篇文章带你弄懂MySQL事务!(事务特性ACID、并发读的问题、事务的隔离等级、Read View 原理、可重复读和读提交分别怎么工作)

文章目录 一、什么是事务?二、事务有哪些特性?(ACID)三、认识事务的提交和回滚四、并行事务会引发什么问题?1.脏读2.不可重复读3.幻读 五、事务的隔离级别六、Read View 在 MVCC 里如何工作的?七、可重复读…

【PyRestTest】高级使用

本节主要涉及PyRestTest的高级特征的详细使用,主要指:generators(生成器), variable binding(变量绑定), data extraction(数据提取), content validators(文本验证) 它们是如何组合在一起的? 模板和上下文 测试和基准测试可以使用变量来模板化动态配置。使用基础的…

钉钉机器人关键词推送

钉钉机器人只勾选关键词,不选其它校验方式,只会校验发送内容中是否包含关键词 例如我设置关键词是robot {"msgtype": "text","text": {"content": "robot:抢票成功!"},"at":{"isAtAl…