【数学】深度学习中的概率基础知识记录

news2024/11/16 1:55:48

基于 Deep Learning (2017, MIT) 书总结了必要的概率知识
原blog 以及用到的Ipython notebook

文章目录

  • 1 概述
  • 2 知识
    • 2.1 离散变量和概率质量函数(PMF)
    • 2.2 连续变量和概率密度函数(PDF)
    • 2.3 边缘概率
    • 2.4 条件概率
    • 2.5 条件概率的链式法则
    • 2.6 独立性和条件独立性
    • 2.7 期望、方差和协方差
    • 2.8 常见概率分布
    • 2.9 常见函数的有用性质
    • 2.10 贝叶斯定理
  • 3 应用问题

1 概述

概率论是表示不确定性陈述的数学框架。在AI领域中,我们以两种主要方式使用概率论。首先,概率定律告诉我们AI系统应该如何推理,因此我们设计算法来计算或近似使用概率论得出的各种表达式。其次,我们可以使用概率和统计来理论上分析所提出的AI系统的行为。

2 知识

2.1 离散变量和概率质量函数(PMF)

对离散变量的概率分布可以用概率质量函数(PMF)来描述。
离散变量 x x x遵循分布 P ( x ) P(x) P(x): x ∼ P ( x ) \mathrm{x}\sim P(x) xP(x)

联合概率分布是许多变量的概率分布: P ( x = x , y = y ) P(\mathrm{x}=x, \mathrm{y}=y) P(x=x,y=y),或者 P ( x , y ) P(x,y) P(x,y)

PMF的特性:

  • P P P的定义域必须是 x \mathrm{x} x的所有可能状态的集合。
  • 对于 ∀ x ∈ x \forall x\in \mathrm{x} xx 0 ≤ P ( x ) ≤ 1 0\leq P(x) \leq 1 0P(x)1
  • ∑ x ∈ x P ( x ) = 1 \sum_{x\in \mathrm{x}}P(x)=1 xxP(x)=1

均匀分布: P ( x = x i ) = 1 K P(\mathrm{x}=x_i)=\dfrac{1}{K} P(x=xi)=K1

2.2 连续变量和概率密度函数(PDF)

概率密度函数(PDF)用于描述连续随机变量的概率分布。PDF的函数 p p p必须满足以下特性:

  • p p p的定义域是 x \mathrm{x} x的所有可能状态的集合。
  • 对于 ∀ x ∈ x \forall x\in \mathrm{x} xx p ( x ) ≥ 0 p(x)\geq0 p(x)0。注意不要求 p ( x ) ≤ 1 p(x)\leq 1 p(x)1
  • ∫ p ( x ) d x = 1 \int p(x)dx=1 p(x)dx=1

PDF不是概率,PDF与PMF不同,PDF可以大于1。离散和连续随机变量的定义方式不同。对于连续随机变量,必要条件是 ∫ p ( x ) d x = 1 \int p(x)dx=1 p(x)dx=1。PDF不直接给出特定状态的概率,而是给出落入 δ x \delta x δx的无穷小区域内的概率,即 p ( x ) δ x p(x)\delta x p(x)δx。变量 x x x位于区间 [ a , b ] [a,b] [a,b]的概率由 ∫ [ a , b ] p ( x ) d x \int_{[a,b]}p(x)dx [a,b]p(x)dx给出。

均匀分布 u ( x ; a , b ) = 1 b − a u(x;a,b)=\dfrac{1}{b-a} u(x;a,b)=ba1 a a a b b b是区间的端点。分号表示参数化。 x x x是函数的参数, a a a b b b是参数。 x ∼ U ( a , b ) x\sim U(a,b) xU(a,b)表示 x x x遵循均匀分布。

2.3 边缘概率

对变量子集的概率分布称为边缘概率分布。例如,对于离散随机变量 x \mathrm{x} x y \mathrm{y} y,已知 P ( x , y ) P(\mathrm{x},\mathrm{y}) P(x,y),可以使用求和规则计算 P ( x ) P(\mathrm{x}) P(x) ∀ x ∈ x \forall x\in \mathrm{x} xx P ( x = x ) = ∑ y P ( x = x , y = y ) P(\mathrm{x}=x)=\sum_{y}P(\mathrm{x}=x, \mathrm{y}=y) P(x=x)=yP(x=x,y=y)。对于连续变量,需要使用积分而不是求和: p ( x ) = ∫ p ( x , y ) d y p(x)=\int p(x,y)dy p(x)=p(x,y)dy

2.4 条件概率

计算某个事件发生的概率,已知某些其他事件已发生。这是条件概率 P ( y = y ∣ x = x ) P(\mathrm{y}=y|\mathrm{x}=x) P(y=yx=x) x = x \mathrm{x}=x x=x是条件。可以使用公式 P ( y = y ∣ x = x ) = P ( y = y , x = x ) P ( x = x ) P(\mathrm{y}=y|\mathrm{x}=x)=\dfrac{P(\mathrm{y}=y,\mathrm{x}=x)}{P(\mathrm{x}=x)} P(y=yx=x)=P(x=x)P(y=y,x=x)来计算。

条件概率仅在 P ( x = x ) > 0 P(\mathrm{x}=x)>0 P(x=x)>0时定义。我们不能计算条件是从不发生事件的条件概率。

2.5 条件概率的链式法则

任何多个随机变量的联合概率分布可以分解为对单个变量的条件分布,这称为链式法则或乘法规则。 P ( x ( 1 ) , … , x ( n ) ) = P ( x ( 1 ) ) Π i = 2 n P ( x ( i ) ∣ x ( 1 ) , … , x ( i − 1 ) ) P(\mathrm{x}^{(1)},\ldots,\mathrm{x}^{(n)})=P(\mathrm{x}^{(1)})\Pi_{i=2}^nP(\mathrm{x}^{(i)}|\mathrm{x}^{(1)},\ldots,\mathrm{x}^{(i-1)}) P(x(1),,x(n))=P(x(1))Πi=2nP(x(i)x(1),,x(i1))

一些例子:
P ( a , b , c ) = P ( a ∣ b , c ) P ( b , c ) P(a,b,c)=P(a|b,c)P(b,c) P(a,b,c)=P(ab,c)P(b,c);
P ( b , c ) = P ( b ∣ c ) P ( c ) P(b,c)=P(b|c)P(c) P(b,c)=P(bc)P(c);
P ( a , b , c ) = P ( a ∣ b , c ) P ( b ∣ c ) P ( c ) P(a,b,c)=P(a|b,c)P(b|c)P(c) P(a,b,c)=P(ab,c)P(bc)P(c)

2.6 独立性和条件独立性

如果 x x x y y y是独立的( x ⊥ y x\perp y xy),则: ∀ x ∈ x , y ∈ y , p ( x = x , y = y ) = p ( x = x ) p ( y = y ) \forall x\in \mathrm{x}, y \in \mathrm{y}, p(\mathrm{x}=x, \mathrm{y}=y)=p(\mathrm{x}=x)p(\mathrm{y}=y) xx,yy,p(x=x,y=y)=p(x=x)p(y=y)

给定随机变量 z z z,如果 x x x y y y在条件 z z z下独立( x ⊥ y ∣ z x\perp y|z xyz),则:
∀ x ∈ x , y ∈ y , z ∈ z , p ( x = x , y = y , z = z ) = p ( x = x ∣ z = z ) p ( y = y ∣ z = z ) \forall x\in \mathrm{x}, y\in \mathrm{y}, z\in \mathrm{z}, p(\mathrm{x}=x, \mathrm{y}=y, \mathrm{z}=z)=p(\mathrm{x}=x|\mathrm{z}=z)p(\mathrm{y}=y|\mathrm{z}=z) xx,yy,zz,p(x=x,y=y,z=z)=p(x=xz=z)p(y=yz=z)

2.7 期望、方差和协方差

期望

对于离散变量: E x ∼ P [ f ( x ) ] = ∑ x P ( x ) f ( x ) \mathbb{E}_{\mathrm{x}\sim P}[f(x)]=\sum_{x}P(x)f(x) ExP[f(x)]=xP(x)f(x)

对于连续变量: E x ∼ P [ f ( x ) ] = ∫ P ( x ) f ( x ) d x \mathbb{E}_{\mathrm{x}\sim P}[f(x)]=\int{P(x)f(x)}dx ExP[f(x)]=P(x)f(x)dx

期望是线性的: E x [ α f ( x ) + β g ( x ) ] = α E x [ f ( x ) ] + β E x [ g ( x ) ] \mathbb{E}_{\mathrm{x}}[\alpha f(x)+\beta g(x)]=\alpha \mathbb{E}_{\mathrm{x}}[f(x)] + \beta \mathbb{E}_{\mathrm{x}}[g(x)] Ex[αf(x)+βg(x)]=αEx[f(x)]+βEx[g(x)]

方差

V a r ( f ( x ) ) = E [ ( f ( x ) − E [ f ( x ) ] ) 2 ] Var(f(x))=\mathbb{E}[(f(x)-\mathbb{E}[f(x)])^2] Var(f(x))=E[(f(x)E[f(x)])2]

当方差很小时, f ( x ) f(x) f(x)的值会聚集在其期望值附近。方差的平方根称为标准差

协方差

协方差给出两个值之间线性相关的程度,以及这些变量的尺度:
C o v ( f ( x ) , g ( y ) ) = E [ ( f ( x ) − E [ f ( x ) ] ) ( g ( y ) − E [ g ( y ) ] ) ] Cov(f(x),g(y))=\mathbb{E}[(f(x)-\mathbb{E}[f(x)])(g(y)-\mathbb{E}[g(y)])] Cov(f(x),g(y))=E[(f(x)E[f(x)])(g(y)E[g(y)])]

协方差的绝对值较高意味着这些值变化很大,并且同时远离各自的均值。正号表示两个变量倾向于同时取相对较高的值。负号表示一个变量取得高值,另一个变量取得低值,反之亦然。

协方差与相关的关系:

  • 独立变量的协方差为零。非零协方差的变量是相关的。
  • 独立性是比零协方差更强的要求。两个变量可以相关,但协方差为零。

随机向量 x ∈ R n \mathbf{x}\in \mathbb{R}^n xRn的协方差矩阵是一个 n × n n\times n n×n矩阵: C o v ( x ) i , j = C o v ( x i , x j ) Cov(\mathbf{x})_{i,j}=Cov(\mathbf{x}_i,\mathbf{x}_j) Cov(x)i,j=Cov(xi,xj)
协方差的对角线元素给出了方差: C o v ( x i , x i ) = V a r ( x i ) Cov(\mathbf{x}_i,\mathbf{x}_i)=Var(\mathbf{x}_i) Cov(xi,xi)=Var(xi)

2.8 常见概率分布

在机器学习中有几个有用的概率分布。

伯努利分布

分布在单个二进制随机变量上。特性:

  • P ( x = 1 ) = ϕ P(\mathbf{x}=1)=\phi P(x=1)=ϕ p ( x = 0 ) = 1 − ϕ p(\mathbf{x}=0)=1-\phi p(x=0)=1ϕ
  • P ( x = x ) = ϕ x ( 1 − ϕ ) 1 − x P(\mathbf{x}=x)=\phi^x(1-\phi)^{1-x} P(x=x)=ϕx(1ϕ)1x
  • E x [ x ] = ϕ \mathbb{E}_{\mathbf{x}}[\mathbf{x}]=\phi Ex[x]=ϕ
  • V a r x ( x ) = ϕ ( 1 − ϕ ) Var_\mathbf{x}(\mathbf{x})=\phi(1-\phi) Varx(x)=ϕ(1ϕ)

多项式分布

或分类分布,是具有 k k k个不同状态的单个离散变量的分布。

高斯分布

或正态分布:
N ( x ; μ , σ 2 ) = 1 2 π σ 2 exp ⁡ ( − 1 2 σ 2 ( x − μ ) 2 ) \mathcal{N}(x;\mu,\sigma^2)=\sqrt{\dfrac{1}{2\pi \sigma^2}}\exp(-\dfrac{1}{2\sigma^2(x-\mu)^2}) N(x;μ,σ2)=2πσ21 exp(2σ2(xμ)21)

  • μ \mu μ给出了中心峰值的坐标,这也是分布的均值: E [ x ] = μ \mathbb{E}[\mathbf{x}]=\mu E[x]=μ
  • 分布的标准差: σ \sigma σ
  • 方差: σ 2 \sigma^2 σ2

在这里插入图片描述

指数和拉普拉斯分布

指数分布: p ( x ; λ ) = λ 1 x ≥ 0 exp ⁡ ( − λ x ) p(x;\lambda)=\lambda 1_{x\geq 0} \exp(-\lambda x) p(x;λ)=λ1x0exp(λx)

对于所有负值的 x x x,概率为零。

拉普拉斯分布: L a p l a c e ( x ; μ , γ ) = 1 2 γ exp ⁡ ( − ∣ x − μ ∣ γ ) Laplace(x;\mu,\gamma)=\dfrac{1}{2\gamma}\exp(-\dfrac{|x-\mu|}{\gamma}) Laplace(x;μ,γ)=2γ1exp(γxμ)

狄拉克分布和经验分布

狄拉克分布: p ( x ) = δ ( x − μ ) p(x)=\delta (x-\mu) p(x)=δ(xμ)

经验分布: p ^ ( x ) = 1 m ∑ i = 1 m δ ( x − x ( i ) ) \hat{p}(x)=\dfrac{1}{m}\sum_{i=1}^m\delta(x-x^{(i)}) p^(x)=m1i=1mδ(xx(i))

2.9 常见函数的有用性质

Logistic sigmoid 函数

σ ( x ) = 1 1 + exp ⁡ ( − x ) \sigma(x)=\dfrac{1}{1+\exp(-x)} σ(x)=1+exp(x)1

它通常用于生成 Bermoulli 分布的 ϕ \phi ϕ 参数。当其参数非常正或负时,sigmoid 函数饱和,意味着函数变得非常平坦,对其输入的微小变化不敏感。

Softplus 函数

ζ ( x ) = log ⁡ ( 1 + exp ⁡ ( x ) ) \zeta(x)=\log(1+\exp(x)) ζ(x)=log(1+exp(x))

该函数可用于生成正态分布的 β \beta β σ \sigma σ 参数。

在这里插入图片描述

重要性质

  • σ ( x ) = exp ⁡ ( x ) exp ⁡ ( x ) + 1 \sigma(x)=\dfrac{\exp(x)}{\exp(x)+1} σ(x)=exp(x)+1exp(x)
  • d d x σ ( x ) = σ ( x ) ( 1 − σ ( x ) ) \dfrac{d}{dx}\sigma(x)=\sigma(x)(1-\sigma(x)) dxdσ(x)=σ(x)(1σ(x))
  • 1 − σ ( x ) = σ ( − x ) 1-\sigma(x)=\sigma(-x) 1σ(x)=σ(x)
  • log ⁡ σ ( x ) = − ζ ( − x ) \log\sigma(x) = -\zeta(-x) logσ(x)=ζ(x)
  • d d x ζ ( x ) = σ ( x ) \dfrac{d}{dx}\zeta(x)=\sigma (x) dxdζ(x)=σ(x)
  • ∀ x ∈ ( 0 , 1 ) , σ − 1 ( x ) = log ⁡ ( x 1 − x ) \forall x\in (0,1), \sigma^{-1}(x)=\log(\dfrac{x}{1-x}) x(0,1),σ1(x)=log(1xx)
  • ∀ x > 0 , ζ − 1 ( x ) = log ⁡ ( exp ⁡ ( x ) − 1 ) \forall x > 0, \zeta^{-1}(x)=\log (\exp(x)-1) x>0,ζ1(x)=log(exp(x)1)
  • ζ ( x ) = ∫ − ∞ x σ ( y ) d y \zeta(x)=\int_{-\infin}^{x}\sigma(y)dy ζ(x)=xσ(y)dy
  • ζ ( x ) − ζ ( − x ) = x \zeta (x) - \zeta(-x) = x ζ(x)ζ(x)=x

2.10 贝叶斯定理

P ( x ∣ y ) = P ( x ) P ( y ∣ x ) P ( y ) P(x|y)=\dfrac{P(x)P(y|x)}{P(y)} P(xy)=P(y)P(x)P(yx)

通过 P ( y ∣ x ) P(y|x) P(yx) 计算 P ( x ∣ y ) P(x|y) P(xy),注意 P ( y ) = ∑ x P ( y ∣ x ) P ( x ) P(y)=\sum_xP(y|x)P(x) P(y)=xP(yx)P(x)。贝叶斯定理是一种在拥有一些信息情况下计算某件事发生可能性的方法。

3 应用问题

问题1:有一个公平的硬币(一面是正面,一面是反面)和一个不公平的硬币(两面都是反面)。你随机选择一个硬币,抛掷5次,观察到全部5次都是反面。你抛的是不公平的硬币的几率是多少?

定义 U U U 为抛出不公平硬币的情况; F F F 表示抛出公平硬币。 5 T 5T 5T 表示我们连续抛出5次正面的事件。
我们知道 P ( U ) = P ( F ) = 0.5 P(U) = P(F) = 0.5 P(U)=P(F)=0.5,需要求解 P ( U ∣ 5 T ) P(U|5T) P(U∣5T)
P ( U ∣ 5 T ) = P ( 5 T ∣ U ) P ( U ) P ( 5 T ) P(U|5T) = \dfrac{P(5T|U)P(U)}{P(5T)} P(U∣5T)=P(5T)P(5TU)P(U) = 1 ∗ 0.5 P ( 5 T ∣ U ) P ( U ) + P ( 5 T ∣ F ) P ( F ) =\dfrac{1*0.5}{P(5T|U)P(U)+P(5T|F)P(F)} =P(5TU)P(U)+P(5TF)P(F)10.5 = 0.5 1 ∗ 0.5 + 0. 5 5 ∗ 0.5 ≈ 0.97 =\dfrac{0.5}{1*0.5+0.5^5*0.5}\approx0.97 =10.5+0.550.50.50.97
因此,选择了不公平硬币的概率约为97%。

问题2:你和你的朋友正在玩一个游戏。你们两个将继续抛硬币,直到序列 HH 或 TH 出现为止。如果先出现 HH,你赢。如果先出现 TH,你的朋友赢。每个人的获胜概率是多少?

P(HH 先出现而不是 TH) = P(前两次抛出 HH) = 1/4

P(TH 先出现而不是 HH) = P(首次为 T) + P(前两次为 HT) = 1/2 + 1/4 = 3/4

问题3:1000人中有1人患有一种特定的疾病,并且有一种检测方法,如果患有该疾病,检测正确率为98%。如果没有患病,检测错误率为1%。如果有人检测为阳性,他们患病的几率是多少?

P(D) = 1/1000 表示患有疾病的概率
P(H) = 1 - P(D) = 999/1000 表示健康的概率
P(P|D) = 98% 表示如果患有疾病,则检测为阳性的概率
P(P|H) = 1% 表示如果没有患病,则检测为阳性的概率

需要求解 P(D|P)

P ( D ∣ P ) = P ( P ∣ D ) P ( D ) P ( P ) P(D|P)=\dfrac{P(P|D)P(D)}{P(P)} P(DP)=P(P)P(PD)P(D) = 98 / 100 ∗ 1 / 1000 P ( P ∣ D ) P ( D ) + P ( P ∣ H ) P ( H ) = \dfrac{98/100*1/1000}{P(P|D)P(D) + P(P|H)P(H)} =P(PD)P(D)+P(PH)P(H)98/1001/1000 = 0.098 % 98 % ∗ 1 / 1000 + 1 % ∗ 999 / 1000 = \dfrac{0.098\%}{98\%*1/1000 + 1\% * 999/1000} =98%1/1000+1%999/10000.098% ≈ 8.94 % \approx 8.94\% 8.94%

因此,如果有人检测为阳性,则他们患病的概率约为0.0894或8.94%。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1616514.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

项目实战 | 责任链模式 (下)

案例二:工作流,费用报销审核流程 同事小贾最近刚出差回来,她迫不及待的就提交了费用报销的流程。根据金额不同,分为以下几种审核流程。报销金额低于1000元,三级部门管理者审批即可,1000到5000元除了三级部…

Docker 的基本管理

一. 云的相关知识 1. 关于云 云端服务器都有哪些提供商: 国内: 阿里云(Alibaba Cloud): 提供ECS(Elastic Compute Service)弹性计算服务,包括通用型、计算型、内存型等多种实例…

go的编译以及运行时环境

开篇 很多语言都有自己的运行时环境,go自然也不例外,那么今天我们就来讲讲go语言的运行时环境! 不同语言的运行时环境对比 我们都知道Java的运行时环境是jvm ,javascript的运行时环境是浏览器内核 Java -->jvm javascript…

modelsim波形高度异常,值为X

一、问题 波形高度异常,忽高忽低,正常波形高电平和低电平是统一高度的 timescale 1ns/1nsmodule key_test_tb();//parameter define parameter CLK_PERIOD 20; parameter CNT_MAX 25d25; //仅用于仿真,对应 500nsreg sys_clk; //周期 20ns reg d; wir…

AJAX——Promise-链式调用

1.Promise链式调用 概念:依靠then()方法会返回一个新生成的Promise对象特性,继续串联下一环任务,知道结束 细节:then()回调函数中的返回值,会影响新生成的Promise对象最终状态和结果 好处:通过链式调用&…

基于 Spring Boot 博客系统开发(二)

基于 Spring Boot 博客系统开发(二) 本系统是简易的个人博客系统开发,为了更加熟练地掌握SprIng Boot 框架及相关技术的使用。🌿🌿🌿 基于 Spring Boot 博客系统开发(一)&#x1f4…

JavaSE-14笔记【反射机制(+2024新)】

文章目录 1.反射机制概述2.获取Class的四种方式3.通过反射机制实例化对象*4.反射机制结合配置文件灵活实例化对象*5.java.lang.reflect.Field5.1反编译类中的所有字段/属性5.2 通过反射机制给属性赋值* 6.java.lang.reflect.Method6.1反编译类中的所有方法6.2 通过反射机制调用…

实验4 数字频率计

实验目的: 1、使用铆孔U7输出一个脉冲,频率不定。 2、使用铆孔V7测量脉冲频率,并在数码管上显示。 实验内容及步骤: 设计原理 测量频率的方法有很多,按照其工作原理分为无源测量法、比较法、示波器法和计数法等。…

【RT-Thread应用笔记】RA8D1-VisionBoard上的RW007实践——WiFi延迟和带宽测试

【RT-Thread应用笔记】RA8D1-VisionBoard上的RW007实践——WiFi延迟和带宽测试 一、准备环境1.1 安装RT-Thread Studio1.2 安装开发板支持包1.3 安装调试器支持包1.4 安装工具链支持包 二、创建项目2.1 创建RT-Thread项目 三、编译下载3.1 编译代码3.2 下载程序 四、WiFi测试4.…

每日一题---移除链表元素

文章目录 前言1.题目2.分析思路3.参考代码 前言 Leetcode–-移除链表元素 1.题目 2.分析思路 首先要创建一个新的链表,在定义三个指针,newHead,newTail和pcur,分别代表新链表头,新链表尾以及用于遍历原链表。 其次是…

LinkedBlockingQueue源码

LinkedBlockingQueue源码 LinkedBlockingQueue介绍 【1】LinkedBlockingQueue是一个基于链表实现的阻塞队列,默认情况下,该阻塞队列的大小为Integer.MAX_VALUE,由于这个数值特别大,所以 LinkedBlockingQueue 也被称作无界队列&a…

RuoYi-Vue-Plus (SaToken 注解鉴权)

一、SaInterceptor 注解鉴权和路由拦截鉴权 拦截器:SaInterceptor 实现类位置: cn.dev33.satoken.interceptor.SaInterceptor 功能:Sa-Token 综合拦截器,提供注解鉴权和路由拦截鉴权能力 /*** 创建一个 Sa-Token 综合拦截器&…

一句话或一张图讲清楚系列之——IDELAYE2的用法

主要参考: Xilinx IDELAYE2应用笔记及仿真实操-CSDN博客 xilinx原语介绍及仿真——IDELAYE2 & IDELAYCTRL_idelayctrl原语使用说明-CSDN博客 1 原理 IDELAYE2一般用于对输入lvds高速信号进行延时微调,可以把时钟和数据都单独微调;如果数…

Spring Cloud学习笔记(Feigh):简介,实战简单样例

这是本人学习的总结,主要学习资料如下 - 马士兵教育 1、Netflix Feign简介2、Open Feign的简单样例2.1、dependency2.2、代码样例 1、Netflix Feign简介 Netfilx Feign是用来帮助发送远程服务的,它让开发者觉得调用远程服务就像是调用本地方法一样&…

【第4讲】XTuner 微调 LLM:1.8B、多模态、Agent

目录 1 简介2 基础知识2.1 finetune简介2.2 xtuner简介2.2.1 技术架构2.2.2 快速上手xtuner 2.3 8GB显存玩转LLM(intern1.8b)2.3.1 flash attention vs deepspeed zero2.3.2 相关版本更新和使用 2.4 多模态LLM2.4.1 多模态LLaVA基本原理简介2.4.2 快速上…

【xhs爬虫软件】把小红书博主发布笔记API接口user_posted接口封装成GUI采集工具!

用Python开发的爬虫采集软件,可自动抓取小红书博主的已发布笔记。 小红书的已发布笔记接口URL: # 请求地址 posted_url https://edith.xiaohongshu.com/api/sns/web/v1/user_posted开发者模式分析过程: 进而封装成GUI界面软件,…

Vue 3中的ref和toRefs:响应式状态管理利器

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

05_Flutter屏幕适配

05_Flutter屏幕适配 一.屏幕适配方案 通过指定基准屏宽度,进行适配,基准屏宽度取决于设计图的基准宽度,以iphone 14 pro max为例, devicePixelRatio 物理宽度 / 逻辑宽度(基准宽度) iphone 14 pro max的物理尺寸宽度为1290&…

opencv_5_图像像素的算术操作

方法1:调用库函数 void ColorInvert::mat_operator(Mat& image) { Mat dst; Mat m Mat::zeros(image.size(), image.type()); m Scalar(2, 2, 2); multiply(image, m, dst); m1 Scalar(50,50, 50); //divide(image, m, dst); //add(im…

【web开发网页制作】html+css家乡长沙旅游网页制作(4页面附源码)

家乡长沙网页制作 涉及知识写在前面一、网页主题二、网页效果Page1、主页Page2、历史长沙Page3、著名人物Page4、留言区 三、网页架构与技术3.1 脑海构思3.2 整体布局3.3 技术说明书 四、网页源码HtmlCSS 五、源码获取5.1 获取方式 作者寄语 涉及知识 家乡长沙网页制作&#x…