ccc-台大林轩田机器学习基石-hw0

news2024/11/24 12:49:09

文章目录

      • 1 Probability and Statistics
      • 2 Linear Algebra
      • 3.Calculus
      • 一览图
      • hw0题目链接

1 Probability and Statistics

image-20230208154728804
不妨假设 C ( n , K ) = C ( n , K ) , 0 ≤ K ≤ N C(n, K)=C(n, K) ,0 \le K\le N C(n,K)=C(n,K)0KN成立,只需证明 C ( n + 1 , K ) = ( n + 1 ) ! K ! ( n − K + 1 ) ! , 0 ≤ K ≤ N C(n+1, K)=\frac {(n+1)!}{K!(n-K+1)!} ,0 \le K\le N C(n+1,K)=K!(nK+1)!(n+1)!0KN即可

  1. K=0, C ( n + 1 , K ) = 1 C(n+1, K)=1 C(n+1,K)=1,符合假设
  2. 1 ≤ K ≤ n 1\le K\le n 1Kn,如下

C ( n + 1 , K ) = C ( n , K ) + C ( n , K − 1 ) = n ! K ! ( n − K ) ! + n ! ( K − 1 ) ! ( n − K + 1 ) ! = n ! ( n − K + 1 + K ) K ! ( n − K + 1 ) ! = n ! ( n + 1 ) K ! ( n − K + 1 ) ! = ( n + 1 ) ! K ! ( n − K + 1 ) ! \begin{aligned}C(n+1, K)&=C(n, K)+C(n,K-1)\\&=\frac {n!}{K!(n-K)!}+ \frac {n!}{(K-1)!(n-K+1)!}\\&=\frac {n!(n-K+1 + K)}{K!(n-K+1)!}\\&=\frac {n!(n+1)}{K!(n-K+1)!}\\&=\frac {(n+1)!}{K!(n-K+1)!}\end{aligned} C(n+1,K)=C(n,K)+C(n,K1)=K!(nK)!n!+(K1)!(nK+1)!n!=K!(nK+1)!n!(nK+1+K)=K!(nK+1)!n!(n+1)=K!(nK+1)!(n+1)!
image-20230208160258413

  • 10次硬币4次正面 C 10 4 2 10 = 105 512 \frac{C_{10}^{4}}{2^{10}}=\frac {105}{512} 210C104=512105
  • 13组,选2组进行组合 13 × 12 × C 4 3 × C 4 2 C 52 5 = 6 4165 \frac {13\times 12 \times C_4^3 \times C_4^2}{C_{52}^5}=\frac {6}{4165} C52513×12×C43×C42=41656
    image-20230208160931882
  • P ( 三次投掷有一次正面) = 1 − 1 8 = 7 8 P(三次投掷有一次正面)=1-\frac{1}{8}=\frac{7}{8} P(三次投掷有一次正面)=181=87
  • P ( 三次投掷有三次次正面) = 1 8 P(三次投掷有三次次正面)=\frac{1}{8} P(三次投掷有三次次正面)=81
    p = 1 8 7 8 = 1 7 \mathbb p=\frac{\frac{1}{8}}{\frac{7}{8}}=\frac{1}{7} p=8781=71

image-20230208162233525

  • 随机位为0应该题目写错了,理解为大于小于0即可
    A = { ∣ X ∣ = 1 } B = { X < 0 } \begin{aligned}A&=\{|X| =1 \}\\B&=\{X<0 \}\end{aligned} AB={X=1}={X<0}

p = P ( B ∣ A ) = P ( A B ) P ( A ) = P ( X = − 1 ) P ( ∣ X ∣ = 1 ) = 1 2 × 1 4 1 2 × 1 8 + 1 2 × 1 4 = 2 3 \begin{aligned}p&= P(B |A)\\&= \frac{ P(AB)}{P(A)}\\&=\frac{ P(X=-1)}{ P(|X| =1 )}\\&=\frac{\frac 12 \times \frac 1 4}{\frac 12 \times \frac 1 8 +\frac 12 \times \frac 1 4}\\&=\frac 2 3 \end{aligned} p=P(BA)=P(A)P(AB)=P(X=1)P(X=1)=21×81+21×4121×41=32
image-20230208163937174

  1. m a x P ( A ∩ B ) = m i n { P ( A ) , P ( B ) } = 0.3 maxP(A \cap B)=min\{P(A),P(B)\}=0.3 maxP(AB)=min{P(A),P(B)}=0.3
  2. m i n P ( A ∩ B ) = 0 minP(A \cap B)=0 minP(AB)=0
  3. m a x P ( A ∪ B ) = P ( A ) + P ( B ) − m i n P ( A B ) = 0.7 maxP(A \cup B)=P(A)+P(B)-minP(AB)=0.7 maxP(AB)=P(A)+P(B)minP(AB)=0.7
  4. m i n P ( A ∪ B ) = P ( A ) + P ( B ) − m a x P ( A B ) = 0.4 minP(A \cup B)=P(A)+P(B)-maxP(AB)=0.4 minP(AB)=P(A)+P(B)maxP(AB)=0.4

2 Linear Algebra

image-20230209151833933
初等行变换即可,r为2
( 1 2 1 1 0 3 1 1 2 ) ⟶ ( 2 ) − ( 1 ) ( 1 2 1 0 − 2 2 1 1 2 ) ⟶ ( 3 ) − ( 1 ) ( 1 2 1 0 − 2 2 0 − 1 1 ) ⟶ ( 2 ) / 2 ( 1 2 1 0 − 1 1 0 − 1 1 ) ⟶ ( 3 ) + ( 2 ) ( 1 2 1 0 − 1 1 0 0 0 ) \left( \begin{matrix} 1 & 2 & 1 \\ 1 & 0& 3 \\ 1 & 1& 2 \end{matrix} \right) \overset{(2)-(1)} {\longrightarrow} \left( \begin{matrix} 1 & 2 & 1 \\ 0 & -2& 2 \\ 1 & 1& 2 \end{matrix} \right)\overset{(3)-(1)} {\longrightarrow} \\ \left( \begin{matrix} 1 & 2 & 1 \\ 0 & -2& 2 \\ 0 & -1& 1 \end{matrix} \right)\overset{(2)/2} {\longrightarrow}\left( \begin{matrix} 1 & 2 & 1 \\ 0 & -1& 1 \\ 0 & -1& 1 \end{matrix} \right)\overset{(3)+(2)} {\longrightarrow} \left( \begin{matrix} 1 & 2 & 1 \\ 0 & -1& 1 \\ 0 & 0& 0 \end{matrix} \right) 111201132 (2)(1) 101221122 (3)(1) 100221121 (2)/2 100211111 (3)+(2) 100210110
image-20230209152411833
( 0 2 4 2 4 2 3 3 1 ) − 1 = ( 0 2 4 2 4 2 3 3 1 ) ∗ ∣ ( 0 2 4 2 4 2 3 3 1 ) ∣ = ( − 2 10 − 12 4 − 12 8 − 6 6 − 4 ) − 16 \left( \begin{matrix} 0 & 2 & 4 \\ 2 & 4& 2 \\ 3 & 3& 1 \end{matrix} \right)^{-1}=\frac{\left( \begin{matrix} 0 & 2 & 4 \\ 2 & 4& 2 \\ 3 & 3& 1 \end{matrix} \right)^*}{|\left( \begin{matrix} 0 & 2 & 4 \\ 2 & 4& 2 \\ 3 & 3& 1 \end{matrix} \right)|}=\frac{\left( \begin{matrix} -2 & 10 & -12 \\ 4 & -12& 8 \\ -6 & 6& -4 \end{matrix} \right)}{-16} 023243421 1= 023243421 023243421 =16 246101261284
image-20230209152829523
( A − λ E ) = ( 3 − λ 1 1 2 4 − λ 2 − 1 − 1 1 − λ ) ⟶ ( 4 − λ 4 − λ 4 − λ 0 2 − λ 0 0 0 2 − λ ) = ( 4 − λ ) ( 2 − λ ) 2 (A-\lambda E)=\left( \begin{matrix} 3-\lambda & 1 & 1 \\ 2 & 4-\lambda & 2 \\ -1 & -1 & 1-\lambda \end{matrix} \right) \longrightarrow \left( \begin{matrix} 4-\lambda & 4-\lambda & 4-\lambda \\ 0 & 2-\lambda & 0 \\ 0 & 0 & 2-\lambda \end{matrix} \right)\\ =(4-\lambda)(2-\lambda)^2 \\ (AλE)= 3λ2114λ1121λ 4λ004λ2λ04λ02λ =(4λ)(2λ)2

  • 当特征值为4时,有:
    A − 4 E = ( − 1 1 1 2 0 2 − 1 − 1 − 3 ) ⟶ ( 1 0 1 0 1 2 0 0 0 ) A-4E=\left( \begin{matrix} -1 & 1 & 1 \\ 2 & 0 & 2 \\ -1 & -1 & -3 \end{matrix} \right)\longrightarrow \left( \begin{matrix} 1 & 0 & 1 \\ 0 & 1 & 2 \\ 0 & 0 & 0 \end{matrix} \right) A4E= 121101123 100010120

求得 x ⃗ 1 = ( 1 2 − 1 ) \vec x_1=\left( \begin{matrix} 1 \\ 2 \\ -1 \end{matrix} \right) x 1= 121

  • 特征值为2时,同理可以求得 x ⃗ 2 = ( 1 0 − 1 ) \vec x_2=\left( \begin{matrix} 1 \\ 0 \\ -1 \end{matrix} \right) x 2= 101 x ⃗ 3 = ( 1 − 1 0 ) \vec x_3=\left( \begin{matrix} 1 \\ -1 \\ 0 \end{matrix} \right) x 3= 110

image-20230209153930536
(a)
不妨认为 M ∈ R m × n , U ∈ R m × m , Σ ∈ R m × n , V ∈ R n × n M\in\mathbb R^{m\times n},U\in \mathbb R^{m\times m},\Sigma\in \mathbb R^{m\times n}, V\in \mathbb R^{n\times n} MRm×n,URm×m,ΣRm×n,VRn×n易得 Σ † ∈ R n × m \Sigma^{\dagger}\in \mathbb R^{n\times m} ΣRn×m
所以有 M M † M = U Σ V T V Σ † U T U Σ V T = U ( Σ Σ † ) Σ V T = U I m Σ V T = U Σ V T \begin{aligned} MM^{\dagger}M &=U\Sigma V^TV\Sigma^{\dagger} U^TU\Sigma V^T\\ &=U(\Sigma\Sigma^{\dagger})\Sigma V^T\\ &=UI_m\Sigma V^T\\ &=U\Sigma V^T \end{aligned} MMM=UΣVTVΣUTUΣVT=U(ΣΣ)ΣVT=UImΣVT=UΣVT
(b)
M † = V Σ † U T ( M 可逆,则 m = n ,且 Σ † = Σ − 1 ) = V Σ − 1 U T = ( U Σ V T ) − 1 = M − 1 \begin{aligned} M^{\dagger} &= V\Sigma^{\dagger} U^T(M 可逆,则m=n,且\Sigma^{\dagger}=\Sigma^{-1}) \\ &=V\Sigma^{-1} U^T \\ &=(U\Sigma V^T)^{-1}\\ &=M^{-1} \end{aligned} M=VΣUT(M可逆,则m=n,且Σ=Σ1)=VΣ1UT=(UΣVT)1=M1
image-20230209160342686
(a)
∀ x , x T Z Z T x = ( Z T x ) T ( Z T x ) ≥ 0 \forall x,x^T ZZ^T x= (Z^Tx)^T(Z^Tx)\ge 0 xxTZZTx=(ZTx)T(ZTx)0,得证
(b)

  • 必要性:由实对称矩阵可知,存在正交矩阵Q和对角矩阵 Λ \Lambda Λ使面等式成立
    Q T A Q = Λ , Λ = diag { λ 1 , . . . , λ n } Q^TAQ=\Lambda,\Lambda =\text{diag} \{\lambda_1,...,\lambda_n\} QTAQ=Λ,Λ=diag{λ1,...,λn}

由已知易知, Λ \Lambda Λ>0,则必要性证明成功

  • 充分性:取 x = Q e i ≠ 0 , i = 1 , . . . , n x= Qe_i\neq 0,i=1,...,n x=Qei=0,i=1,...,n,且 e i ∈ R n , ( e i ) j = 1 { i = j } e_i \in \mathbb R^n ,(e_i)_j = 1\{i=j\} eiRn,(ei)j=1{i=j}

则有 x T Λ x = e i T Q T A Q e i = e i T Λ e i = λ i > 0 \begin{aligned} x^T \Lambda x &= e_i^T Q^TA Qe_i \\ &=e_i^T \Lambda e_i \\ &=\lambda_i\\ &>0 \end{aligned} xTΛx=eiTQTAQei=eiTΛei=λi>0充分性证明成功
在这里插入图片描述

  1. max ⁡ u t x = 1 \max u^tx=1 maxutx=1,u和x同向
  2. min ⁡ u t x = − 1 \min u^tx=-1 minutx=1,u和x反向
  3. min ⁡ ∣ u t x ∣ = 0 \min |u^tx|=0 minutx=0,u和x正交

3.Calculus

image-20230210150152952
d f ( x ) d x = − 2 e − 2 x 1 + e − 2 x = − 2 1 + e 2 x ∂ g ( x , y ) ∂ y = 2 e 2 y + e 3 x y 2 6 x y \begin{aligned} \frac {d f(x)}{dx} &= \frac {-2e^{-2x}} {1+e^{-2x}}=-\frac {2}{1+e^{2x}} \\ \frac {\partial g(x,y)}{\partial y} &= 2e^{2y}+e^{3xy^2} 6xy \end{aligned} dxdf(x)yg(x,y)=1+e2x2e2x=1+e2x2=2e2y+e3xy26xy
image-20230210150440301
∂ f ∂ v = ∂ f ∂ x ∂ x ∂ v + ∂ f ∂ y ∂ y ∂ v = − y sin ⁡ ( u + v ) − x cos ⁡ ( u − v ) \begin{aligned} \frac {\partial f}{\partial v} &=\frac {\partial f}{\partial x} \frac {\partial x}{\partial v}+ \frac {\partial f}{\partial y} \frac {\partial y}{\partial v}\\ &=-y\sin(u+v)-x\cos (u-v) \end{aligned} vf=xfvx+yfvy=ysin(u+v)xcos(uv)
image-20230210150743375
一阶偏导:
∂ E ( u , v ) ∂ u = 2 ( u e v − 2 v e − u ) ( e v + 2 v e − u ) ∂ E ( u , v ) ∂ v = 2 ( u e v − 2 v e − u ) ( u e v − 2 e − u ) \begin{aligned} \frac{\partial E(u,v)}{\partial u} &=2(ue^v -2ve^{-u} )(e^v +2ve^{-u})\\ \frac{\partial E(u,v)}{\partial v} &=2(ue^v -2ve^{-u} )(ue^v -2e^{-u})\\ \end{aligned} uE(u,v)vE(u,v)=2(uev2veu)(ev+2veu)=2(uev2veu)(uev2eu)
二阶偏导:
∂ 2 E ( u , v ) ∂ u 2 = 2 ∂ ∂ u ( u e 2 v − 2 v e v − u + 2 u v e v − u − 4 v 2 e − 2 u ) = 2 ( e 2 v + 2 v e v − u + 2 v e v − u − 2 u v e v − u + 8 v 2 e − 2 u ) = 2 ( e 2 v + 4 v e v − u − 2 u v e v − u + 8 v 2 e − 2 u ) ∂ 2 E ( u , v ) ∂ v 2 = 2 ∂ ∂ v ( u 2 e 2 v − 2 u v e v − u − 2 u e v − u + 4 v e − 2 u ) = 2 ( 2 u 2 e 2 v − 2 u e v − u − 2 u v e v − u − 2 u e v − u + 4 e − 2 u ) = 2 ( 2 u 2 e 2 v − 4 u e v − u − 2 u v e v − u + 4 e − 2 u ) ∂ 2 E ( u , v ) ∂ u ∂ v = 2 ∂ ∂ v ( u e 2 v − 2 v e v − u + 2 u v e v − u − 4 v 2 e − 2 u ) = 2 ( 2 u e 2 v − 2 e v − u − 2 v e v − u + 2 u e v − u + 2 u v e v − u − 8 v e − 2 u ) \begin{aligned} \frac{\partial^2 E(u,v)}{\partial u^2} &=2\frac{\partial}{\partial u}(ue^{2v} -2v e^{v-u}+2uve^{v-u}-4v^2 e^{-2u})\\ &=2(e^{2v} +2v e^{v-u}+2ve^{v-u}-2uve^{v-u}+8v^2 e^{-2u}) \\ &=2(e^{2v} +4v e^{v-u}-2uve^{v-u}+8v^2 e^{-2u})\\ \frac{\partial^2 E(u,v)}{\partial v^2} &=2\frac{\partial}{\partial v}(u^2e^{2v} -2uv e^{v-u}-2ue^{v-u}+4ve^{-2u})\\ &=2(2u^2e^{2v} -2u e^{v-u}-2uv e^{v-u}-2ue^{v-u}+4e^{-2u})\\ &=2(2u^2e^{2v} -4u e^{v-u}-2uv e^{v-u}+4e^{-2u}) \\ \frac{\partial^2 E(u,v)}{\partial u \partial v} &=2\frac{\partial}{\partial v}(ue^{2v} -2v e^{v-u}+2uve^{v-u}-4v^2 e^{-2u})\\ &=2(2ue^{2v} -2 e^{v-u}-2ve^{v-u}+2ue^{v-u}+2uve^{v-u} -8v e^{-2u}) \\ \end{aligned} u22E(u,v)v22E(u,v)uv2E(u,v)=2u(ue2v2vevu+2uvevu4v2e2u)=2(e2v+2vevu+2vevu2uvevu+8v2e2u)=2(e2v+4vevu2uvevu+8v2e2u)=2v(u2e2v2uvevu2uevu+4ve2u)=2(2u2e2v2uevu2uvevu2uevu+4e2u)=2(2u2e2v4uevu2uvevu+4e2u)=2v(ue2v2vevu+2uvevu4v2e2u)=2(2ue2v2evu2vevu+2uevu+2uvevu8ve2u)
代入题目条件u、v=1有
∂ E ( u , v ) ∂ u ∣ u = 1 , v = 1 = 2 ( e 2 − 4 e − 2 ) ∂ E ( u , v ) ∂ v ∣ u = 1 , v = 1 = 2 ( e 2 + 4 e − 2 − 4 ) ∂ 2 E ( u , v ) ∂ u 2 ∣ u = 1 , v = 1 = 2 ( e 2 + 8 e − 2 + 2 ) ∂ 2 E ( u , v ) ∂ v 2 ∣ u = 1 , v = 1 = 2 ( 2 e 2 + 4 e − 2 − 6 ) ∂ 2 E ( u , v ) ∂ u ∂ v ∣ u = 1 , v = 1 = 2 ( 2 e 2 − 8 e − 2 ) \begin{aligned} \frac{\partial E(u,v)}{\partial u} \Big |_{u=1,v=1} &=2(e^2 -4e^{-2}) \\ \frac{\partial E(u,v)}{\partial v} \Big |_{u=1,v=1} &=2(e^2 +4e^{-2}-4) \\ \frac{\partial^2 E(u,v)}{\partial u^2}\Big |_{u=1,v=1}& =2(e^2+8e^{-2}+2) \\ \frac{\partial^2 E(u,v)}{\partial v^2}\Big |_{u=1,v=1}& =2(2e^2+4e^{-2}-6) \\ \frac{\partial^2 E(u,v)}{\partial u\partial v}\Big |_{u=1,v=1}& =2(2e^2 -8e^{-2}) \\ \end{aligned} uE(u,v) u=1,v=1vE(u,v) u=1,v=1u22E(u,v) u=1,v=1v22E(u,v) u=1,v=1uv2E(u,v) u=1,v=1=2(e24e2)=2(e2+4e24)=2(e2+8e2+2)=2(2e2+4e26)=2(2e28e2)
最后结果为:
∇ E = ( 2 ( e 2 − 4 e − 2 ) 2 ( e 2 + 4 e − 2 − 4 ) ) , ∇ 2 E = ( 2 ( e 2 + 8 e − 2 + 2 ) 2 ( 2 e 2 − 8 e − 2 ) 2 ( 2 e 2 − 8 e − 2 ) 2 ( 2 e 2 + 4 e − 2 − 6 ) ) \begin{aligned} \nabla E= \left( \begin{matrix} 2(e^2 -4e^{-2}) \\ 2(e^2 +4e^{-2}-4) \end{matrix} \right) , \nabla^2 E = \left( \begin{matrix} 2(e^2+8e^{-2}+2) & 2(2e^2 -8e^{-2}) \\ 2(2e^2 -8e^{-2}) & 2(2e^2+4e^{-2}-6) \end{matrix} \right) \end{aligned} E=(2(e24e2)2(e2+4e24)),2E=(2(e2+8e2+2)2(2e28e2)2(2e28e2)2(2e2+4e26))
在这里插入图片描述
E ( u , v ) ≈ E ( 1 , 1 ) + ∇ E T ( u − 1 v − 1 ) + 1 2 ! ( u − 1 v − 1 ) ∇ 2 E ( u − 1 v − 1 ) = ( e − 2 e − 1 ) 2 + 2 ( e 2 − 4 e − 2 ) ( u − 1 ) + 2 ( e 2 + 4 e − 2 − 4 ) ( v − 1 ) + ( e 2 + 8 e − 2 + 2 ) ( u − 1 ) 2 + ( 2 e 2 + 4 e − 2 − 6 ) ( v − 1 ) 2 + 2 ( 2 e 2 − 8 e − 2 ) ( u − 1 ) ( v − 1 ) \begin{aligned} E(u,v) &\approx E(1, 1)+ \nabla E^T \left( \begin{matrix} u- 1 \\ v- 1 \end{matrix} \right) + \frac 1 {2!} \left( \begin{matrix} u- 1 & v- 1 \end{matrix} \right) \nabla^2 E \left( \begin{matrix} u- 1 \\ v- 1 \end{matrix} \right) \\ &=(e-2e^{-1})^2 + 2(e^2 -4e^{-2}) (u-1)+ 2(e^2 +4e^{-2}-4)(v-1)\\ &+(e^2+8e^{-2}+2) (u-1)^2 + (2e^2+4e^{-2}-6)(v-1)^2+2(2e^2 -8e^{-2})(u-1)(v-1) \end{aligned} E(u,v)E(1,1)+ET(u1v1)+2!1(u1v1)2E(u1v1)=(e2e1)2+2(e24e2)(u1)+2(e2+4e24)(v1)+(e2+8e2+2)(u1)2+(2e2+4e26)(v1)2+2(2e28e2)(u1)(v1)
image-20230210152932976
A e α + B e − 2 α = A 2 e α + A 2 e α + B e − 2 α ≥ 3 A 2 e α × A 2 e α × B e − 2 α 3 = 3 A 2 B 4 3 \begin{aligned} &Ae^{\alpha} +Be^{-2\alpha}\\ &=\frac A 2 e^{\alpha}+\frac A 2 e^{\alpha} +Be^{-2\alpha}\\ &\ge 3 \sqrt[3] {\frac A 2 e^{\alpha}\times\frac A 2 e^{\alpha} \times Be^{-2\alpha}} \\ &=3\sqrt[3]{\frac {A^2B} 4} \end{aligned} Aeα+Be2α=2Aeα+2Aeα+Be2α332Aeα×2Aeα×Be2α =334A2B 当且仅当
A 2 e α = A 2 e α = B e − 2 α α = 1 3 ln ⁡ 2 B A \begin{aligned}&\frac A 2 e^{\alpha}=\frac A 2 e^{\alpha} =Be^{-2\alpha}\\ &\alpha =\frac 1 3 \ln \frac {2B} A\end{aligned} 2Aeα=2Aeα=Be2αα=31lnA2B
image-20230210153505114
原式展开有:
E ( w ) = 1 2 ∑ i = 1 d ∑ j = 1 d w i A i j w j + ∑ i = 1 d w i b i \begin{aligned} E(w) & =\frac 1 2 \sum_{i=1}^d \sum_{j=1}^d w_{i}A_{ij}w_j + \sum_{i=1}^d w_i b_i \end{aligned} E(w)=21i=1dj=1dwiAijwj+i=1dwibi
由于A是对称矩阵:
∂ E ( w ) ∂ w k = 1 2 ∑ j = 1 d A k j w j + 1 2 ∑ i = 1 d w i A i k + b k = ∑ j = 1 d A k j w j + b k ∂ 2 E ( w ) ∂ w l ∂ w k = ∂ ∂ w l ( ∑ j = 1 d A k j w j + b k ) = A k l \begin{aligned} \frac{\partial E(w)}{\partial w_k} &=\frac 1 2 \sum_{j=1}^d A_{kj}w_j+\frac 1 2 \sum_{i=1}^d w_{i}A_{ik} + b_k \\ &=\sum_{j=1}^d A_{kj}w_j +b_k \\ \frac{\partial^2 E(w)}{\partial w_l\partial w_k} &= \frac{\partial}{\partial w_l} \Big(\sum_{j=1}^d A_{kj}w_j +b_k \Big)\\ &= A_{kl} \\ \end{aligned} wkE(w)wlwk2E(w)=21j=1dAkjwj+21i=1dwiAik+bk=j=1dAkjwj+bk=wl(j=1dAkjwj+bk)=Akl
合成为矩阵形式有:
∇ E ( w ) = A w + b ∇ E 2 ( w ) = A \begin{aligned} \nabla E(w)& =Aw+b\\ \nabla E^2(w)& =A \end{aligned} E(w)E2(w)=Aw+b=A

一览图

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

hw0题目链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/337116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

list类的使用和模拟实现

目录 一、list类的介绍 二、list的使用 1.构造、拷贝构造函数和迭代器 2.数据的增删查改 三、list的部分接口实现 1.节点定义 2.list类的组织 四、list的迭代器 1.迭代器的设计思路 2.const迭代器 3.->操作符的重载 4.反向迭代器 一、list类的介绍 list就是C库…

Elasticsearch基本概念和索引原理

一、Elasticsearch是什么&#xff1f; Elasticsearch是一个基于文档的NoSQL数据库&#xff0c;是一个分布式、RESTful风格的搜索和数据分析引擎&#xff0c;同时也是Elastic Stack的核心&#xff0c;集中存储数据。Elasticsearch、Logstash、Kibana经常被用作日志分析系统&…

[CCS 2022] 皇帝没有衣服:用于网络安全的AI/ML

AI/ML for Network Security: The Emperor has no ClothesCCS 22: Proceedings of the 2022 ACM SIGSAC Conference on Computer and Communications Securityhttps://dl.acm.org/doi/abs/10.1145/3548606.3560609摘要最近的一些研究工作提出了基于机器学习&#xff08;ML&…

工业废水的种类及其处理工艺有哪些?特定目标污染物的深度去除

随着工业的迅速发展&#xff0c;工业废水的种类和数量随之增加&#xff0c;对水体的污染也日趋严重&#xff0c;威胁人类的健康和正常生活。所以工业废水的处理对于环保至关重要。 保护生态环境、更好地做好工业废水的处理&#xff0c;了解工业废水及其种类与处理非常必要。 工…

MySQL 删除数据库

使用普通用户登陆 MySQL 服务器&#xff0c;你可能需要特定的权限来创建或者删除 MySQL 数据库&#xff0c;所以我们这边使用 root 用户登录&#xff0c;root 用户拥有最高权限。 当数据库不再使用时应该将其删除&#xff0c;以确保数据库存储空间中存放的是有效数据。删除数据…

【Hello Linux】 Linux基础命令

作者&#xff1a;小萌新 专栏&#xff1a;Linux 作者简介&#xff1a;大二学生 希望能和大家一起进步&#xff01; 本篇博客简介&#xff1a;介绍Linux的基础命令 Linux基础命令ls指令lsls -als -dls -ils -sls -lls -nls -Fls -rls -tls -Rls -1总结思维导图pwd指令whoami指令…

Python 条件语句

Python条件语句是通过一条或多条语句的执行结果&#xff08;True或者False&#xff09;来决定执行的代码块。可以通过下图来简单了解条件语句的执行过程:Python程序语言指定任何非0和非空&#xff08;null&#xff09;值为true&#xff0c;0 或者 null为false。Python 编程中 i…

【正点原子FPGA连载】第八章UART串口中断实验 摘自【正点原子】DFZU2EG_4EV MPSoC之嵌入式Vitis开发指南

1&#xff09;实验平台&#xff1a;正点原子MPSoC开发板 2&#xff09;平台购买地址&#xff1a;https://detail.tmall.com/item.htm?id692450874670 3&#xff09;全套实验源码手册视频下载地址&#xff1a; http://www.openedv.com/thread-340252-1-1.html 第八章UART串口中…

【SSD 代码精读】之 数据增强(Data Augmentation)

SSD 数据增强前言1、Compose2、SSDCropping3、Resize4、ColorJitter5、ToTensor6、RandomHorizontalFlip7、Normalization8、AssignGTtoDefaultBox前言 原论文 根据原论文&#xff0c;我们需要处理的有以下&#xff1a; data_transform {"train": transforms.Com…

vue2.x中使用vuex

Vuex是什么&#xff1f; Vuex是一个专门为Vue.js应用程序开发的状态管理模式。它采用集中式存储来管理应用程序中所有组件的状态&#xff0c;并以相应的规则保证状态以一种可预测的方式发生变化。Vuex也被集成到了Vue的官方调试工具vue-devtools中&#xff0c;提供了诸如零配置…

Java:使用Java功能确保应用程序安全的方法

与添加新功能一样重要的是&#xff0c;应用程序开发人员需要开始更加重视他们设计的应用程序的安全性。毕竟&#xff0c;更多的应用程序功能意味着更多的数据驻留在应用程序中。如果没有适当的安全控制&#xff0c;这些数据很容易被入侵者窃取。Java是目前世界上最安全、最流行…

如何去阅读源码,我总结了18条心法

在聊如何去阅读源码之前&#xff0c;先来简单说一下为什么要去阅读源码&#xff0c;大致可分为以下几点原因&#xff1a;最直接的原因&#xff0c;就是面试需要&#xff0c;面试喜欢问源码&#xff0c;读完源码才可以跟面试官battle提升自己的编程水平&#xff0c;学习编程思想…

不要慌,我们谈一谈如何用好 ChatGPT

别人贪婪时我恐惧&#xff0c;别人恐惧时我贪婪。 ——巴菲特 ChatGPT 火了&#xff0c;技术领域的社交媒体、自媒体几乎被 ChatGPT 刷屏&#xff0c;这些内容当中最让人惶恐不安的是我们是否会被 AI 取代之类的文章。 比如以下几个文章标题&#xff1a; 《ChatGPT可能马上…

Transformer结构解读

咱们还是照图讨论&#xff0c;transformer结构图如下&#xff0c;本文主要讨论Encoder部分&#xff1a;图一一、首先说一下Encoder的输入部分&#xff1a;在NLP领域&#xff0c;个人理解&#xff0c;这个inputs就是我们的句子分词之后的词语&#xff0c;比如“我&#xff0c;喜…

符号让人疯狂

符号让人疯狂 判断背了个LV符号的包就想可能有钱 趣讲大白话&#xff1a;人是通过符号区分生活的 聪明人想想&#xff1a;能超越或摆脱符号依赖吗&#xff1f; *********** 信息社会加速符号的传递和创造 我们已经被各种信息传递的符号淹没 信息符号的筛选成了人的主要工作 再…

GRB非隔离系列宽电压输入负高电压输出 电压控制型

特点● 效率高达70%以上● 1*2英寸标准封装● 单电压负输出● 价格低● 电压控制,输出电压随控制电压变化线性变化● 工作温度: -40℃~85℃● 阻燃封装&#xff0c;满足UL94-V0 要求● 温度特性好● 可直接焊在PCB 上应用GRB 系列模块电源是一种DC-DC升压变换器。该模块电源的输…

十、Linux文件 - fread函数讲解

目录 1.fread函数讲解 2.fread函数实战 1.fread函数讲解 从文件中读入数据到指定的地址中 函数原型&#xff1a; size_t fread(void*buff , size_t size, size_t count , FILE* stream) /* * description :对已打开的流进行数据读取 * param ‐ ptr &#xff1a;指向 数据块的…

好用的电脑备份软件推荐

现在几乎每个人都有一台电脑&#xff0c;上面存储着大量的数据&#xff0c;比如宝贵的照片、视频、工作文档等等。但电脑也随时存在许多威胁&#xff0c;比如病毒、Windows 更新错误、死机黑屏、驱动程序问题、系统崩溃等。为防止任何数据丢失&#xff0c;你需要一个专业的电脑…

Oracle数据库故障处理-单块读hang存储异常导致hang死,数据库大量的db file seq read等待(p1 p2无反映)

1 故障描述 2023年1月27日下午接到业务反馈数据库存在大量的锁表阻塞信息&#xff0c;并且业务的页面以及数据库的一些查询均处于阻塞状态&#xff0c;简单的查询sql也需要查询很长时间且未返回结果,数据库hang状态。 问题现象2 1 数据库进程无法杀除。 2 操作系统进程使用…

也许你应该学学 postman了

使用 最简单的方法就是直接在浏览器中复制 Copy as cURL &#xff0c;然后把数据导入 postman&#xff0c;然后 send &#xff0c;收工。 我们这里拿 知乎首页 举例 在对应的请求下复制 cURL 打开 postman &#xff0c; 点击左上角的 Import &#xff0c; 选择Paste Raw Tex…