极化码的入门与探索

news2024/9/30 11:28:40

文章目录

  • 极化码的基础先验知识
    • 二进制输入离散无记忆信道模型(Binary-input Discreten Memoryless Channel, B-DMC)
    • 二进制离散输入信道的ML判决和错误率
    • B-DMC相关参数的定义和理解
  • 两信道极化
  • N信道极化的解释
  • 信道极化分解的蝶形结构
  • 补充:生成矩阵的结构

极化码的基础先验知识

二进制输入离散无记忆信道模型(Binary-input Discreten Memoryless Channel, B-DMC)

给定B-DMC信道 W : X → Y W: \mathcal{X} \rightarrow \mathcal Y W:XY,信道转移概率(transition probability)为 W ( y ∣ x ) , x ∈ X , y ∈ y W(y|x), x \in \mathcal X, y \in \mathcal y W(yx),xX,yy。对于B-DMC信道而言,输入信号的集合一般为 X = { 0 , 1 } \mathcal X=\{0,1\} X={0,1},输出信号集合 Y \mathcal Y Y和转移概率 W ( y ∣ x ) W(y|x) W(yx)具有任意形式。

We write W N W^N WN to denote the channel correpsonding to N N N use of W W W, thus, W N : X N → Y N W^N: \mathcal{X}^N \rightarrow \mathcal Y^N WN:XNYN with W N ( x 1 N ∣ y 1 N ) = ∏ i = 1 N W ( y i ∣ x i ) W^N(x^N_1| y^N_1) = \prod_{i=1}^N W(y_i|x_i) WN(x1Ny1N)=i=1NW(yixi).
The symmetric capacity is the highest rate achievable subject to using the input letters of the channel with equal probability.

二进制离散输入信道的ML判决和错误率

二进制输入离散信道 W W W的最大似然(ML)判决指当收到符号 y y y时, x x x的值按下式判决
ML判决准则
x ^ M L = arg max ⁡ x ∈ { 0 , 1 } W ( y ∣ x ) \hat x_{ML} = \argmax_{x \in \{0,1\}} W(y|x) x^ML=x{0,1}argmaxW(yx)

ML判决的错误率的两种等价写法
P e M L ( W ) = 1 2 ∑ y ∈ Y min ⁡ { W ( y ∣ 0 ) , W ( y ∣ 1 ) } P e M L ( W ) = ∑ x , y 1 2 W ( y ∣ x ) 1 { W ( y ∣ x ) ≤ W ( y ∣ x ⊕ 1 ) } ( x , y ) \begin{aligned} P^{ML}_e(W) &= \frac{1}{2} \sum_{y \in \mathcal Y} \min \left \{W(y|0), W(y|1) \right \} \\ P^{ML}_e(W) &=\sum_{x, y} \frac{1}{2} W(y|x) \mathbb 1_{ \{ W(y|x) \leq W(y | x \oplus 1) \} } \left ( x, y \right) \end{aligned} PeML(W)PeML(W)=21yYmin{W(y∣0),W(y∣1)}=x,y21W(yx)1{W(yx)W(yx1)}(x,y)

对错误率表达式的简单理解:

B-DMC相关参数的定义和理解

对于B-DMC信道 W : X → Y W: \mathcal{X} \rightarrow \mathcal Y W:XY,相应的信道互信息(or say, symmetric capacity)、差错概率与Bhattacharyya参数(简称巴氏参数)分别定义为:
I ( W ) ≜ ∑ y ∈ Y ∑ x ∈ X 1 2 W ( y ∣ x ) log ⁡ W ( y ∣ x ) 1 2 W ( y ∣ 0 ) + 1 2 W ( y ∣ 1 ) P e ( W ) ≜ ∑ x , y 1 2 W ( y ∣ x ) 1 { W ( y ∣ x ) ≤ W ( y ∣ x ⊕ 1 ) } ( x , y ) Z ( W ) ≜ ∑ y ∈ Y W ( y ∣ 0 ) W ( y ∣ 1 ) \begin{aligned} I(W) & \triangleq \sum_{y \in \mathcal Y} \sum_{x \in \mathcal X} \frac{1}{2} W(y|x) \log \frac{W(y|x)}{ \frac{1}{2} W(y|0) + \frac{1}{2} W(y|1) } \\ P_e(W) & \triangleq \sum_{x, y} \frac{1}{2} W(y|x) \mathbb 1_{ \{ W(y|x) \leq W(y | x \oplus 1) \} } \left ( x, y \right) \\ Z(W) & \triangleq \sum_{y \in \mathcal Y} \sqrt { W(y|0) W(y|1) } \end{aligned} I(W)Pe(W)Z(W)yYxX21W(yx)log21W(y∣0)+21W(y∣1)W(yx)x,y21W(yx)1{W(yx)W(yx1)}(x,y)yYW(y∣0)W(y∣1)

这里我们证明 P e ( W ) ≤ Z ( W ) P_e(W) \leq Z(W) Pe(W)Z(W),即巴氏参数 Z ( W ) Z(W) Z(W)是ML判决差错概率的上界

证明: P e ( W ) ≤ Z ( W ) P_e(W) \leq Z(W) Pe(W)Z(W)
min ⁡ { W ( y ∣ 0 ) , W ( y ∣ 1 ) } ≤ W ( y ∣ 0 ) W ( y ∣ 1 ) \min \left \{W(y|0), W(y|1) \right \} \leq \sqrt { W(y|0) W(y|1) } min{W(y∣0),W(y∣1)}W(y∣0)W(y∣1)
即可得证。

进一步解释 I ( W ) I(W) I(W) Z ( W ) Z(W) Z(W)的物理意义

  • 互信息 I ( W ) I(W) I(W)衡量B-DMC信道W的可达速率,即输入信号先验等概条件下可靠通信的最高数据率。
  • 巴氏参数 Z ( W ) Z(W) Z(W)表示信道 W W W发送比特0或1,采用最大似然判决准则的差错概率上界

对于B-DMC信道而言, I ( W ) , Z ( W ) ∈ [ 0 , 1 ] I(W),Z(W) \in [0,1] I(W),Z(W)[0,1]

直观上讲,我们希望 I ( W ) ≈ 1 I(W) \approx 1 I(W)1 iff Z ( W ) ≈ 0 Z(W) \approx 0 Z(W)0 I ( W ) ≈ 0 I(W) \approx 0 I(W)0 iff Z ( W ) ≈ 1 Z(W) \approx 1 Z(W)1,下面将给出相关的证明。

Proposition 1: 对任意B-DMC W W W,有
I ( W ) ≥ log ⁡ 2 1 + Z ( W ) I ( W ) ≤ 1 − Z ( W ) 2 \begin{aligned} I(W) & \geq \log \frac{2}{1 + Z(W)} \\ I(W) & \leq \sqrt{1 - Z(W)^2} \end{aligned} I(W)I(W)log1+Z(W)21Z(W)2

证明(Prop. 1):
Proof of I ( W ) ≥ log ⁡ 2 1 + Z ( W ) I(W) \geq \log \frac{2}{1 + Z(W)} I(W)log1+Z(W)2: 省略。
Proof of I ( W ) ≤ 1 − Z ( W ) 2 I(W) \leq \sqrt{1 - Z(W)^2} I(W)1Z(W)2
对于B-DMC信道 W : X → Y W: \mathcal{X} \rightarrow \mathcal Y W:XY,我们首先定义
d ( W ) ≜ 1 2 ∑ y ∈ Y ∣ W ( y ∣ 0 ) − W ( y ∣ 1 ) ∣ d(W) \triangleq \frac{1}{2} \sum_{y \in \mathcal Y} \left | W(y|0) -W(y|1) \right| d(W)21yYW(y∣0)W(y∣1)

d ( W ) d(W) d(W)表示两个关于 y y y的分布 W ( y ∣ 0 ) W(y|0) W(y∣0) W ( y ∣ 1 ) W(y|1) W(y∣1)之间的变分距离(Variational Distance)。
引理-1:对任意B-DMC信道 W : X → Y W: \mathcal{X} \rightarrow \mathcal Y W:XY I ( W ) ≤ d ( W ) I(W) \leq d(W) I(W)d(W)
Proof of 引理-1:令 W W W是任意的B-DMC,其输出的集合为 Y = { 1 , ⋯   , n } \mathcal Y=\{1,\cdots,n\} Y={1,,n},且令 P i = W ( i ∣ 0 ) , Q i = W ( i ∣ 1 ) , i = 1 , 2 , ⋯   , n P_i = W(i|0),Q_i=W(i|1),i=1,2,\cdots,n Pi=W(i∣0),Qi=W(i∣1),i=1,2,,n,那么根据定义,我们有
I ( W ) = ∑ i = 1 n 1 2 [ P i log ⁡ P i 1 2 P i + 1 2 Q i + Q i log ⁡ Q i 1 2 P i + 1 2 Q i ] I(W) = \sum_{i=1}^n \frac{1}{2} \left [ P_i \log \frac{P_i}{\frac{1}{2} P_i + \frac{1}{2} Q_i} + Q_i \log \frac{Q_i}{\frac{1}{2} P_i + \frac{1}{2} Q_i} \right] I(W)=i=1n21[Pilog21Pi+21QiPi+Qilog21Pi+21QiQi]

对于上式 [ ⋅ ] [\cdot] []中的内容,我们可以定义
f ( x ) ≜ x log ⁡ x x + δ + ( x + 2 δ ) log ⁡ x + 2 δ x + δ f(x) \triangleq x \log \frac{x}{x + \delta} + (x + 2 \delta) \log \frac{x + 2 \delta}{ x + \delta} f(x)xlogx+δx+(x+2δ)logx+δx+2δ

其中 x = min ⁡ { P i , Q i } x=\min\{P_i, Q_i\} x=min{Pi,Qi} δ = 1 2 ∣ P i − Q i ∣ \delta = \frac{1}{2} |P_i - Q_i| δ=21PiQi。我们考虑在 0 ≤ x ≤ 1 − 2 δ 0 \leq x \leq 1-2 \delta 0x12δ的区间内最大化 f ( x ) f(x) f(x),计算
d f d x = 1 2 log ⁡ x ( x + 2 δ ) x + δ \frac{df}{dx} = \frac{1}{2} \log \frac{ \sqrt{x(x+2\delta)} } {x + \delta} dxdf=21logx+δx(x+2δ)

注意到,上述表达式的分子 x ( x + 2 δ ) \sqrt{x(x+2\delta)} x(x+2δ) 和分母 ( x + δ ) (x + \delta) (x+δ),分别对应两个正数 x x x ( x + 2 δ ) (x+2\delta) (x+2δ)的几何平均(geometric mean)和算数平均(arithmetic mean),因此 d f / d x ≤ 0 df/dx \leq 0 df/dx0,当 x = 0 x=0 x=0时, f ( x ) f(x) f(x)取最大,所以 f ( x ) ≤ f ( 0 ) = 2 δ f(x) \leq f(0)=2 \delta f(x)f(0)=2δ,对应的互信息满足:
I ( W ) ≤ ∑ i = 1 1 2 ∣ P i − Q i ∣ = d ( W ) I(W) \leq \sum_{i=1} \frac{1}{2} |P_i - Q_i| = d(W) I(W)i=121PiQi=d(W)

引理-2:对任意B-DMC信道 W : X → Y W: \mathcal{X} \rightarrow \mathcal Y W:XY d ( W ) ≤ 1 − Z ( W ) 2 d(W) \leq \sqrt{1 - Z(W)^2} d(W)1Z(W)2
证明从略。

因此可以得到 I ( W ) ≤ 1 − Z ( W ) 2 I(W) \leq \sqrt{1 - Z(W)^2} I(W)1Z(W)2

对称信道(symmetric channel):对于B-DMC信道 W W W,假设存在重排变换 π \pi π,对于输出信号集合 Y \mathcal Y Y,满足如下两个条件:
(1) 重排变换可逆: π − 1 = π \pi^{-1} = \pi π1=π
(2) 对于任意的 y ∈ Y y \in \mathcal Y yY W ( y ∣ 1 ) = W ( π ( y ) ∣ 0 ) W(y|1)=W(\pi(y)|0) W(y∣1)=W(π(y)∣0)
则称B-DMC信道 W W W满足对称性。(由经典信息论可知,对于对称信道 W W W,它的互信息等于信道容量,即 I ( W ) = C I(W)=C I(W)=C

这里列举两种常用的对称信道
example-1: 二元对称信道(BSC) W : X = { 0 , 1 } → Y = { 0 , 1 } W: \mathcal X=\{0,1\} \rightarrow \mathcal Y=\{0,1\} W:X={0,1}Y={0,1},其满足对称性,即
W ( 0 ∣ 0 ) = W ( 1 ∣ 1 ) W ( 1 ∣ 0 ) = W ( 0 ∣ 1 ) \begin{aligned} W(0|0) &= W(1|1) \\ W(1|0) &= W(0|1) \end{aligned} W(0∣0)W(1∣0)=W(1∣1)=W(0∣1)

example-2:二元删余信道(BEC) W : X = { 0 , 1 } → Y = { 0 , e , 1 } W: \mathcal X=\{0,1\} \rightarrow \mathcal Y=\{0,e,1\} W:X={0,1}Y={0,e,1} e e e是删除符号),也满足对称性,即
W ( 0 ∣ 0 ) = W ( 1 ∣ 1 ) W ( e ∣ 0 ) = W ( e ∣ 1 ) \begin{aligned} W(0|0) &= W(1|1) \\ W(e|0) &= W(e|1) \end{aligned} W(0∣0)W(e∣0)=W(1∣1)=W(e∣1)

其中 π ( 0 ) = 1 , π ( 1 ) = 0 , π ( e ) = e \pi(0)=1,\pi(1)=0,\pi(e)=e π(0)=1,π(1)=0,π(e)=e

符号的定义
我们定义 a 1 N a^N_1 a1N表示向量 ( a 1 , ⋯   , a N ) (a_1,\cdots, a_N) (a1,,aN),给定行向量 a 1 N a^N_1 a1N,我们记 a i j a^j_i aij为子向量 ( a i , ⋯   , a j ) , 1 ≤ i ≤ j ≤ N (a_i, \cdots, a_j), 1 \leq i \leq j \leq N (ai,,aj),1ijN。给定 a 1 N a^N_1 a1N和集合 A ⊂ { 1 , ⋯   , N } \mathcal A \subset \{1, \cdots, N\} A{1,,N},我们用 a A a_{\mathcal A} aA来指定子向量 ( a i , i ∈ A ) (a_i ,i \in \mathcal A) (ai,iA)。我们记 a 1 , o j a^j_{1,o} a1,oj来指明奇数索引(odd indices) ( a k , 1 ≤ k ≤ j ; k  odd ) (a_k, 1 \leq k \leq j; k \text{ odd}) (ak,1kj;k odd),类似地,记 a 1 , e j a^j_{1,e} a1,ej来指明偶数索引(even indices) ( a k , 1 ≤ k ≤ j ; k  even ) (a_k, 1 \leq k \leq j; k \text{ even}) (ak,1kj;k even)

两信道极化

首先给出一个二元删余信道(BEC)的两信道极化示例,如下图所示

图(a)给出了删余率 ϵ = 0.5 \epsilon=0.5 ϵ=0.5的BEC信道的映射关系 W : X = { 0 , 1 } → Y = { 0 , e , 1 } W: \mathcal X=\{0,1\} \rightarrow \mathcal Y=\{0, e, 1\} W:X={0,1}Y={0,e,1},其信道互信息为 I ( W ) = 0.5 I(W)=0.5 I(W)=0.5,巴氏参数 Z ( W ) = 0.5 Z(W)=0.5 Z(W)=0.5

图(b)是2信道极化的过程, u 1 , u 2 ∈ { 0 , 1 } u_1,u_2 \in \{0,1\} u1,u2{0,1}是输入信道的两比特, x 1 , x 2 ∈ { 0 , 1 } x_1, x_2 \in \{0,1\} x1,x2{0,1}是经过模2加编码后的两比特,将其分别送入信道 W W W后得到 y 1 , y 2 ∈ Y y_1,y_2 \in \mathcal Y y1,y2Y两个输出信号。对应的编码过程为
( x 1 , x 2 ) = ( u 1 , u 2 ) [ 1 0 1 1 ] = ( u 1 , u 2 ) F 2 (x_1, x_2) = (u_1, u_2) \left[ \begin{matrix} 1& 0\\ 1& 1\\ \end{matrix} \right] = (u_1, u_2) \boldsymbol F_2 (x1,x2)=(u1,u2)[1101]=(u1,u2)F2

通过矩阵 F 2 \boldsymbol F_2 F2极化操作,将一对独立信道 ( W , W ) (W,W) (W,W)变换为两个相关的子信道 ( W − , W + ) (W^{-}, W^{+}) (W,W+),其中

  • W − : X → Y 2 W^{-}: \mathcal X \rightarrow \mathcal Y^2 W:XY2 (信道的输入输出关系对应上图中的虚线)
  • W + : X → Y 2 × X W^{+}: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X W+:XY2×X(信道的输入输出关系对应上图中的点划线)

两个子信道的互信息满足下面的关系:
I ( W − ) ≤ I ( W ) ≤ I ( W + ) Z ( W − ) ≥ Z ( W ) ≥ Z ( W + ) \begin{aligned} I(W^{-}) & \leq I(W) \leq I(W^{+}) \\ Z(W^{-}) & \geq Z(W) \geq Z(W^{+}) \end{aligned} I(W)Z(W)I(W)I(W+)Z(W)Z(W+)

由于 I ( W − ) ≤ I ( W + ) I(W^{-}) \leq I(W^{+}) I(W)I(W+),这两个子信道产生了分化, W + W^+ W+是好信道, W − W^- W是差信道,这就是极化现象。我们称矩阵 F 2 \boldsymbol F_2 F2 2 × 2 2 \times 2 2×2极化核(或称为二阶极化核

对于一般的B-DMC信道 W W W,两信道极化是普遍存在的,有如下定理

定理1:对于两信道极化变换 ( W , W ) ↦ ( W − , W + ) (W,W) \mapsto (W^-, W^+) (W,W)(W,W+),相应的极化子信道互信息满足:
I ( W − ) + I ( W + ) = 2 I ( W ) I ( W − ) ≤ I ( W ) ≤ I ( W + ) \begin{aligned} I(W^-) &+ I(W^+) = 2 I(W) \\ I(W^-) & \leq I(W) \leq I(W^+) \end{aligned} I(W)I(W)+I(W+)=2I(W)I(W)I(W+)
当且仅当 I ( W ) = 0 , 1 I(W)=0,1 I(W)=0,1时,等号成立。

证明:给定B-DMC信道 W : X → Y W: \mathcal X \rightarrow \mathcal Y W:XY,经过两信道极化变换 ( u 1 , u 2 ) → ( u 1 ⊕ u 2 , u 2 ) = ( x 1 , x 2 ) (u_1, u_2) \rightarrow (u_1 \oplus u_2, u_2)=(x_1, x_2) (u1,u2)(u1u2,u2)=(x1,x2),得到的复合信道 W × W : X 2 → Y 2 W \times W: \mathcal X^2 \rightarrow \mathcal Y^2 W×W:X2Y2分解为两个极化子信道 W − : X → Y 2 W^-: \mathcal X \rightarrow \mathcal Y^2 W:XY2 W + : X → Y 2 × X W^+: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X W+:XY2×X

复合信道 W × W W\times W W×W的转移概率为
W ( y 1 , y 2 ∣ u 1 , u 2 ) = W ( y 2 ∣ u 2 ) W ( y 1 ∣ u 2 ⊕ u 1 ) = W ( y 2 ∣ x 2 ) W ( y 1 ∣ x 1 ) \begin{aligned} W(y_1, y_2| u_1, u_2) &= W(y_2|u_2) W(y_1 | u_2 \oplus u_1) \\ &= W(y_2|x_2) W(y_1 | x_1) \end{aligned} W(y1,y2u1,u2)=W(y2u2)W(y1u2u1)=W(y2x2)W(y1x1)

对于极化子信道 W − : X → Y 2 W^-:\mathcal X \rightarrow \mathcal Y^2 W:XY2,转移概率为
W 2 ( 1 ) ( y 1 , y 2 ∣ u 1 ) = ∑ u 2 = 0 1 P ( y 1 , y 2 , u 1 , u 2 ) P ( u 1 ) = ∑ u 2 = 0 1 P ( u 1 ) P ( u 2 ) W ( y 1 , y 2 ∣ u 1 , u 2 ) P ( u 1 ) = ∑ u 2 = 0 1 1 2 W ( y 1 , y 2 ∣ u 1 , u 2 ) = ∑ u 2 = 0 1 1 2 W ( y 2 ∣ u 2 ) W ( y 1 ∣ u 2 ⊕ u 1 ) \begin{aligned} W^{(1)}_2(y_1, y_2|u_1) &= \frac{ \sum_{u_2=0}^1 P(y_1, y_2, u_1, u_2) } {P(u_1)} \\ &= \frac{ \sum_{u_2=0}^1 P(u_1) P(u_2) W(y_1, y_2| u_1, u_2) } {P(u_1)} \\ &= \sum_{u_2=0}^1 \frac{1}{2} W(y_1, y_2|u_1, u_2) \\ &= \sum_{u_2=0}^1 \frac{1}{2} W(y_2|u_2) W(y_1 | u_2 \oplus u_1) \end{aligned} W2(1)(y1,y2u1)=P(u1)u2=01P(y1,y2,u1,u2)=P(u1)u2=01P(u1)P(u2)W(y1,y2u1,u2)=u2=0121W(y1,y2u1,u2)=u2=0121W(y2u2)W(y1u2u1)

对于极化子信道 W + : X → Y 2 × X W^+: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X W+:XY2×X,转移概率为
W 2 ( 2 ) ( y 1 , y 2 , u 1 ∣ u 2 ) = P ( y 1 , y 2 , u 1 , u 2 ) P ( u 2 ) = 1 2 W ( y 1 , y 2 ∣ u 1 , u 2 ) = 1 2 W ( y 2 ∣ u 2 ) W ( y 1 ∣ u 2 ⊕ u 1 ) \begin{aligned} W^{(2)}_2(y_1, y_2,u_1|u_2) &= \frac{ P(y_1, y_2, u_1, u_2) } {P(u_2)} \\ &= \frac{1}{2} W(y_1, y_2|u_1, u_2) \\ &= \frac{1}{2} W(y_2|u_2) W(y_1 | u_2 \oplus u_1) \end{aligned} W2(2)(y1,y2,u1u2)=P(u2)P(y1,y2,u1,u2)=21W(y1,y2u1,u2)=21W(y2u2)W(y1u2u1)

根据互信息链式法则
I ( U 1 , U 2 ; Y 1 , Y 2 ) = I ( U 1 ; Y 1 , Y 2 ) + I ( U 2 ; Y 1 , Y 2 ∣ U 1 ) I(U_1,U_2;Y_1,Y_2) = I(U_1; Y_1, Y_2) + I(U_2;Y_1,Y_2|U_1) I(U1,U2;Y1,Y2)=I(U1;Y1,Y2)+I(U2;Y1,Y2U1)

我们不难发现, I ( U 1 ; Y 1 , Y 2 ) I(U_1; Y_1, Y_2) I(U1;Y1,Y2)就是极化子信道 W − W^- W的互信息, I ( U 2 ; Y 1 , Y 2 ∣ U 1 ) I(U_2;Y_1,Y_2|U_1) I(U2;Y1,Y2U1)的条件互信息为:
I ( U 2 ; Y 1 , Y 2 ∣ U 1 ) = ∑ y 1 , y 2 ∑ u 1 , u 2 P ( y 1 , y 2 , u 1 , u 2 ) log ⁡ P ( y 1 , y 2 ∣ u 1 ; u 2 ) P ( y 1 , y 2 ∣ u 1 ) P ( u 2 ) = ∑ y 1 , y 2 ∑ u 1 , u 2 P ( y 1 , y 2 , u 1 , u 2 ) log ⁡ P ( y 1 , y 2 ∣ u 1 , u 2 ) P ( y 1 , y 2 ∣ u 1 ) = ∑ y 1 , y 2 ∑ u 1 , u 2 P ( y 1 , y 2 , u 1 , u 2 ) log ⁡ P ( y 1 , y 2 , u 1 ∣ u 2 ) ⋅ P ( u 2 ) P ( u 1 ) P ( u 2 ) P ( y 1 , y 2 , u 1 ) P ( u 1 ) = ∑ y 1 , y 2 ∑ u 1 , u 2 P ( y 1 , y 2 , u 1 , u 2 ) log ⁡ P ( y 1 , y 2 , u 1 ∣ u 2 ) P ( y 1 , y 2 , u 1 ) = I ( U 2 ; Y 1 , Y 2 , U 1 ) = I ( W + ) \begin{aligned} I(U_2;Y_1,Y_2|U_1) &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2|u_1; u_2)}{P(y_1,y_2|u_1) P(u_2)} \\ &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2|u_1, u_2)}{P(y_1,y_2|u_1)} \\ &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2,u_1|u_2) \cdot \frac{P(u_2)}{P(u_1)P(u_2)}} { \frac{P(y_1,y_2,u_1)}{P(u_1)} } \\ &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2,u_1|u_2)} {P(y_1,y_2,u_1)} \\ &= I(U_2; Y_1,Y_2,U_1) = I(W^+) \end{aligned} I(U2;Y1,Y2U1)=y1,y2u1,u2P(y1,y2,u1,u2)logP(y1,y2u1)P(u2)P(y1,y2u1;u2)=y1,y2u1,u2P(y1,y2,u1,u2)logP(y1,y2u1)P(y1,y2u1,u2)=y1,y2u1,u2P(y1,y2,u1,u2)logP(u1)P(y1,y2,u1)P(y1,y2,u1u2)P(u1)P(u2)P(u2)=y1,y2u1,u2P(y1,y2,u1,u2)logP(y1,y2,u1)P(y1,y2,u1u2)=I(U2;Y1,Y2,U1)=I(W+)

代入到链式法则中,可以得到 I ( U 1 , U 2 ; Y 1 , Y 2 ) = I ( W − ) + I ( W + ) I(U_1,U_2;Y_1,Y_2)=I(W^-)+I(W^+) I(U1,U2;Y1,Y2)=I(W)+I(W+)

另外,因为
I ( U 1 , U 2 ; Y 1 , Y 2 ) = I ( X 1 , X 2 ; Y 1 , Y 2 ) = I ( X 1 ; Y 1 ) + I ( X 2 ; Y 2 ) = 2 I ( W ) I(U_1,U_2;Y_1,Y_2)=I(X_1,X_2;Y_1,Y_2) = I(X_1;Y_1) + I(X_2;Y_2) = 2I(W) I(U1,U2;Y1,Y2)=I(X1,X2;Y1,Y2)=I(X1;Y1)+I(X2;Y2)=2I(W)

所以 I ( W − ) + I ( W + ) = 2 I ( W ) I(W^-)+I(W^+)=2I(W) I(W)+I(W+)=2I(W)

对于极化子信道的互信息,利用链式法则,可以进一步展开为
I ( W + ) = I ( U 2 ; Y 1 , Y 2 , U 1 ) = I ( U 2 ; Y 2 ) + I ( U 2 ; Y 1 , U 1 ∣ Y 2 ) = I ( W ) + I ( U 2 ; Y 1 , U 1 ∣ Y 2 ) \begin{aligned} I(W^+) &= I(U_2; Y_1, Y_2, U_1) \\ &= I(U_2; Y_2) + I(U_2; Y_1, U_1|Y_2) \\ &= I(W) + I(U_2; Y_1, U_1|Y_2) \end{aligned} I(W+)=I(U2;Y1,Y2,U1)=I(U2;Y2)+I(U2;Y1,U1Y2)=I(W)+I(U2;Y1,U1Y2)

因为 I ( U 2 ; Y 1 , U 1 ∣ Y 2 ) ≥ 0 I(U_2; Y_1, U_1|Y_2) \geq 0 I(U2;Y1,U1Y2)0,因此 I ( W + ) ≥ I ( W ) I(W^+) \geq I(W) I(W+)I(W),又因为 I ( W − ) + I ( W + ) = 2 I ( W ) I(W^-)+I(W^+)=2I(W) I(W)+I(W+)=2I(W),所以必然有 I ( W ) ≥ I ( W − ) I(W) \geq I(W^-) I(W)I(W)
证毕!

由定理-1可知,两信道极化变换后的复合信道 ( W − , W + ) (W^-,W^+) (W,W+)的容量等于两个独立信道 W W W的容量和,容量保持不变没有损失。

定理-2:对于两信道极化变换 ( W , W ) ↦ ( W − , W + ) (W,W) \mapsto (W^-, W^+) (W,W)(W,W+),相应的极化子信道的巴氏参数满足:
Z ( W + ) = Z 2 ( W ) Z ( W − ) ≤ 2 Z ( W ) − Z 2 ( W ) Z ( W + ) ≤ Z ( W ) ≤ Z ( W − ) \begin{aligned} Z(W^+) &= Z^2(W) \\ Z(W^-) &\leq 2 Z(W) - Z^2(W) \\ Z(W^+) &\leq Z(W) \leq Z(W^-) \end{aligned} Z(W+)Z(W)Z(W+)=Z2(W)2Z(W)Z2(W)Z(W)Z(W)

证明:略。

定理-2表明,经过两信道极化后,整个复合信道的可靠性得到了提升,巴氏参数满足如下关系
Z ( W − ) + Z ( W + ) ≤ 2 Z ( W ) Z(W^-)+Z(W^+) \leq 2 Z(W) Z(W)+Z(W+)2Z(W)

当且仅当 W W W是BEC信道时,等号成立。

小结
两信道极化是理解极化码的基础,经过简单的编码操作,构成了复合信道 ( W − , W + ) (W^-,W^+) (W,W+),然后进一步分解为有相关性的两个极化子信道 W − W^- W W + W^+ W+,由定理-1可知,两信道和容量不发生变化,只是单个信道容量在两个极化子信道之间偏移,产生一好一差两极化分化。而由定理-2可知,两信道的巴氏参数和减小,意味着可靠性提升。

N信道极化的解释

长度为 N = 2 n N=2^n N=2n的极化码是长度为2的极化码的扩展,即长度为2的极化码产生的极化信道 W 2 ( 1 ) W^{(1)}_2 W2(1) W 2 2 W^{2}_2 W22被当作另一个长度为2的极化码的 W W W。一个长度为4的极化码的极化过程入下图所示,其中 ( u 1 , u 2 , u 3 , u 4 ) (u_1,u_2,u_3,u_4) (u1,u2,u3,u4)是信源比特, ( x 1 , x 2 , x 3 , x 4 ) (x_1,x_2,x_3,x_4) (x1,x2,x3,x4)是码字比特。按照图中的走线,编码过程从左往右看,极化过程从右向左看

N = 2 N=2 N=2时,极化过程可以表示为 ( W , W ) → ( W 2 ( 1 ) , W 2 ( 2 ) ) (W,W) \rightarrow (W^{(1)}_2, W^{(2)}_2) (W,W)(W2(1),W2(2)),当 N = 4 N=4 N=4时, ( W 2 ( 1 ) , W 2 ( 1 ) ) → ( W 4 ( 1 ) , W 4 ( 2 ) ) , ( W 2 ( 2 ) , W 2 ( 2 ) ) → ( W 4 ( 3 ) , W 4 ( 4 ) ) (W^{(1)}_2, W^{(1)}_2) \rightarrow (W^{(1)}_4, W^{(2)}_4), (W^{(2)}_2, W^{(2)}_2) \rightarrow (W^{(3)}_4, W^{(4)}_4) (W2(1),W2(1))(W4(1),W4(2)),(W2(2),W2(2))(W4(3),W4(4))

一般来讲,这个规律是: ( W N ( i ) , W N ( i ) ) → ( W 2 N ( 2 i − 1 ) , W 2 N ( 2 i ) ) (W^{(i)}_N, W^{(i)}_N) \rightarrow (W^{(2i-1)}_{2N}, W^{(2i)}_{2N}) (WN(i),WN(i))(W2N(2i1),W2N(2i)),其中 W N ( i ) W^{(i)}_N WN(i)是长度为 N N N的极化码的第 i i i个极化信道,而 W 2 N ( 2 i − 1 ) W^{(2i-1)}_{2N} W2N(2i1) W 2 N ( 2 i ) ) W^{(2i)}_{2N}) W2N(2i))是长度为 2 N 2N 2N的极化码的第 ( 2 i − 1 ) (2i-1) (2i1) 2 i 2i 2i个极化信道。

依照这个规律,一个长度为8的极化过程如下图所示,其中 ( u 1 , u 2 , ⋯   , u 8 ) (u_1,u_2,\cdots,u_8) (u1,u2,,u8)是信源比特, ( x 1 , x 2 , ⋯   , x 8 ) (x_1,x_2,\cdots,x_8) (x1,x2,,x8)是码字比特。

接下来,我们尝试寻找极化码编码过程或极化过程的通用描述,如上面两张图所示,由‘ ⊕ \oplus ’和‘走线’构成的图称为长度为 N N N的极化码的编码图,表示这张图的矩阵被称为生成矩阵 G N \boldsymbol G_N GN。当 N = 2 N=2 N=2时,生成矩阵 G 2 = F = [ 1 0 1 1 ] \boldsymbol G_2 = \boldsymbol F= \left[ \begin{matrix} 1& 0\\ 1& 1\\ \end{matrix} \right] G2=F=[1101].

我们参考【长度为8的极化码】进行解读。长度为 N N N的极化码编码图的最左列是竖着排列的 N 2 \frac{N}{2} 2N个长度为2的极化码的编码图,所有这 N 2 \frac{N}{2} 2N长度为2的极化码的第1个码字比特 ( u 1 ⊕ u 2 , u 3 ⊕ u 4 , ⋯   , u N − 1 ⊕ u N ) (u_1 \oplus u_2, u_3 \oplus u_4, \cdots, u_{N-1} \oplus u_N) (u1u2,u3u4,,uN1uN)被置换到上一半,所有这 N 2 \frac{N}{2} 2N长度为2的极化码的第2个码字比特 ( u 2 , u 4 , ⋯   , u N ) (u_2,u_4,\cdots,u_N) (u2,u4,,uN)被置换到下一半。从左侧数【第2列至第n列】的 上半部分是要给长度为 N 2 \frac{N}{2} 2N的极化码的编码图(这就是极化码编码图的递归规律),写成矩阵乘法的形式为:
G N = ( I N / 2 ⊗ F ) R N ( I 2 ⊗ G N / 2 ) \boldsymbol G_N = \left ( \boldsymbol I_{N/2} \otimes \boldsymbol F \right) \boldsymbol R_N \left (\boldsymbol I_2 \otimes \boldsymbol G_{N/2} \right) GN=(IN/2F)RN(I2GN/2)

定义:极化码编码
长度为 N N N的极化码的编码过程可以写为 G F ( 2 ) GF(2) GF(2)上的矩阵乘法:
x 1 N = u 1 N G N \boldsymbol x^N_1 = \boldsymbol u^N_1 \boldsymbol G_N x1N=u1NGN

定义:极化信道
i i i个信源比特 u i u_i ui所经历的第 i i i个极化信道具有如下的条件分布,这个条件分布表示为
W N ( i ) ( y 1 N , u 1 i − 1 ∣ u i ) = Pr ( y 1 N , u 1 i ) / Pr ( u i ) = 2 ∑ u i + 1 N Pr ( y 1 N , u 1 N ) = 2 Pr ( u 1 N ) ∑ u i + 1 N Pr ( y 1 N ∣ u 1 N ) = 1 2 N − 1 ∑ u i + 1 N Pr ( y 1 N ∣ x 1 N ) = ( a ) 1 2 N − 1 ∑ u i + 1 N ∏ i = 1 N W ( y i ∣ x i ) \begin{aligned} W^{(i)}_N (\boldsymbol y^N_1, \boldsymbol u^{i-1}_1 | u_i) &= \text{Pr} (\boldsymbol y^N_1, \boldsymbol u^{i}_1) / \text{Pr}(u_i) \\ &= 2 \sum_{ u_{i+1}^N } \text{Pr} (\boldsymbol y^N_1, \boldsymbol u^N_1) = \frac{2}{ \text{Pr}(\boldsymbol u^N_1) } \sum_{ u_{i+1}^N } \text{Pr} (\boldsymbol y^N_1 | \boldsymbol u^N_1) \\ &= \frac{1}{2^{N-1}} \sum_{ u_{i+1}^N } \text{Pr} (\boldsymbol y^N_1 | \boldsymbol x^N_1) \overset{(a)}{=} \frac{1}{2^{N-1}} \sum_{ u_{i+1}^N } \prod_{i=1}^N W ( y_i | x_i) \end{aligned} WN(i)(y1N,u1i1ui)=Pr(y1N,u1i)/Pr(ui)=2ui+1NPr(y1N,u1N)=Pr(u1N)2ui+1NPr(y1Nu1N)=2N11ui+1NPr(y1Nx1N)=(a)2N11ui+1Ni=1NW(yixi)

其中 x 1 N = u 1 N G N \boldsymbol x^N_1 = \boldsymbol u^N_1 \boldsymbol G_N x1N=u1NGN,等号(a)是因为信道 W W W是无记忆的。上式中 W N ( i ) W^{(i)}_N WN(i)表示概率集函数,相当于 Pr \text{Pr} Pr,也用来代指第 i i i个极化信道。如同转移概率 W ( y ∣ x ) W(y|x) W(yx)的定义一样,信道 W N ( i ) ( y 1 N , u 1 i − 1 ∣ u i ) W^{(i)}_N (\boldsymbol y^N_1, \boldsymbol u^{i-1}_1 | u_i) WN(i)(y1N,u1i1ui)的【输入】是 u i u_i ui,【输出】是 y 1 N \boldsymbol y^N_1 y1N u 1 i − 1 \boldsymbol u^{i-1}_1 u1i1,即极化信道 W N i W^{i}_N WNi不仅能观测到【物理信道 W W W】的输出 y 1 N \boldsymbol y^N_1 y1N,还能观测到比特值 ( u 1 , u 2 , ⋯   , u i − 1 ) (u_1,u_2,\cdots,u_{i-1}) (u1,u2,,ui1)。这是因为极化码使用串行抵消译码,当从 u 1 u_1 u1开始逐一估计信源比特,直到 u N u_N uN。因此,在译码 u i u_i ui时, ( u 1 , u 2 , ⋯   , u i − 1 ) (u_1,u_2,\cdots,u_{i-1}) (u1,u2,,ui1)的值都已经获得,被当作译码 u i u_i ui所需要的反馈。

定义:极化信道的递归关系
在长度为 N N N的极化码中,极化信道具有如下的递归关系
W N ( 2 i − 1 ) ( y 1 N , u 1 2 i − 2 ∣ u 2 i − 1 ) = 1 2 ∑ u 2 i W N / 2 ( i ) ( y 1 N / 2 , u 1 , o 2 i − 2 ⊕ u 1 , e 2 i − 2 ∣ u 2 i − 1 ⊕ u 2 i ) W N / 2 ( i ) ( y N / 2 + 1 N , u 1 , e 2 i − 2 ∣ u 2 i ) W N ( 2 i ) ( y 1 N , u 1 2 i − 1 ∣ u 2 i ) = 1 2 W N / 2 ( i ) ( y 1 N / 2 , u 1 , o 2 i − 2 ⊕ u 1 , e 2 i − 2 ∣ u 2 i − 1 ⊕ u 2 i ) W N / 2 ( i ) ( y N / 2 + 1 N , u 1 , e 2 i − 2 ∣ u 2 i ) \begin{aligned} W^{(2i-1)}_N (\boldsymbol y^N_1, \boldsymbol u^{2i-2}_1 | u_{2i-1}) &= \frac{1}{2} \sum_{u_{2i}} W^{(i)}_{N/2} (\boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2i-1} \oplus u_{2i}) W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i}) \\ W^{(2i)}_N (\boldsymbol y^N_1, \boldsymbol u^{2i-1}_1 | u_{2i}) &= \frac{1}{2} W^{(i)}_{N/2} (\boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2i-1} \oplus u_{2i}) W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i}) \end{aligned} WN(2i1)(y1N,u12i2u2i1)WN(2i)(y1N,u12i1u2i)=21u2iWN/2(i)(y1N/2,u1,o2i2u1,e2i2u2i1u2i)WN/2(i)(yN/2+1N,u1,e2i2u2i)=21WN/2(i)(y1N/2,u1,o2i2u1,e2i2u2i1u2i)WN/2(i)(yN/2+1N,u1,e2i2u2i)

下面我们通过这张图,来进一步解释上面两个式子

如果一个比特是 u 2 i − 1 u_{2i-1} u2i1,那么它必然和 u 2 i u_{2i} u2i位于同一个2 x 2 极化模块的输入端。在极化码编码图的第一列中, u 2 i − 1 u_{2i-1} u2i1 u 2 i u_{2i} u2i对应的2 x 2极化模块就是第 i i i个极化模块。不难看出, u 2 i − 1 u_{2i-1} u2i1 u 2 i u_{2i} u2i对应的2 x 2极化模块之前还有 i − 1 i-1 i1个2 x 2极化模块,这些前面的极化模块对应的是 ( u 1 , u 2 ) , ⋯   , ( u 2 i − 3 , u 2 i − 2 ) (u_1,u_2), \cdots, (u_{2i-3}, u_{2i-2}) (u1,u2),,(u2i3,u2i2)

u 2 i − 1 u_{2i-1} u2i1 u 2 i u_{2i} u2i对应的2 x 2极化模块右侧的两根走线分别连接到两个长度为 N / 2 N/2 N/2的极化码中的第 i i i个极化信道,被连接的极化信道恰好都是长度为 N / 2 N/2 N/2的极化码中的第 i i i个极化信道。 W N / 2 ( i ) ( y 1 N / 2 , u 1 , o 2 i − 2 ⊕ u 1 , e 2 i − 2 ∣ u 2 i − 1 ⊕ u 2 i ) W^{(i)}_{N/2}( \boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2 i -1} \oplus u_{2i} ) WN/2(i)(y1N/2,u1,o2i2u1,e2i2u2i1u2i)能观测到 y 1 N / 2 \boldsymbol y^{N/2}_1 y1N/2是显然的;还能观测到 u 1 , o 2 i − 2 ⊕ u 1 , e 2 i − 2 \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} u1,o2i2u1,e2i2也是显然的,因为 u 1 ⊕ u 2 , u 3 ⊕ u 4 , ⋯   , u 2 i − 3 ⊕ u 2 i − 2 u_1 \oplus u_2, u_3 \oplus u_4, \cdots , u_{2i-3} \oplus u_{2i-2} u1u2,u3u4,,u2i3u2i2 u 2 i − 1 u_{2i-1} u2i1 u 2 i u_{2i} u2i对应的2 x 2极化模块之前的 i − 1 i-1 i1个2 x 2极化模块所输送,注意到,极化码的串行抵消译码是序贯译码,在译码 u 2 i − 1 u_{2i-1} u2i1时, u 1 u_1 u1 u 2 i − 2 u_{2i-2} u2i2的值都已经获得,而 u 1 , o 2 i − 2 ⊕ u 1 , e 2 i − 2 \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} u1,o2i2u1,e2i2只不过是利用 u 1 u_1 u1 u 2 i − 2 u_{2i-2} u2i2的值算出的结果而已; W N / 2 ( i ) ( y 1 N / 2 , u 1 , o 2 i − 2 ⊕ u 1 , e 2 i − 2 ∣ u 2 i − 1 ⊕ u 2 i ) W^{(i)}_{N/2}( \boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2 i -1} \oplus u_{2i} ) WN/2(i)(y1N/2,u1,o2i2u1,e2i2u2i1u2i)的输入为 u 2 i − 1 ⊕ u 2 i u_{2 i -1} \oplus u_{2i} u2i1u2i,这是因为 u 2 i − 1 ⊕ u 2 i u_{2 i -1} \oplus u_{2i} u2i1u2i对应的2 x 2极化模块将计算结果之一 u 2 i − 1 ⊕ u 2 i u_{2 i -1} \oplus u_{2i} u2i1u2i送入了该信道作为输入。

W N / 2 ( i ) ( y N / 2 + 1 N , u 1 , e 2 i − 2 ∣ u 2 i ) W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i}) WN/2(i)(yN/2+1N,u1,e2i2u2i)的含义按上一段类推,同理可得。

从而,把 W N / 2 ( i ) ( y 1 N / 2 , u 1 , o 2 i − 2 ⊕ u 1 , e 2 i − 2 ∣ u 2 i − 1 ⊕ u 2 i ) W^{(i)}_{N/2}( \boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2 i -1} \oplus u_{2i} ) WN/2(i)(y1N/2,u1,o2i2u1,e2i2u2i1u2i) W N / 2 ( i ) ( y N / 2 + 1 N , u 1 , e 2 i − 2 ∣ u 2 i ) W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i}) WN/2(i)(yN/2+1N,u1,e2i2u2i)视为 W W W,把 u 2 i u_{2i} u2i视为 u 2 u_2 u2,代入到2x2极化子信道 W − : X → Y 2 W^{-}: \mathcal X \rightarrow \mathcal Y^2 W:XY2 W + : X → Y 2 × X W^{+}: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X W+:XY2×X中,即可写出极化信道的递归关系。因此,N信道极化变换与两信道极化变换本质上是一一对应的。

信道极化分解的蝶形结构

我们以八信道极化分解为例,进行解释

上图所示的极化分解包含了3级极化变换:
(1) 第一级:最右侧的8个独立信道 W W W经过复合-分裂操作,得到【4组】独立的两信道极化集合 { W 2 ( 1 ) , W 2 ( 2 ) } \{W^{(1)}_2, W^{(2)}_2\} {W2(1),W2(2)}
(2) 第二级:经过中间一级的极化变换,得到【两组】独立的四信道极化集合 { W 4 ( 1 ) , W 4 ( 2 ) , W 4 ( 3 ) , W 4 ( 4 ) } \{W^{(1)}_4, W^{(2)}_4, W^{(3)}_4, W^{(4)}_4\} {W4(1),W4(2),W4(3),W4(4)}
(3) 第三级:经过左侧最后一级的极化变换,得到八信道极化集合 { W 8 ( 1 ) , W 8 ( 2 ) , W 8 ( 3 ) , W 8 ( 4 ) , W 8 ( 5 ) , W 8 ( 6 ) , W 8 ( 7 ) , W 8 ( 8 ) } \{W^{(1)}_8, W^{(2)}_8, W^{(3)}_8, W^{(4)}_8, W^{(5)}_8, W^{(6)}_8, W^{(7)}_8, W^{(8)}_8\} {W8(1),W8(2),W8(3),W8(4),W8(5),W8(6),W8(7),W8(8)}

由此可见, N = 2 n N=2^n N=2n信道极化,应当包含 log ⁡ 2 N = n \log_2 N= n log2N=n级极化变换,每一级变换中,包含 N / 2 N/2 N/2个基本的【两信道极化变换】 ( W 2 i j , W 2 i j ) ↦ ( W 2 i + 1 2 j − 1 , W 2 i + 1 2 j ) (W^{j}_{2^i}, W^{j}_{2^i}) \mapsto (W^{2j-1}_{2^{i+1}}, W^{2j}_{2^{i+1}}) (W2ij,W2ij)(W2i+12j1,W2i+12j),称为蝶形(Butterfly)结构。

补充:生成矩阵的结构

生成矩阵 G N \boldsymbol G_N GN可以表示为迭代形式
G N = ( I N / 2 ⊗ F ) R N ( I 2 ⊗ G N / 2 ) \boldsymbol G_N = \left ( \boldsymbol I_{N/2} \otimes \boldsymbol F \right) \boldsymbol R_N \left (\boldsymbol I_2 \otimes \boldsymbol G_{N/2} \right) GN=(IN/2F)RN(I2GN/2)

其对应的 N N N信道极化的迭代过程为

上述形式,在数学上也可以等价地写为第二种迭代形式
G N = R N ( F 2 ⊗ I N / 2 ) ( I 2 ⊗ G N / 2 ) = R N ( F 2 ⊗ G N / 2 ) \boldsymbol G_N = \boldsymbol R_N (\boldsymbol F_2 \otimes \boldsymbol I_{N/2}) (\boldsymbol I_2 \otimes \boldsymbol G_{N/2}) = \boldsymbol R_N (\boldsymbol F_2 \otimes \boldsymbol G_{N/2}) GN=RN(F2IN/2)(I2GN/2)=RN(F2GN/2)

下图给出了该迭代式对应的N信道极化变换的迭代过程

将递归形式 G N / 2 = R N / 2 ( F 2 ⊗ G N / 4 ) \boldsymbol G_{N/2} = \boldsymbol R_{N/2} (\boldsymbol F_2 \otimes \boldsymbol G_{N/4}) GN/2=RN/2(F2GN/4)代入到迭代式中,利用等式 A C ⊗ B D = A B ⊗ C D \boldsymbol {AC} \otimes \boldsymbol {BD} = \boldsymbol {AB} \otimes \boldsymbol {CD} ACBD=ABCD,可以得到
G N = R N ( F 2 ⊗ ( R N / 2 ( F 2 ⊗ G N / 4 ) ) ) = R N ( I 2 ⊗ R N / 2 ) ( F 2 2 ⊗ G N / 4 ) \boldsymbol G_N = \boldsymbol R_N \left ( \boldsymbol F_2 \otimes \left ( \boldsymbol R_{N/2} (\boldsymbol F_2 \otimes \boldsymbol G_{N/4}) \right) \right) = \boldsymbol R_N \left ( \boldsymbol I_2 \otimes \boldsymbol R_{N/2} \right) \left ( \boldsymbol F^2_2 \otimes \boldsymbol G_{N/4} \right) GN=RN(F2(RN/2(F2GN/4)))=RN(I2RN/2)(F22GN/4)

重复上述过程,最终得到
G N = B N F 2 ⊗ n \boldsymbol G_N = \boldsymbol B_N \boldsymbol F_2^{\otimes n} GN=BNF2n

其中 B N = R N ( I 2 ⊗ R N / 2 ) ( I 4 ⊗ R N / 4 ) ⋯ ( I N / 2 ⊗ R 2 ) \boldsymbol B_N= \boldsymbol R_N (\boldsymbol I_2 \otimes \boldsymbol R_{N/2}) (\boldsymbol I_4 \otimes \boldsymbol R_{N/4}) \cdots (\boldsymbol I_{N/2} \otimes \boldsymbol R_{2}) BN=RN(I2RN/2)(I4RN/4)(IN/2R2)是比特反序矩阵,基于迭代结构,比特反序 矩阵也可以表示为递推形式
B N = R N ( I 2 ⊗ B N / 2 ) \boldsymbol B_N = \boldsymbol R_N (\boldsymbol I_2 \otimes \boldsymbol B_{N/2}) BN=RN(I2BN/2)

其初始条件 B 2 = I 2 \boldsymbol B_2 = \boldsymbol I_2 B2=I2

参考文献
[1] E. Arikan, “Channel Polarization: A Method for Constructing Capacity-Achieving Codes for Symmetric Binary-Input Memoryless Channels,” in IEEE Transactions on Information Theory, vol. 55, no. 7, pp. 3051-3073, July 2009, doi: 10.1109/TIT.2009.2021379.
[2] 牛凯. 极化码原理与应用. Print.(2021)
[3] 于永润. 极化码讲义.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/485585.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python算法设计 - 快速排序

目录 一、快速排序二、Python算法实现 一、快速排序 快速排序的概念相信大家都能理解,下面这个算法是基于同样想法的另一种算法,其中利用到了分区。如果实施正确,这是一种非常有效的算法,在预期的O(n.log n) 时间内运行&#xff…

性能测试场景分析并设计?超细案例讲解,看这篇就够了

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 性能测试场景&…

1.1 基于B/S 结构的 Web 应用

文章目录 1.1 基于B/S 结构的 Web 应用1.2 JDK安装与配置1.3 服务器Tomcat下载与安装1.4 Eclipse安装与使用1.4.1 Eclipse 下载及创建Dynamic Web Project1.4.2 Eclipse 中的编码问题1.4.3 将Tomcat和Eclipse相关联1.4.4 Eclipse 自动部署项目到 Tomcat 的 webapps 目录 1.5 My…

ChatGLM-6B模型微调实战(以 ADGEN (广告生成) 数据集为例)

1 介绍 对于 ChatGLM-6B 模型基于 P-Tuning v2 的微调。P-Tuning v2 将需要微调的参数量减少到原来的 0.1%,再通过模型量化、Gradient Checkpoint 等方法,差不多需要 7GB或则8GB 显存即可运行。 2 环境 2.1 python 环境 conda create -n py310_cha…

go 打包文件夹成zip文件

go 打包文件夹成zip文件 代码有些乱,找不到合适的例子,和优雅的代码 当前代码打包文件是在 需要打包的目录下,测试的时候注意文件翻倍容量 writer, err : zzip.CreateHeader(header) //这里创建文件时注意不要用完整路径 zip中会生产完整路径…

【51单片机】蜂鸣器

🎊专栏【51单片机】 🍔喜欢的诗句:更喜岷山千里雪 三军过后尽开颜。 🎆音乐分享【Love Story】 大一同学小吉,欢迎并且感谢大家指出我的问题🥰 🍔效果 (注意听声音哦) 按…

Blob File

文章目录 学习链接Blob创建演示 分片演示 Fileinput手动拖拽fetch 从后端获取流前端代码后端代码 window.showOpenFilePicker Filereader示例1示例2 ArrayBuffer创建bufferTypedArray读写bufferDataView读写buffer与Blob对比 Blob Url & DataUrl示例1示例2 学习链接 Blog …

WIFI密码hacking学习

1 wifite sudo -i 切换到root终端,执行wifite CtrlC 停止WIFI列表扫描 这里选择爆破目标1,他会先监听客户端和wifi的连接的数据包,然后用wordlist-probable.txt里面的字典进行爆破 区别 WPS 是 no 的和yes no会自动化爆破 这种模式默认下…

软件测试行业前景怎么样

软件测试工程师工作好找,但是企业有时却很难招聘到合适的软件测试工程师,这是因为现在企业需要的是自动化测试人才和测试开发人才!前些年的手动测试员早已不能满足企业现在的发展需求。 随着人工智能时代的到来,IT行业受到了越来…

从‘孔乙己长衫’现象看社会不公

孔乙已是鲁迅笔下人物,穷困流倒还穿着象征读书人的长衫,迁腐、麻木。最近,大家自我调佩是“当代孔乙己”,学历成为思想负担,找工作时高不成低不就。 认识孔乙己 孔乙己是清朝末年的小贩,生活在贫苦的阶层…

ubuntu22.04安装与配置

目录 一、环境及下载 iso下载 VM配置 二、虚拟机与环境配置 虚拟机开始后的配置 一些工具配置 参考: VMware Workstation Pro 文档 一、环境及下载 iso下载 Download Ubuntu Desktop | Download | Ubuntu 新出了23但是偶数年份稳定支持,所以我…

openai接口调用-如何接入openai获取 api key

openai api key获取 获取 OpenAI API Key 非常简单,您只需要按照以下步骤进行操作: 创建 OpenAI 账户。如果您还没有 OpenAI 账户,请访问 OpenAI 官网(http://openai.com/signup)并创建一个帐户。登录您的 OpenAI 账户。使用您的…

docker安装ES、kibana和IK分词器

拉取镜像 docker pull elasticsearch:7.4.2 docker pull kibana:7.4.2创建存储数据的目录 mkdir -p /home/lab1018/docker_volume/elasticsearch/config mkdir -p /home/lab1018/docker_volume/elasticsearch/data mkdir -p /home/lab1018/docker_volume/elasticsearch/plugi…

C++-----动态规划

目录 一、动态规划的基本思想 二、设计动态规划法的步骤 三、动态规划问题的特征 4.1 矩阵连乘积问题 4.1.1 分析最优解的结构 4.1.2 建立递归关系 4.1.3 计算最优值 4.1.3 计算最优值 4.1.3 构造最优解 4.2 动态规划算法的基本要素 4.2.1 最优子结构 4.2.2 重叠子问题 …

gRPC结合vcpkg在x64-windows平台visual studio2019 cmake工程里面的应用

这里我们运用vcpkg去下载安装gRPC,进入vcpkg目录后,执行命令:.\vcpkg.exe install grpc:x64-windows grpc在vcpkg里面安装完成后,我们就来使用grpc做一个简单的例子。 gRPC顾名思义,就是google的RPC方案,…

ProtoBuf 编码原理

因为涉及到分布式集群之间的通信,所以来学习了下 ProtoBuf,为什么选择 ProtoBuf 呢?主要还是因为相对于 json , xml 来说,ProtoBuf 传输效率更快,故需要了解下它的编码设计。 首先,每一个 message 进行编码…

科研人必看入门攻略(收藏版)

来源:投稿 作者:小灰灰 编辑:学姐 本文主要以如何做科研,日常内功修炼,常见科研误区,整理日常‘好论文’四个部分做以介绍,方便刚入门的科研者进行很好的规划。 1.如何做科研 1.1 选方向 当我…

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码 相关链接 (1)建模方案 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解 &#x…

【初学人工智能原理】【4】梯度下降和反向传播:能改(下)

前言 本文教程均来自b站【小白也能听懂的人工智能原理】,感兴趣的可自行到b站观看。 本文【原文】章节来自课程的对白,由于缺少图片可能无法理解,故放到了最后,建议直接看代码(代码放到了前面)。 代码实…

《LearnUE——基础指南:开篇—2》——准备工作

目录 0.2.1 UE的获取与创建项目 0.2.2 UE4编辑器界面布局 1. 编辑器介绍 2. 新建蓝图与蓝图拖动 3. 菜单介绍 4. 工具栏介绍 0.2.3 学习资料 0.2.1 UE的获取与创建项目 登录UE官网:www.unrealengine.com 点击“登录”,如果没有账号&#xff0…