文章目录

极化码的基础先验知识
- 二进制输入离散无记忆信道模型(Binary-input Discreten Memoryless Channel, B-DMC)
- 二进制离散输入信道的ML判决和错误率
- B-DMC相关参数的定义和理解
两信道极化
N信道极化的解释
信道极化分解的蝶形结构
补充：生成矩阵的结构

极化码的基础先验知识

二进制输入离散无记忆信道模型(Binary-input Discreten Memoryless Channel, B-DMC)

给定B-DMC信道 $\mathcal{X} \rightarrow \mathcal Y$ ，信道转移概率(transition probability)为 $\in \mathcal X, y \in \mathcal y$ 。对于B-DMC信道而言，输入信号的集合一般为 $\mathcal X=\{0,1\}$ ，输出信号集合 $\mathcal Y$ 和转移概率 $W (y ∣ x)$ 具有任意形式。

We write $W^N$ to denote the channel correpsonding to $N$ use of $W$ , thus, $W^N: \mathcal{X}^N \rightarrow \mathcal Y^N$ with $W^N(x^N_1| y^N_1) = \prod_{i=1}^N W(y_i|x_i)$ .
The symmetric capacity is the highest rate achievable subject to using the input letters of the channel with equal probability.

二进制离散输入信道的ML判决和错误率

二进制输入离散信道 $W$ 的最大似然（ML）判决指当收到符号 $y$ 时， $x$ 的值按下式判决
ML判决准则
$\hat x_{ML} = \argmax_{x \in \{0,1\}} W(y|x)$

ML判决的错误率的两种等价写法
$\begin{aligned} P^{ML}_e(W) &= \frac{1}{2} \sum_{y \in \mathcal Y} \min \left \{W(y|0), W(y|1) \right \} \\ P^{ML}_e(W) &=\sum_{x, y} \frac{1}{2} W(y|x) \mathbb 1_{ \{ W(y|x) \leq W(y | x \oplus 1) \} } \left ( x, y \right) \end{aligned}$

对错误率表达式的简单理解：

B-DMC相关参数的定义和理解

对于B-DMC信道 $\mathcal{X} \rightarrow \mathcal Y$ ，相应的信道互信息(or say, symmetric capacity)、差错概率与Bhattacharyya参数（简称巴氏参数）分别定义为：
$\begin{aligned} I(W) & \triangleq \sum_{y \in \mathcal Y} \sum_{x \in \mathcal X} \frac{1}{2} W(y|x) \log \frac{W(y|x)}{ \frac{1}{2} W(y|0) + \frac{1}{2} W(y|1) } \\ P_e(W) & \triangleq \sum_{x, y} \frac{1}{2} W(y|x) \mathbb 1_{ \{ W(y|x) \leq W(y | x \oplus 1) \} } \left ( x, y \right) \\ Z(W) & \triangleq \sum_{y \in \mathcal Y} \sqrt { W(y|0) W(y|1) } \end{aligned}$

这里我们证明 $P_e(W) \leq Z(W)$ ，即巴氏参数 $Z (W)$ 是ML判决差错概率的上界

证明： $P_e(W) \leq Z(W)$
$\min \left \{W(y|0), W(y|1) \right \} \leq \sqrt { W(y|0) W(y|1) }$
即可得证。

进一步解释 $I (W)$ 和 $Z (W)$ 的物理意义

互信息 $I (W)$ 衡量B-DMC信道W的可达速率，即输入信号先验等概条件下可靠通信的最高数据率。
巴氏参数 $Z (W)$ 表示信道 $W$ 发送比特0或1，采用最大似然判决准则的差错概率上界。

对于B-DMC信道而言， $\in [0,1]$ 。

从直观上讲，我们希望 $\approx 1$ iff $\approx 0$ ； $\approx 0$ iff $\approx 1$ ，下面将给出相关的证明。

Proposition 1: 对任意B-DMC $W$ ，有
$\begin{aligned} I(W) & \geq \log \frac{2}{1 + Z(W)} \\ I(W) & \leq \sqrt{1 - Z(W)^2} \end{aligned}$

证明(Prop. 1)：
Proof of $\geq \log \frac{2}{1 + Z(W)}$ : 省略。
Proof of $\leq \sqrt{1 - Z(W)^2}$ ：
对于B-DMC信道 $\mathcal{X} \rightarrow \mathcal Y$ ，我们首先定义
$\triangleq \frac{1}{2} \sum_{y \in \mathcal Y} \left | W(y|0) -W(y|1) \right|$

$d (W)$ 表示两个关于 $y$ 的分布 $W (y ∣0)$ 和 $W (y ∣1)$ 之间的变分距离(Variational Distance)。
引理-1：对任意B-DMC信道 $\mathcal{X} \rightarrow \mathcal Y$ ， $\leq d(W)$
Proof of 引理-1：令 $W$ 是任意的B-DMC，其输出的集合为 $\mathcal Y=\{1,\cdots,n\}$ ，且令 $P_i = W(i|0),Q_i=W(i|1),i=1,2,\cdots,n$ ，那么根据定义，我们有
$\sum_{i=1}^n \frac{1}{2} \left [ P_i \log \frac{P_i}{\frac{1}{2} P_i + \frac{1}{2} Q_i} + Q_i \log \frac{Q_i}{\frac{1}{2} P_i + \frac{1}{2} Q_i} \right]$

对于上式 $[\cdot]$ 中的内容，我们可以定义
$\triangleq x \log \frac{x}{x + \delta} + (x + 2 \delta) \log \frac{x + 2 \delta}{ x + \delta}$

其中 $x=\min\{P_i, Q_i\}$ ， $\delta = \frac{1}{2} |P_i - Q_i|$ 。我们考虑在 $\leq x \leq 1-2 \delta$ 的区间内最大化 $f (x)$ ，计算
$\frac{df}{dx} = \frac{1}{2} \log \frac{ \sqrt{x(x+2\delta)} } {x + \delta}$

注意到，上述表达式的分子 $\sqrt{x(x+2\delta)}$ 和分母 $\delta)$ ，分别对应两个正数 $x$ 和 $(x+2\delta)$ 的几何平均(geometric mean)和算数平均(arithmetic mean)，因此 $\leq 0$ ，当 $x = 0$ 时， $f (x)$ 取最大，所以 $\leq f(0)=2 \delta$ ，对应的互信息满足：
$\leq \sum_{i=1} \frac{1}{2} |P_i - Q_i| = d(W)$

引理-2：对任意B-DMC信道 $\mathcal{X} \rightarrow \mathcal Y$ ， $\leq \sqrt{1 - Z(W)^2}$
证明从略。

因此可以得到 $\leq \sqrt{1 - Z(W)^2}$

对称信道(symmetric channel)：对于B-DMC信道 $W$ ，假设存在重排变换 $\pi$ ，对于输出信号集合 $\mathcal Y$ ，满足如下两个条件：
(1) 重排变换可逆： $\pi^{-1} = \pi$
(2) 对于任意的 $\in \mathcal Y$ ， $W(y|1)=W(\pi(y)|0)$
则称B-DMC信道 $W$ 满足对称性。（由经典信息论可知，对于对称信道 $W$ ，它的互信息等于信道容量，即 $I (W) = C$ ）

这里列举两种常用的对称信道
example-1: 二元对称信道(BSC) $\mathcal X=\{0,1\} \rightarrow \mathcal Y=\{0,1\}$ ，其满足对称性，即
$\begin{aligned} W(0|0) &= W(1|1) \\ W(1|0) &= W(0|1) \end{aligned}$

example-2：二元删余信道(BEC) $\mathcal X=\{0,1\} \rightarrow \mathcal Y=\{0,e,1\}$ （ $e$ 是删除符号），也满足对称性，即
$\begin{aligned} W(0|0) &= W(1|1) \\ W(e|0) &= W(e|1) \end{aligned}$

其中 $\pi(0)=1,\pi(1)=0,\pi(e)=e$ 。

符号的定义
我们定义 $a^N_1$ 表示行向量 $(a_1,\cdots, a_N)$ ，给定行向量 $a^N_1$ ，我们记 $a^j_i$ 为子向量 $(a_i, \cdots, a_j), 1 \leq i \leq j \leq N$ 。给定 $a^N_1$ 和集合 $\mathcal A \subset \{1, \cdots, N\}$ ，我们用 $a_{\mathcal A}$ 来指定子向量 $(a_i ,i \in \mathcal A)$ 。我们记 $a^j_{1,o}$ 来指明奇数索引(odd indices) $(a_k, 1 \leq k \leq j; k \text{ odd})$ ，类似地，记 $a^j_{1,e}$ 来指明偶数索引(even indices) $(a_k, 1 \leq k \leq j; k \text{ even})$ 。

两信道极化

首先给出一个二元删余信道(BEC)的两信道极化示例，如下图所示

图(a)给出了删余率 $\epsilon=0.5$ 的BEC信道的映射关系 $\mathcal X=\{0,1\} \rightarrow \mathcal Y=\{0, e, 1\}$ ，其信道互信息为 $I (W) = 0.5$ ，巴氏参数 $Z (W) = 0.5$ 。

图(b)是2信道极化的过程， $u_1,u_2 \in \{0,1\}$ 是输入信道的两比特， $x_1, x_2 \in \{0,1\}$ 是经过模2加编码后的两比特，将其分别送入信道 $W$ 后得到 $y_1,y_2 \in \mathcal Y$ 两个输出信号。对应的编码过程为
$(x_1, x_2) = (u_1, u_2) \left[ \begin{matrix} 1& 0\\ 1& 1\\ \end{matrix} \right] = (u_1, u_2) \boldsymbol F_2$

通过矩阵 $\boldsymbol F_2$ 的极化操作，将一对独立信道 $(W, W)$ 变换为两个相关的子信道 $W^{-}, W^{+})$ ，其中

$W^{-}: \mathcal X \rightarrow \mathcal Y^2$ (信道的输入输出关系对应上图中的虚线)
$W^{+}: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X$ (信道的输入输出关系对应上图中的点划线)

两个子信道的互信息满足下面的关系：
$\begin{aligned} I(W^{-}) & \leq I(W) \leq I(W^{+}) \\ Z(W^{-}) & \geq Z(W) \geq Z(W^{+}) \end{aligned}$

由于 $I(W^{-}) \leq I(W^{+})$ ，这两个子信道产生了分化， $W^+$ 是好信道， $W^-$ 是差信道，这就是极化现象。我们称矩阵 $\boldsymbol F_2$ 为 $\times 2$ 的极化核（或称为二阶极化核）

对于一般的B-DMC信道 $W$ ，两信道极化是普遍存在的，有如下定理：

定理1：对于两信道极化变换 $\mapsto (W^-, W^+)$ ，相应的极化子信道互信息满足：
$\begin{aligned} I(W^-) &+ I(W^+) = 2 I(W) \\ I(W^-) & \leq I(W) \leq I(W^+) \end{aligned}$
当且仅当 $I (W) = 0, 1$ 时，等号成立。

证明：给定B-DMC信道 $\mathcal X \rightarrow \mathcal Y$ ，经过两信道极化变换 $(u_1, u_2) \rightarrow (u_1 \oplus u_2, u_2)=(x_1, x_2)$ ，得到的复合信道 $\times W: \mathcal X^2 \rightarrow \mathcal Y^2$ 分解为两个极化子信道 $W^-: \mathcal X \rightarrow \mathcal Y^2$ 与 $W^+: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X$ 。

复合信道 $W\times W$ 的转移概率为
$\begin{aligned} W(y_1, y_2| u_1, u_2) &= W(y_2|u_2) W(y_1 | u_2 \oplus u_1) \\ &= W(y_2|x_2) W(y_1 | x_1) \end{aligned}$

对于极化子信道 $W^-:\mathcal X \rightarrow \mathcal Y^2$ ，转移概率为
$\begin{aligned} W^{(1)}_2(y_1, y_2|u_1) &= \frac{ \sum_{u_2=0}^1 P(y_1, y_2, u_1, u_2) } {P(u_1)} \\ &= \frac{ \sum_{u_2=0}^1 P(u_1) P(u_2) W(y_1, y_2| u_1, u_2) } {P(u_1)} \\ &= \sum_{u_2=0}^1 \frac{1}{2} W(y_1, y_2|u_1, u_2) \\ &= \sum_{u_2=0}^1 \frac{1}{2} W(y_2|u_2) W(y_1 | u_2 \oplus u_1) \end{aligned}$

对于极化子信道 $W^+: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X$ ，转移概率为
$\begin{aligned} W^{(2)}_2(y_1, y_2,u_1|u_2) &= \frac{ P(y_1, y_2, u_1, u_2) } {P(u_2)} \\ &= \frac{1}{2} W(y_1, y_2|u_1, u_2) \\ &= \frac{1}{2} W(y_2|u_2) W(y_1 | u_2 \oplus u_1) \end{aligned}$

根据互信息链式法则：
$I(U_1,U_2;Y_1,Y_2) = I(U_1; Y_1, Y_2) + I(U_2;Y_1,Y_2|U_1)$

我们不难发现， $I(U_1; Y_1, Y_2)$ 就是极化子信道 $W^-$ 的互信息， $I(U_2;Y_1,Y_2|U_1)$ 的条件互信息为：
$\begin{aligned} I(U_2;Y_1,Y_2|U_1) &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2|u_1; u_2)}{P(y_1,y_2|u_1) P(u_2)} \\ &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2|u_1, u_2)}{P(y_1,y_2|u_1)} \\ &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2,u_1|u_2) \cdot \frac{P(u_2)}{P(u_1)P(u_2)}} { \frac{P(y_1,y_2,u_1)}{P(u_1)} } \\ &= \sum_{y_1,y_2} \sum_{u_1, u_2} P(y_1,y_2,u_1,u_2) \log \frac{P(y_1,y_2,u_1|u_2)} {P(y_1,y_2,u_1)} \\ &= I(U_2; Y_1,Y_2,U_1) = I(W^+) \end{aligned}$

代入到链式法则中，可以得到 $I(U_1,U_2;Y_1,Y_2)=I(W^-)+I(W^+)$ 。

另外，因为
$I(U_1,U_2;Y_1,Y_2)=I(X_1,X_2;Y_1,Y_2) = I(X_1;Y_1) + I(X_2;Y_2) = 2I(W)$

所以 $I(W^-)+I(W^+)=2I(W)$

对于极化子信道的互信息，利用链式法则，可以进一步展开为
$\begin{aligned} I(W^+) &= I(U_2; Y_1, Y_2, U_1) \\ &= I(U_2; Y_2) + I(U_2; Y_1, U_1|Y_2) \\ &= I(W) + I(U_2; Y_1, U_1|Y_2) \end{aligned}$

因为 $I(U_2; Y_1, U_1|Y_2) \geq 0$ ，因此 $I(W^+) \geq I(W)$ ，又因为 $I(W^-)+I(W^+)=2I(W)$ ，所以必然有 $\geq I(W^-)$ 。
证毕！

由定理-1可知，两信道极化变换后的复合信道 $W^-,W^+)$ 的容量等于两个独立信道 $W$ 的容量和，容量保持不变没有损失。

定理-2：对于两信道极化变换 $\mapsto (W^-, W^+)$ ，相应的极化子信道的巴氏参数满足：
$\begin{aligned} Z(W^+) &= Z^2(W) \\ Z(W^-) &\leq 2 Z(W) - Z^2(W) \\ Z(W^+) &\leq Z(W) \leq Z(W^-) \end{aligned}$

证明：略。

定理-2表明，经过两信道极化后，整个复合信道的可靠性得到了提升，巴氏参数满足如下关系
$Z(W^-)+Z(W^+) \leq 2 Z(W)$

当且仅当 $W$ 是BEC信道时，等号成立。

小结
两信道极化是理解极化码的基础，经过简单的编码操作，构成了复合信道 $W^-,W^+)$ ，然后进一步分解为有相关性的两个极化子信道 $W^-$ 和 $W^+$ ，由定理-1可知，两信道和容量不发生变化，只是单个信道容量在两个极化子信道之间偏移，产生一好一差两极化分化。而由定理-2可知，两信道的巴氏参数和减小，意味着可靠性提升。

N信道极化的解释

长度为 $N=2^n$ 的极化码是长度为2的极化码的扩展，即长度为2的极化码产生的极化信道 $W^{(1)}_2$ 和 $W^{2}_2$ 被当作另一个长度为2的极化码的 $W$ 。一个长度为4的极化码的极化过程入下图所示，其中 $u_1,u_2,u_3,u_4)$ 是信源比特， $x_1,x_2,x_3,x_4)$ 是码字比特。按照图中的走线，编码过程从左往右看，极化过程从右向左看

当 $N = 2$ 时，极化过程可以表示为 $\rightarrow (W^{(1)}_2, W^{(2)}_2)$ ，当 $N = 4$ 时， $(W^{(1)}_2, W^{(1)}_2) \rightarrow (W^{(1)}_4, W^{(2)}_4), (W^{(2)}_2, W^{(2)}_2) \rightarrow (W^{(3)}_4, W^{(4)}_4)$

一般来讲，这个规律是： $(W^{(i)}_N, W^{(i)}_N) \rightarrow (W^{(2i-1)}_{2N}, W^{(2i)}_{2N})$ ，其中 $W^{(i)}_N$ 是长度为 $N$ 的极化码的第 $i$ 个极化信道，而 $W^{(2i-1)}_{2N}$ 和 $W^{(2i)}_{2N})$ 是长度为 $2 N$ 的极化码的第 $(2 i - 1)$ 和 $2 i$ 个极化信道。

依照这个规律，一个长度为8的极化过程如下图所示，其中 $(u_1,u_2,\cdots,u_8)$ 是信源比特， $(x_1,x_2,\cdots,x_8)$ 是码字比特。

接下来，我们尝试寻找极化码编码过程或极化过程的通用描述，如上面两张图所示，由‘ $\oplus$ ’和‘走线’构成的图称为长度为 $N$ 的极化码的编码图，表示这张图的矩阵被称为生成矩阵 $\boldsymbol G_N$ 。当 $N = 2$ 时，生成矩阵 $\boldsymbol G_2 = \boldsymbol F= \left[ \begin{matrix} 1& 0\\ 1& 1\\ \end{matrix} \right]$ .

我们参考【长度为8的极化码】进行解读。长度为 $N$ 的极化码编码图的最左列是竖着排列的 $\frac{N}{2}$ 个长度为2的极化码的编码图，所有这 $\frac{N}{2}$ 个长度为2的极化码的第1个码字比特 $(u_1 \oplus u_2, u_3 \oplus u_4, \cdots, u_{N-1} \oplus u_N)$ 被置换到上一半，所有这 $\frac{N}{2}$ 个长度为2的极化码的第2个码字比特 $(u_2,u_4,\cdots,u_N)$ 被置换到下一半。从左侧数【第2列至第n列】的上半部分是要给长度为 $\frac{N}{2}$ 的极化码的编码图（这就是极化码编码图的递归规律），写成矩阵乘法的形式为：
$\boldsymbol G_N = \left ( \boldsymbol I_{N/2} \otimes \boldsymbol F \right) \boldsymbol R_N \left (\boldsymbol I_2 \otimes \boldsymbol G_{N/2} \right)$

定义：极化码编码
长度为 $N$ 的极化码的编码过程可以写为 $GF (2)$ 上的矩阵乘法：
$\boldsymbol x^N_1 = \boldsymbol u^N_1 \boldsymbol G_N$

定义：极化信道
第 $i$ 个信源比特 $u_i$ 所经历的第 $i$ 个极化信道具有如下的条件分布，这个条件分布表示为
$\begin{aligned} W^{(i)}_N (\boldsymbol y^N_1, \boldsymbol u^{i-1}_1 | u_i) &= \text{Pr} (\boldsymbol y^N_1, \boldsymbol u^{i}_1) / \text{Pr}(u_i) \\ &= 2 \sum_{ u_{i+1}^N } \text{Pr} (\boldsymbol y^N_1, \boldsymbol u^N_1) = \frac{2}{ \text{Pr}(\boldsymbol u^N_1) } \sum_{ u_{i+1}^N } \text{Pr} (\boldsymbol y^N_1 | \boldsymbol u^N_1) \\ &= \frac{1}{2^{N-1}} \sum_{ u_{i+1}^N } \text{Pr} (\boldsymbol y^N_1 | \boldsymbol x^N_1) \overset{(a)}{=} \frac{1}{2^{N-1}} \sum_{ u_{i+1}^N } \prod_{i=1}^N W ( y_i | x_i) \end{aligned}$

其中 $\boldsymbol x^N_1 = \boldsymbol u^N_1 \boldsymbol G_N$ ，等号(a)是因为信道 $W$ 是无记忆的。上式中 $W^{(i)}_N$ 表示概率集函数，相当于 $\text{Pr}$ ，也用来代指第 $i$ 个极化信道。如同转移概率 $W (y ∣ x)$ 的定义一样，信道 $W^{(i)}_N (\boldsymbol y^N_1, \boldsymbol u^{i-1}_1 | u_i)$ 的【输入】是 $u_i$ ，【输出】是 $\boldsymbol y^N_1$ 和 $\boldsymbol u^{i-1}_1$ ，即极化信道 $W^{i}_N$ 不仅能观测到【物理信道 $W$ 】的输出 $\boldsymbol y^N_1$ ，还能观测到比特值 $(u_1,u_2,\cdots,u_{i-1})$ 。这是因为极化码使用串行抵消译码，当从 $u_1$ 开始逐一估计信源比特，直到 $u_N$ 。因此，在译码 $u_i$ 时， $(u_1,u_2,\cdots,u_{i-1})$ 的值都已经获得，被当作译码 $u_i$ 所需要的反馈。

定义：极化信道的递归关系
在长度为 $N$ 的极化码中，极化信道具有如下的递归关系
$\begin{aligned} W^{(2i-1)}_N (\boldsymbol y^N_1, \boldsymbol u^{2i-2}_1 | u_{2i-1}) &= \frac{1}{2} \sum_{u_{2i}} W^{(i)}_{N/2} (\boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2i-1} \oplus u_{2i}) W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i}) \\ W^{(2i)}_N (\boldsymbol y^N_1, \boldsymbol u^{2i-1}_1 | u_{2i}) &= \frac{1}{2} W^{(i)}_{N/2} (\boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2i-1} \oplus u_{2i}) W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i}) \end{aligned}$

下面我们通过这张图，来进一步解释上面两个式子

如果一个比特是 $u_{2i-1}$ ，那么它必然和 $u_{2i}$ 位于同一个2 x 2 极化模块的输入端。在极化码编码图的第一列中， $u_{2i-1}$ 和 $u_{2i}$ 对应的2 x 2极化模块就是第 $i$ 个极化模块。不难看出， $u_{2i-1}$ 和 $u_{2i}$ 对应的2 x 2极化模块之前还有 $i - 1$ 个2 x 2极化模块，这些前面的极化模块对应的是 $(u_1,u_2), \cdots, (u_{2i-3}, u_{2i-2})$

$u_{2i-1}$ 和 $u_{2i}$ 对应的2 x 2极化模块右侧的两根走线分别连接到两个长度为 $N /2$ 的极化码中的第 $i$ 个极化信道，被连接的极化信道恰好都是长度为 $N /2$ 的极化码中的第 $i$ 个极化信道。 $W^{(i)}_{N/2}( \boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2 i -1} \oplus u_{2i} )$ 能观测到 $\boldsymbol y^{N/2}_1$ 是显然的；还能观测到 $\boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e}$ 也是显然的，因为 $u_1 \oplus u_2, u_3 \oplus u_4, \cdots , u_{2i-3} \oplus u_{2i-2}$ 由 $u_{2i-1}$ 和 $u_{2i}$ 对应的2 x 2极化模块之前的 $i - 1$ 个2 x 2极化模块所输送，注意到，极化码的串行抵消译码是序贯译码，在译码 $u_{2i-1}$ 时， $u_1$ 和 $u_{2i-2}$ 的值都已经获得，而 $\boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e}$ 只不过是利用 $u_1$ 至 $u_{2i-2}$ 的值算出的结果而已； $W^{(i)}_{N/2}( \boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2 i -1} \oplus u_{2i} )$ 的输入为 $u_{2 i -1} \oplus u_{2i}$ ，这是因为 $u_{2 i -1} \oplus u_{2i}$ 对应的2 x 2极化模块将计算结果之一 $u_{2 i -1} \oplus u_{2i}$ 送入了该信道作为输入。

$W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i})$ 的含义按上一段类推，同理可得。

从而，把 $W^{(i)}_{N/2}( \boldsymbol y^{N/2}_1, \boldsymbol u^{2i-2}_{1,o} \oplus \boldsymbol u^{2i-2}_{1,e} | u_{2 i -1} \oplus u_{2i} )$ 和 $W^{(i)}_{N/2} (\boldsymbol y^N_{N/2 + 1}, \boldsymbol u^{2i-2}_{1,e} | u_{2i})$ 视为 $W$ ，把 $u_{2i}$ 视为 $u_2$ ，代入到2x2极化子信道 $W^{-}: \mathcal X \rightarrow \mathcal Y^2$ 和 $W^{+}: \mathcal X \rightarrow \mathcal Y^2 \times \mathcal X$ 中，即可写出极化信道的递归关系。因此，N信道极化变换与两信道极化变换本质上是一一对应的。

信道极化分解的蝶形结构

我们以八信道极化分解为例，进行解释

上图所示的极化分解包含了3级极化变换：
(1) 第一级：最右侧的8个独立信道 $W$ 经过复合-分裂操作，得到【4组】独立的两信道极化集合 $\{W^{(1)}_2, W^{(2)}_2\}$
(2) 第二级：经过中间一级的极化变换，得到【两组】独立的四信道极化集合 $\{W^{(1)}_4, W^{(2)}_4, W^{(3)}_4, W^{(4)}_4\}$
(3) 第三级：经过左侧最后一级的极化变换，得到八信道极化集合 $\{W^{(1)}_8, W^{(2)}_8, W^{(3)}_8, W^{(4)}_8, W^{(5)}_8, W^{(6)}_8, W^{(7)}_8, W^{(8)}_8\}$

由此可见， $N=2^n$ 信道极化，应当包含 $log_2 N= n$ 级极化变换，每一级变换中，包含 $N /2$ 个基本的【两信道极化变换】 $(W^{j}_{2^i}, W^{j}_{2^i}) \mapsto (W^{2j-1}_{2^{i+1}}, W^{2j}_{2^{i+1}})$ ，称为蝶形(Butterfly)结构。

补充：生成矩阵的结构

生成矩阵 $\boldsymbol G_N$ 可以表示为迭代形式
$\boldsymbol G_N = \left ( \boldsymbol I_{N/2} \otimes \boldsymbol F \right) \boldsymbol R_N \left (\boldsymbol I_2 \otimes \boldsymbol G_{N/2} \right)$

其对应的 $N$ 信道极化的迭代过程为

上述形式，在数学上也可以等价地写为第二种迭代形式
$\boldsymbol G_N = \boldsymbol R_N (\boldsymbol F_2 \otimes \boldsymbol I_{N/2}) (\boldsymbol I_2 \otimes \boldsymbol G_{N/2}) = \boldsymbol R_N (\boldsymbol F_2 \otimes \boldsymbol G_{N/2})$

下图给出了该迭代式对应的N信道极化变换的迭代过程

将递归形式 $\boldsymbol G_{N/2} = \boldsymbol R_{N/2} (\boldsymbol F_2 \otimes \boldsymbol G_{N/4})$ 代入到迭代式中，利用等式 $\boldsymbol {AC} \otimes \boldsymbol {BD} = \boldsymbol {AB} \otimes \boldsymbol {CD}$ ，可以得到
$\boldsymbol G_N = \boldsymbol R_N \left ( \boldsymbol F_2 \otimes \left ( \boldsymbol R_{N/2} (\boldsymbol F_2 \otimes \boldsymbol G_{N/4}) \right) \right) = \boldsymbol R_N \left ( \boldsymbol I_2 \otimes \boldsymbol R_{N/2} \right) \left ( \boldsymbol F^2_2 \otimes \boldsymbol G_{N/4} \right)$

重复上述过程，最终得到
$\boldsymbol G_N = \boldsymbol B_N \boldsymbol F_2^{\otimes n}$

其中 $\boldsymbol B_N= \boldsymbol R_N (\boldsymbol I_2 \otimes \boldsymbol R_{N/2}) (\boldsymbol I_4 \otimes \boldsymbol R_{N/4}) \cdots (\boldsymbol I_{N/2} \otimes \boldsymbol R_{2})$ 是比特反序矩阵，基于迭代结构，比特反序矩阵也可以表示为递推形式
$\boldsymbol B_N = \boldsymbol R_N (\boldsymbol I_2 \otimes \boldsymbol B_{N/2})$

其初始条件 $\boldsymbol B_2 = \boldsymbol I_2$ 。

参考文献
[1] E. Arikan, “Channel Polarization: A Method for Constructing Capacity-Achieving Codes for Symmetric Binary-Input Memoryless Channels,” in IEEE Transactions on Information Theory, vol. 55, no. 7, pp. 3051-3073, July 2009, doi: 10.1109/TIT.2009.2021379.
[2] 牛凯. 极化码原理与应用. Print.(2021)
[3] 于永润. 极化码讲义.