语义通信：DeepSC用于文本传输也太香了吧

论文标题：Deep Learning Enabled Semantic Communication Systems

论文链接：https://arxiv.org/abs/2006.10685v1

摘要

最近，人们开发了支持深度学习的端到端（E2E）通信系统，以合并传统通信系统中的所有物理层块，从而使联合收发器优化成为可能。在深度学习的推动下，自然语言处理（NLP）在分析和理解大量语言文本方面取得了巨大成功。

受这两个领域研究成果的启发，我们的目标是从语义层面对通信系统提供一个新的视角。特别地，我们提出了一个基于深度学习的语义通信系统，名为DeepSC，用于文本传输。基于该转换器，DeepSC旨在通过恢复句子的意义，而不是传统通信中的位或符号错误，来最大限度地提高系统容量并最小化语义错误。

此外，迁移学习用于确保DeepSC适用于不同的通信环境，并加速模型训练过程。为了准确证明语义通信的性能，我们还初始化了一个新的度量，称为句子相似度。

大量的仿真结果表明，与不考虑语义信息交换的传统通信系统相比，该系统对信道变化具有更强的鲁棒性，能够在低信噪比下获得更好的性能。

介绍

基于shhannon和Weaver,通信有三个级别

1）符号的传播；

2）传输符号的语义交换；

3）语义信息交换的影响。

第一级通信主要关注符号从发射机成功传输到接收机，其中传输精度主要在比特或符号级别进行测量。
第二级通信处理从发送方发送的语义信息和在接收方解释的含义，称为语义通信。
第三级处理通信的影响，这些影响转化为接收器以发送器所期望的方式执行某些任务的能力。

在过去的几十年里，通信主要集中在如何准确有效地将符号（以比特为单位）从发射机传输到接收机。在这种系统中，误码率（BER：Bit Error Ratio）或SER（Symbol Error Ratio）表示误符号率。通常被视为性能指标。随着第一代（1G）到第五代（5G）的发展，实现的传输速率提高了数万倍，系统容量逐渐接近单端极限。

最近，各种新的应用出现了，例如自动运输、消费机器人、环境监测和远程健康。这些应用程序的互连将产生惊人的字节数量的数据。此外，这些应用程序需要在有限的频谱资源上支持大规模连接，但需要较低的延迟，这对传统的信源信道编码提出了严峻挑战。

语义通信可以通过提取数据的含义，过滤掉无用、无关和非本质的信息，从而在保留语义的同时进一步压缩数据，从而在语义域中处理数据。

此外，语义通信有望对恶劣的信道环境，即低信噪比（SNR）区域具有鲁棒性，这非常适合要求高可靠性的应用。这些因素促使我们通过考虑数字比特背后的语义来开发智能通信系统，以提高通信的准确性和效率。

与传统通信不同，语义通信旨在传输与传输目标相关的信息。例如，对于文本传输，意义因此是基本信息，而表达，即是单词的表达，是不必要的。通过这样做，数据流量将显著减少。在典型通信系统中，当带宽有限、信噪比较低或误码率/误码率较高时，这样的系统可能特别有用。

基于深度学习（DL）的自然语言处理（NLP）和通信系统的最新进展启发我们研究语义通信，以实现上述第二级通信。所考虑的语义通信系统主要关注联合语义信道编码和解码，其目的是提取和编码句子的语义信息，而不是简单地一个比特序列或一个单词。

「对于语义通信系统，我们面临以下问题：」

Question 1: 如何定义bits
Question 2:如何衡量句子的语义错误？
Question 3:如何联合设计语义和信道编码？

本文将NLP中的机器翻译技术应用到物理层通信中，研究语义通信系统。具体来说，我们提出了一个支持DL的语义通信系统（DeepSC）来应对上述挑战。

「本文的主要贡献总结如下：」

在Transformer的基础上，提出了一种新的DeepSC框架，该框架能够有效地从文本中提取语义信息，并且对噪声具有鲁棒性。在提出的DeepSC中，设计了一种联合语义信道编码来处理信道噪声和语义失真，解决了上述问题3。

DeepSC的收发器由语义编码器、信道编码器、信道解码器和语义解码器组成。为了在理解语义的同时最大限度地提高系统容量，采用两个损失函数对接收器进行优化：交叉熵和互信息。此外，本文还提出了一种新的度量标准，以准确反映DeepSC在语义层面的性能。这些解决了上述问题1和2。

为了使DeepSC适用于各种通信场景，采用深度迁移学习加速模型再训练。通过重新训练的模型，DeepSC可以识别各种知识输入，并从失真中恢复语义信息。

基于大量的仿真结果，提出的DeepSC在低信噪比下的性能优于传统的通信系统，提高了系统的鲁棒性。

DeepSC介绍

所考虑的系统模型包括两个层次：语义层次和传输层次，如图1所示。语义层处理用于编码和解码的语义信息，以提取语义信息。传输级别保证语义信息可以在传输介质上正确交换。

总体而言，我们考虑了一个具有随机物理信道的智能E2E通信系统，其中发射机和接收机具有一定的背景知识，即不同的训练数据。对于不同的应用场景，背景知识可能会有所不同。

定义1：语义噪音是信息交换中的一种干扰，由于信息传输中使用的词语、句子或符号的歧义，干扰了信息的解释。

定义2：物理信道噪声是由物理信道损伤引起的，如加性高斯白噪声（AWGN）、衰落信道和多径，从而导致信号衰减和失真。

如图1所示，发射器将句子s映射为复杂符号流x，然后将其通过具有传输损伤（例如失真和噪声）的物理信道。接收到的y在接收器处解码，以估计原始句子s。我们使用DNN联合设计发射器和接收器，因为DL使我们能够训练输入可变长度句子和不同语言的模型。

特别是，我们假设DeepSC的输入是一个句子 $s=[w1,w2,...,wL]$ ，其中wl代表句子中的第l个单词。如图1所示，Transmiter由两部分组成，即语义编码器和信道编码器，用于从s中提取语义信息，并保证语义信息在物理信道上的成功传输。编码的符号流可以用 $X=C_\alpha (S_\beta (S))$ , $S_\beta (\cdot )$ 是参数集为β的语义编码器网络， $C_\alpha (\cdot )$ 是参数集为α的信道编码器。为了简化分析，我们假设相干时间为M。如果发送x，接收器接收到的信号将为 $y=hx+n$ 如图1所示，接收机包括信道解码器和语义解码器，分别恢复发送的符号和随后发送的句子。解码后的信号可以表示为

该系统的目标是最大限度地减少语义错误同时减少要传输的符号数量。然而，我们在所考虑的体系中面临两个挑战。第一个挑战是如何设计联合语义信道编码。另一个是语义传递，这在传统的通信系统中没有被考虑。

即使现有的通信系统能够实现较低的误码率，但由于噪声和纠错能力的影响，一些比特可能会导致理解困难，因为整个句子的部分语义信息可能会丢失。

为了实现语义级的成功恢复，我们联合设计了语义和信道编码，以保持 $\hat s$ 和s之间的意义不变，这是由一个新的DNN框架实现的。

交叉熵（CE）被用作损失函数来测量s和 $\hat s$ 之间的差异，其公式如下：

性能指标

在E2E通信系统中，发送端和接收端通常以误码率作为训练目标，这有时会忽略通信的其他方面目标。对于文本传输，误码率不能很好地反映性能。

除了通过人工判断来确定句子之间的相似性外，机器翻译中通常使用双语评估研究（Bilingual Evaluation Understudy：BLEU）分数来衡量结果，这将作为本文的性能指标之一。

然而，BLEU分数只能比较两句话中单词之间的差异，而不能比较它们的语义信息。因此，我们初始化了一个新的度量，称为句子相似度，以根据两个句子的语义信息来描述它们的相似程度，这将在下文中介绍。这为问题2提供了一个解决方案。

对于长度为 $l_s$ 的传输句子s，长度为 $l_{\hat s}$ 的解码句子 $\hat s$ ，BLEU可以表示为

句子相似性：

一个词在不同的语境中可以有不同的含义。例如，老鼠在生物学和机器中的含义是不同的。传统的方法，如word2vec[25]，无法识别多义词，其中的问题是如何使用数字向量来表达单词，而数字向量在不同的上下文中有所不同。

根据语义相似度，我们建议计算原始句子s和恢复句子 $l_{\hat s}$ 之间的句子相似度，如下所示：

结果

提出的DeepSC与其他DNN算法以及AWGN信道和瑞利衰落信道下的传统信源编码和信道编码方法进行比较，其中我们假设所有方案都具有完美的CSI。在擦除信道和衰落信道以及不同的背景知识下，验证了迁移学习辅助的DeepSC。

对于相同的传输符号总数，BLEU分数与SNR的关系，64-QAM中使用RS（30,42）的哈夫曼编码，64-QAM中使用RS（42,54）的5位编码，64-QAM中使用Turbo编码的哈夫曼编码，128-QAM中使用Turbo编码的5位编码，8-QAM中使用Turbo编码的布罗特利编码；基于DNN的JSCC[22]在AWGN信道和瑞利衰落信道上训练，我们提出的DeepSC在AWGN信道和瑞利衰落信道上训练。

相同传输符号总数下的句子相似性与信噪比，使用64-QAM中的RS（30,42）霍夫曼编码；64-QAM中RS（42，54）的5位编码；哈夫曼编码与64-QAM中的Turbo编码；采用128-QAM的5位Turbo编码；Brotli编码与8-QAM中的Turbo编码；在AWGN信道和瑞利衰落信道上训练的E2E[22]；我们提出的DeepSC在AWGN信道和瑞利衰落信道上进行训练。