【005】基于深度学习的图像语 通信系统

news2024/11/23 13:24:04

摘要

语义通信是一种新颖的通信方式,可通过传输数据的语义信息提高带宽效率。提出一种用于无线图像传输的系统。该系统基于深度学习技术开发并以端到端(E2E)的方式进行训练。利用深度学习实现语义特征的提取和重建,在发送端提取信源信息不同类型和不同形式的语义特征,在接收端融合各类型语义特征进行目标语义恢复。仿真结果表明,与基准模型相比,所提模型在信道环境恶劣的情况下,具有更好的重建精度。

0. 引言

  1. 【22】一种基于深度学习的无线图像传输系统, 实 现基于E2E的JSCC,使用峰值信噪(PSNR) 和结构相似性指数 (SSIM)测量重建图像的质量。
  2. 【25】开展了物联网 (IoT) 设备用于图像传输的研究,通过将两个 DNN 的联合传输识别方案部署在设备端,在识别精度上比传统方案更好。
  3. 【26】提出了联合特征压缩和传输系统,以处理边缘服务器上有限的计算资源。该方案提高了E2E可靠性,降低了计算复杂度。
  4. **【28】**文献[28]提出了一种新的航空图像传输范式,在无人机端部署一个轻量级模型,用于感知图像和信道条件的语义传输模块,在接收端通过计算能力更强的基站对收到的信息进一步处理,提高分类精度。
  5. 【29】提出了基于深度学习的用于传输单模态和多模态数据的多用户语义通信系统,通过在编码器和解码器层之间添加连接来融合多模态数据,实现图像检索和视觉问答等功能。

1. 语义系统模型

在这里插入图片描述

1.1 编码器

组成:语义特征提取器、联合语义信道编码器
步骤:
(1)编码器的输入图像S由归一化层预处理,使得每个元素都在[0,1]范围内
(2)通过多个基于神经网络的多级语义特征提取器提取输入图像的不同语义特征
(3)利用联合语义信道编码器将语义特征编码为符号,通过物理通道传输到接收器,传输向量x:x = Tβ (Tα (S) ),Tα (⋅)为多级语义特征提取网络;Tβ (⋅)为联合语义信道编码器,网络参数为α,β。

1.2 解码器

组成:联合语义信道解码器、图像重建模块
步骤:
(1)联合语义信道解码器减轻信号在 AWGN 信道的噪声干扰,并恢复多级语义特征
(2)图像重建模块融合不同层次的语义信息并重建目标图像
(3)反归一化层将每个元素重新缩放为图像像素值 (0~255)。

目标:最小化输入图像S和重建图像 Ŝ之间的平均误差
评估语义失真:均方差 (MSE),,d(S,Ŝ) = 1/n ||S − Ŝ||^2为均方误差分布,N为样本数。
在这里插入图片描述

2. 多级图像语义通信模型

高级语义信息:图像的抽象性和通用性
低级语义信息:图像的局部细节语义信息
在这里插入图片描述

2.1 多级语义特征提取器

提取器包含三个模块:语义特征提取器、分割特征提取器、低级特征提取器

  • 不同模块分别提取不同层级和不同形式的图像语义信息
  1. 语义特征模块:包含一个预训练的图像字幕模型(ResNet-152模型+LSTM组成),用于提取图像文本形式的高级语义信息(文本嵌入信息)
  2. 分割特征模块:通过预训练的图像分割模型获取图像分割形式的高级语义信息
  3. 低级特征模块:主要用于图像细节特征的提取,为高级语义信息做细节补充,实现更丰富的信息重构
  • 联合部分:通过concatenate按通道维度将归一化图像和分割特征相结合,并输出
  • 直取部分:直接输入归一化后的图像特征

2.2 联合语义信道编解码

提取处理的特征包含:文本形式特征p,图像分割特征a、联合特征f、图像归一化低级特征

2.3 图像重建模块

(1)首先借助双特征融合模块对两种形式的高级语义特征进行融合
(2)通过像素上采样模块对特征信息升维
(3)将相同维度的高级语义信息和低级细节补充信息进行级联操作,通过残差网络对融合后的信息进行提取并重建目标图像
在这里插入图片描述
在这里插入图片描述

3. 仿真结果与分析

3.1 仿真参数

  1. **数据集:**MSCOCO、ADE20K
    语义特征模块:使用带有文本标签的MSCOCO数据集训练
    系统其余部分:使用带有分割标签的ADE20K数据集训练
    测试提出的图像无线通信系统:Kodak图像数据集
  2. AI模型:Pytorch, 使用Adam算法优化,学习率设置为 0.0001,批次大小设置为 32,下采样因子t = 8

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/751322.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【thinkpad电脑重装系统后双指滑动失效】

我的电脑在前段时间重装系统了,然后触控板一直用不了,但是平时用键盘比较多,没太在意,最近在宿舍,敲击键盘会影响室友睡觉,然后决心要弄好电脑触控板。 网上提及的方法很多,比如通过设备管理器…

利用MMSegmentation微调Mask2Former模型

前言 本文介绍了专用于语义分隔模型的python库mmsegmentation,github项目地址,运行环境为Kaggle notebook,GPU为P100针对环境配置、预训练模型推理、在西瓜数据集上微调新sota模型mask2former模型,数据说明由于西瓜数据集较小&am…

【从零开始学习JAVA | 第二十八篇】不可变集合

目录 目录 前言: 不可变集合: 常见的不可变集合: 1.创建list的不可变集合: 2.创建map的不可变集合: 应用场景: 总结: 前言: 本文我们将为大家介绍JAVA中的不可变集合&#x…

第四十七章Java枚举(enum)详解:Java声明枚举类型、枚举(enum)类、EnumMap 与 EnumSet

枚举是一个被命名的整型常数的集合,用于声明一组带标识符的常数。枚举在曰常生活中很常见,例如一个人的性别只能是“男”或者“女”,一周的星期只能是 7 天中的一个等。类似这种当一个变量有几种固定可能的取值时,就可以将它定义为…

今天实习第二天 ,vue

由于这是一次新的项目,有几个技术,docker,vue 老板要我学习vue。 这里我安装的是node.js,但是操作的时候用的是idea,因为vue插件集成在idea中。 01.vue的技术 vue是MVVM的履行者。 02.第一个vue程序 第一步&#xff1…

C基础day9(2023.7.11)

一、Xmind整理&#xff1a; 二、课上练习&#xff1a; 练习1&#xff1a;实现字符串逆置 #include <stdio.h> #include <string.h> #include <stdlib.h> int main(int argc, const char *argv[]) {char str[]"hello";char *pstr;char *qstrstrlen…

UE编辑器灯光颜色,能量传入Shader流程

编辑器界面&#xff1a; 代码流程&#xff1a; FLinearColor ULightComponent::GetColoredLightBrightness() const {// Brightness in Lumensfloat LightBrightness ComputeLightBrightness();FLinearColor Energy FLinearColor(LightColor) * LightBrightness;if (bUseTem…

数学建模-拟合算法

这里的线性函数指的是参数为线性&#xff0c;而不是变量为线性。 yabx^2是线性的 用的比较多的是多项式拟合和自己定义的 拓展资料&#xff1a;工具箱曲线拟合类型评价解释 文件-导出代码 自动生成的代码修改图名和标签 如果不收敛&#xff0c;自己要修改初始值&#xf…

ES 跨集群搜索 Cross-cluster search (CCS)

跨集群查询 跨集群搜索(cross-cluster search)使你可以针对一个或多个远程集群运行单个搜索请求。 例如&#xff0c;你可以使用跨集群搜索来筛选和分析存储在不同数据中心的集群中的日志数据。 环境准备 角色IP系统dev172.16.122.244CentOS 7.9prod172.16.122.245CentOS 7.9 ES…

记忆——记忆宫殿——地点桩

地点桩图片 室内物品放置方法——时钟放置法 https://www.zhihu.com/question/34549534 地点桩的扩展和记忆 我告诉你一个让记忆宫殿数量翻125倍的方法&#xff0c;以后用一个地点桩就扔一个。 这方法是我在背了几本书后才在偶然中发现的&#xff0c;我叫他“五行推演法”&a…

ES(1)简介和安装

文章目录 简介倒排索引 安装 简介 ES是面向文档型数据库&#xff0c;一条数据在这里就是一个文档。 和关系型数据库大致关系如下: ES7.x中废除掉Type&#xff08;表&#xff09;的概念 倒排索引 要知道什么是倒排索引&#xff0c;就要先知道什么是正排索引 idcontent100…

判断数组中所有元素是否均为True numpy.alltrue()

【小白从小学Python、C、Java】 【计算机等级考试500强双证书】 【Python-数据分析】 判断数组中所有元素是否均为True numpy.alltrue() [太阳]选择题 请问关于以下代码的说法错误的是&#xff1f; import numpy as np print(【执行】np.alltrue([True, True, True])) print(n…

C/C++图形库EasyX保姆级使用教程(四) 图片的展示与缩放

C/C图形库EasyX保姆级使用教程 第一章 Microsoft Visual Studio 2022和EasyX的下载及安装使用 第二章 图形化窗口设置以及简单图形的绘制 第三章 图形颜色的填充及相关应用 第四章 图片的展示与缩放 文章目录 C/C图形库EasyX保姆级使用教程前言一、图片的展示1.变量存储图片2.…

安全测试方法介绍(下)渗透测试

安全主要测试方法主要有&#xff1a;静态源代码审查&#xff0c;这个在编码阶段就可以进行&#xff0c;这个阶段如果出现问题&#xff0c;修复起来成本也比较低。程序发布之后可以进行渗透测试。前面的文章中我们为大家介绍了静态源代码审查的方法和策略&#xff0c;接下来本文…

【milvus】向量数据库,用来做以图搜图+人脸识别的特征向量

1. 安装milvus ref:https://milvus.io/docs 第一次装东西&#xff0c;要把遇到的问题和成功经验都记录下来。 1.Download the YAML file wget https://github.com/milvus-io/milvus/releases/download/v2.2.11/milvus-standalone-docker-compose.yml -O docker-compose.yml看…

微信小程序中常见组件的使用

文章目录 微信小程序中常见组件的使用视图组件viewscroll-viewswipermovable-area 基础组件icontextrich-textprogress 表单组件buttoncheckbox、checkbox-grouplabelforminputpicker单列选择器多列选择器时间选择器&日期选择器&地区选择器 picker-viewradiosliderswit…

人工智能-神经网络

目录 1 神经元 2 MP模型 3 激活函数 3.1 激活函数 3.2 激活函数作用 3.3 激活函数有多种 4、神经网络模型 1 神经元 神经元是主要由树突、轴突、突出组成&#xff0c;树突是从上面接收很多信号&#xff0c;经过轴突处理后传递给突触&#xff0c;突触会进行选择性向下一级的…

[项目实战] 使用Idea构建单页面Vue3项目(不使用node、npm)

前言 某天张三对小花说&#xff0c;我需要在一台新电脑上实现一个前端的漂亮页面&#xff1a;比如京东手机首页(m.jd.com)。 小花这时吭哧吭哧的去新电脑上安装nodejs、npm&#xff0c;然后在本地使用npm构建vue3项目&#xff0c;在项目里下载安装element-plus、axios。下一步…

常用异常检测算法总结与代码实现[统计学方法/K近邻/孤立森林/DBSCAN/LOF/混合高斯GMM/自编码器AutoEncoder等]

这篇博文主要是延续前文系列的总结记录&#xff0c;这里主要是总结汇总日常主流的异常检测算法相关知识内容。 &#xff08;1&#xff09;基于统计方法的异常值检测 基于统计方法的异常值检测是一种常用的异常检测算法&#xff0c;它基于样本数据的统计特性来识别与其他样本显…

【RS】ENVI5.6 栅格数据坐标转换

ENVI是一个完整的遥感图像处理平台&#xff0c;广泛应用于科研、环境保护、气象、农业、林业、地球科学、遥感工程、水利、海洋等领域。目前ENVI已成为遥感影像处理的必备软件&#xff0c;包含辐射定标、大气校正、镶嵌裁剪、分类识别、阈值分割等多种功能。ENVI针对绝大部分的…