END-TO-END、SCALE HYPERPRIOR、Checkerboard梳理总结

news2024/12/23 10:44:47

8.9-8.15学习汇报

阅读《END-TO-END OPTIMIZED IMAGE COMPRESSION》、《VARIATIONAL IMAGE COMPRESSION WITH A SCALE HYPERPRIOR》、《Checkerboard Context Model for Efficient Learned Image Compression》

传统的图像或视频压缩方法通常分为多个步骤,包括变换、量化、熵编码等。每个步骤都有其特定的算法和模块,并且这些步骤通常是独立的。

《END-TO-END OPTIMIZED IMAGE COMPRESSION》端到端压缩,通过一个统一的神经网络模型来实现整个压缩过程。网络模型通常由编码器和解码器组成。

如何训练的?

如何用得到的模型做编解码?

请添加图片描述

端到端压缩的一个潜在缺点是熵模型的简单性。例如均匀分布或固定概率分布。这种简化的熵模型往往无法充分捕捉不同位置的数据统计特征,导致压缩效率的降低。而我们知道图像是有区域性的,不同纹理、区域对应的概率分布差异较大。使用同样的熵模型很难消除空间冗余。

《VARIATIONAL IMAGE COMPRESSION WITH A SCALE HYPERPRIOR》超先验,它通过在熵模型之前引入额外的神经网络模型来提高熵模型的表达能力。

请添加图片描述

对潜在表示每一个点进行均值为0,方差为σ的高斯建模。

之前是对整体潜在特征进行建模,即一个熵模型在推理阶段应用在所有的特征值熵,而超先验架构为每个特征点都进行了熵模型建模。

后续LIC的两个思路:1.提出更好的熵模型2.改进出更强的变换网络

上下文模型,用先编码的符号来预测后编码的符号分布。但存在串行解码效率问题。

img

《Checkerboard Context Model for Efficient Learned Image Compression》棋盘上下文模型。
请添加图片描述

  1. 随机掩码模型的玩具实验,实验结果表明:参考的特征数量与码率的节省效果不是强相关的。但使用距离解码特征更近的特征将节省更多的码率。

  2. 于是就设计了棋盘格模型,经随机掩码模型测试,节省的码率比之前的自回归要好,但是有新的问题,即双向引用。

  3. 因此就把这个上下文模型用在一半特征,另一半只用超先验。

请添加图片描述
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/877341.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

android设置竖屏仍然跟随屏幕旋转怎么办

如题所问,我最近遇到一个bug,就是设置了摇感,然后有用户反馈说设置了手机下拉的系统设置-屏幕旋转-关闭。然后屏幕还是会旋转的问题。 首先,我们先从如何设置横竖屏了解下好了 设置横屏和竖屏的方法: 方法一&#x…

IPv6项目开发测试记录

一、环境 1、网口 IPv6地址 fd00:0:0:1::15 子网前缀长度 64 网关地址(非必须) fd00:0:0:1::1 二、云环境、面板机连云测试 1、面板机设置IPv4地址后可以访问fd00::100这个地址 2、初始化时候服务器地址输入匹配正则式:IPv6地址匹配正则…

基因型比值比(genotypic odds ratio)和等位基因比值比(allelic odds ratio)的计算

基因型比值比(genotypic odds ratio)和等位基因比值比(allelic odds ratio)是两个不同的概念。一般而言,通过PLINK、GCTA等工具计算得到的比值比指的是等位基因比值比。 以下是基因型比值比和等位基因比值比的各自计算…

8月12日上课内容 综合配置详解 四层+七层代理

后续内容概述: Ivs集群: keepalive:vip实现代理高可用 NAT VPN DR (DR最常用) 数据库:增制改查 备份 高可用 主从复制 读写分离 DBA 市场量小,从业者不多,工资一般般。 中间件: redis.* 分布式存储: ELK日志分析。kafka消息队列 监控zabb…

知识分享:如何将一张图片转换成短链接?

今天我们要分享的知识是:如何将一张图片转换成链接? 之前我们有介绍过在二维彩虹将图片转换成二维码的方法,那么其实将图片转成链接也非常简单!在做电商运营创建商品详情页面、作家为在线小说设置封面图、产品运营、策划活动等等…

IDC报告深度解读:2023年CRM发展趋势分析

近期,国际数据公司(IDC)发布了2022年下半年《中国客户关系管理(CRM)SaaS市场跟踪研究报告》,根据报告显示,2022年下半年中国CRM SaaS市场规模达到 11.6 亿美金,同比增长25.4%,CRM占中国整体SaaS…

SpringCloud初识

微服务架构4个核心问题: 这四个问题围绕这我们去学的一些东西,是重点!!! 1.服务很多,客户端该如何访问? 2.这么多服务,服务之间该如何通信? 3.这么多服务,该如何治理? 4.服务挂了…

Python 基础语法 | 常量表达式,变量,注释,输入输出

常量和表达式 我们可以把 Python 当成一个计算器,来进行一些算术运算 print(1 2 - 3) # 0 print(1 2 * 3) # 7 print(1 2 / 3) # 1.6666666666666665注意: print 是一个 Python 内置的 函数可以使用 - * / () 等运算符进行算术运算,先…

postman接口测试工具的常规使用

postman接口测试工具简介与安装 Postman简介: Postman是一款功能强大的网页调试与发送网页HTTP请求的Chrome插件。 它提供功能强大的Web API&HTTP请求调试。它能够发送任何类型的HTTP请求(GET,HEAD,POST,PUT..&a…

04-基础入门-WEB源码拓展

基础入门-WEB源码拓展 1、WEB源码拓展(1)关于web源码目录结构(2)关于 WEB 源码脚本类型(3)关于 WEB 源码应用分类 2、演示案例(1)asp、php等源码测试(2)平台识…

我们常说这个pycharm里有陷阱,第三方库导入失败,看这里!

最近有小伙伴遇到了明明安装了 python 第三方库,但是在 pycharm 当中却导入不成功的问题。 ​ 一直以来,也有不少初学 python 的小伙伴,一不小心就跳进了虚拟环境和系统环境的【陷阱】中。 本文就基于此问题,来说说在 pycharm 当…

【leetcode】【图解】617. 合并二叉树

题目 难度:简单 给你两棵二叉树: root1 和 root2 。 想象一下,当你将其中一棵覆盖到另一棵之上时,两棵树上的一些节点将会重叠(而另一些不会)。你需要将这两棵树合并成一棵新二叉树。合并的规则是&#xf…

基于DBN的伪测量配电网状态估计,DBN的详细原理

目录 背影 DBN神经网络的原理 DBN神经网络的定义 受限玻尔兹曼机(RBM) DBN的伪测量配电网状态估计 基本结构 主要参数 数据 MATALB代码 结果图 展望 背影 DBN是一种深度学习神经网络,拥有提取特征,非监督学习的能力,是一种非常好的分类算法,本文将DBN算法伪测量配电网…

leetcode 1171.从链表中删去总和值为零的连续节点

⭐️ 题目描述 🌟 leetcode链接:从链表中删去总和值为零的连续节点 思路: 在链表的 head 前新增加一个哨兵卫的头结点,方便计算前缀和。遍历链表,依次把每个节点的 val 相加到 sum 中去,再判断 sum 0 依…

网络编程(8.14)TCP并发服务器模型

作业: 1. 多线程中的newfd,能否修改成全局,不行,为什么? 2. 多线程中分支线程的newfd能否不另存,直接用指针间接访问主线程中的newfd,不行,为什么? 多线程并发服务器模型原代码&…

认识Transformer:入门知识

视频链接: https://www.youtube.com/watch?vugWDIIOHtPA&listPLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index60 文章目录 Self-Attention layerMulti-head self-attentionPositional encodingSeq2Seq with AttentionTransformerUniversal Transformer Seq2Seq …

排查docker无法启动问题

查看Linux系统操作日志(最后200行就可以排查): tail -200f /var/log/messages

什么是证券股票交易接口?(股票交易挂单接口)源码开发步骤

证券股票交易接口是一种可以实现证券交易功能的软件接口,它提供了一组用于交易的函数或方法,可以通过调用这些接口来执行买卖股票、查询账户信息、获取市场行情等操作。证券股票交易接口可以连接到证券交易所或证券公司的交易系统,允许用户通…

SpringBoot基于Zookeeper实现分布式锁

文章目录 问题背景前言实现搭建Zookeeper容器引入依赖ZK客户端的配置类ZK客户端的工厂类注入bean构建测试类 问题背景 研究分布式锁,基于ZK实现,需要整合到SpringBoot使用 前言 参考自SpringBoot集成Curator实现Zookeeper基本操作,Zookeeper入…

d3dx9_37.dll如何修复,d3dx9_37.dll丢失的4种解决方法分享

d3dx9_37.dll是DirectX中的一个动态链接库文件,它包含了一些用于游戏和图形应用程序的函数和资源。当你在运行一个需要使用DirectX的程序时,如果系统中缺少d3dx9_37.dll文件或该文件损坏,就会导致程序无法正常运行。 以下是解决d3dx9_37.dll问…