容器镜像的设计原理

news2025/1/18 14:49:33

1 概述:

1.1 历史概要

2016年,Docker制定了镜像规范v2,并在Docker 1.10中实现了这个规范。镜像规范v2分为Schema 1和Schema 2。
Schema 1主要兼容使用v1规范的Docker客户端(从2017年2月起,镜像规范v1不再被Registry支持),如Docker 1.9及之前的客户端。
Schema 2主要实现了两个功能:支持多体系架构的镜像和可通过内容寻址的镜像,其中最大的改进就是根据内容的SHA256摘要生成ID,只要内容相同,ID就是一样的,可用于区分相同的层文件(即可内容寻址)。
OCI在2017年7月发布了OCI镜像规范1.0。因为Docker v2的镜像规范已经成为事实上的标准,OCI镜像规范实质上是以Docker镜像规范v2为基础制定的,因此二者在绝大多数情况下是兼容或相似的。如Docker镜像规范中的镜像索引(imageindex)和OCI镜像规范中的清单索引(manifest index)是等价的。


1.2 OCI规范概要

OCI镜像规范是以Docker镜像规范v2为基础制定的,它定义了镜像的主要格式及内容,此规范主要用于镜像仓库服务存放镜像、分发镜像等场景。

OCI 定义的镜像包括4个部分:
a、镜像索引(Image Index)
镜像索引不是必需的,如果存在,则指明了一组支持不同架构平台的相关镜像(例如arm和amd,linux和windows)。用户无须指定操作系统和平台,就可完全依赖客户端获取正确版本的镜像。
b、清单(Manifest)
清单是JSON格式的描述文件,列出了镜像的配置和层文件。
c、配置(Configuration)
配置是JSON格式的描述文件,说明了镜像运行的参数。在本地,配置的摘要是作为本地镜像的标识。
d、层文件(Layers)
层文件则是镜像的内容,即镜像包含的文件,一般是二进制数据文件格式(Blob)。一个镜像可以有一个或多个层文件。

镜像的4个部分之间是通过摘要(digest)来相互引用(reference)的。镜像各部分的关系如图1-13所示。
在这里插入图片描述


1.3 镜像存储思想概要

镜像存储的本质还是分层存储,但是本地存储和远程镜像仓库的存储,是不完全一样的。
远程镜像仓库存储的镜像是压缩文件,问什么?
远程镜像仓库存储的核心是方便镜像快速分发(上传和拉取)和大量存储,所以在实现上是,依据镜像层来独立[ 压缩 ]和存储,然后使用镜像清单(manifest)包含所有的层,通过镜像摘要(digest)和Tag关联起来。从下图的registry服务的数据目录中可见,镜像层确实是压缩文件。
在这里插入图片描述
远程镜像仓库存储的镜像是源文件(非压缩),问什么?
镜像在本地存储的核心是快速加载和启动容器,容器在启动时需要将镜像层按照顺序堆叠作为容器的运行环境,并且本地不需要大量存储所有镜像(用什么就存储什么),因此镜像在本地存储中使用非压缩形式存放更利于启动容器。


2 镜像细节

2.1 远程存储的镜像

在镜像仓库上存储容器镜像的简化结构如图1-11所示,主要由三部分组成:清单文件(manifest)、镜像文件(configuration)和层文件(layers)。在镜像清单文件(manifest)中存放了配置文件(configuration)的摘要和层文件(layers)的摘要,这些摘要(或者叫哈希值、指纹等等)都是通过文件内容计算而来的(因此叫作内容寻址)。
镜像摘要是依据镜像清单文件的内容计算SHA256哈希值而来的。镜像摘要不是镜像ID。镜像摘要可取代tag来在registry中搜索特定的镜像,因为tag最终要映射到一个镜像摘要。
内容寻址的好处是,除了可以唯一标识不同的文件,还可以在传输过程中通过摘要做文件校验。在文件下载完成后,计算所下载文件的摘要值,然后与下载时的摘要标识进行对比,如果二者一致,即可判断下载的文件是正确的。需要指出的是,由于文件在镜像仓库端是以压缩形式存放的,所以摘要值也是基于压缩文件计算而来的。
在这里插入图片描述


2.2 本地存储的镜像

在本地存储中,使用配置文件的摘要作为本地镜像的标识,主要是因为本地镜像存放的文件都是非压缩的文件,而镜像仓库存放的是压缩文件,因此层文件在本地和镜像仓库中有不同的摘要值。因为压缩文件的内容会受到压缩算法等因素的影响,所以同样内容的层无法保证压缩后摘要的唯一性,而镜像清单文件包含压缩层文件的摘要,因此通过镜像清单文件的摘要(即镜像摘要)无法在本地确定镜像的唯一性。配置文件则不同,其中包含的层信息是未压缩的摘要值,因此相同镜像的各层内容必然相同,配置文件的摘要值是唯一确定的,因此可以作为本地镜像的标志。


2.3 拉取镜像的主要过程

(1)向镜像仓库请求镜像的[ 清单文件manifest ]。
(2)获取镜像ID,查看镜像ID是否在本地存在。
(3)若不存在,则下载[ 配置文件config ](config文件中含有每个未压缩层文件的摘要DIFF_ID)。
(4)检查层文件是否在本地存在,若不存在,则从镜像仓库中拉取每一层的[ 压缩文件 ]。
(5)拉取层时,使用镜像清单中[ 压缩层文件的摘要 ]作为内容寻址下载。
(6)下载完一层的文件后,解压并按照摘要校验。
(7)当所有层文件都拉取完毕时,镜像就下载完成了。


2.4 镜像索引

OCI镜像索引支持不同的操作系统及体系结构平台,其核心思想是将在不同操作系统中生成的[ 一组镜像 ]合并为[ 一个镜像索引 ]存储在镜像仓库服务中,如此一来,客户端无须关心具体操作系统的类型而使用统一的镜像名称来拉取镜像。以DockerHub中的Redis镜像索引为例,客户端程序可以在不同的操作系统平台上执行[ docker pull redis ]命令拉取Redis镜像,无须在命令中显式指定镜像的操作系统。

镜像索引怎么在镜像仓库服务中创建呢?不使用buildx的手工推送多arch镜像的一个例子如下:
在这里插入图片描述
在这里插入图片描述


3 小结

镜像在远程仓库和在本地,存储方式有些许不同,因为情景不一样。镜像索引是将多个CPU架构的镜像组成看起的"一个"。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/422764.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

云计算基础——云服务

目录 云服务概述 云服务简介 云服务的产生和发展 云服务产生的前提: 接入云端的主要前端工具: 云服务的优缺点 优点 缺点 云服务的类型 SaaS PaaS IaaS 云部署模型 云服务概述 云服务简介 云计算通过使计算分布在大量的分布式计算机上&…

在线旅游变局:新老玩家的攻与防、危与机

配图来自Canva可画 五一小长假未到,大学生、职场人就早早制定了旅游路线,准备了旅游装备,还预订了机票和酒店。这边消费者们旅游之心急不可待,那边各地文旅局发布旅游消费券、完善旅游设施配套、花式宣传本地特色,使浑…

城市轨道交通列车时刻表优化问题【最优题解】

文章目录城市轨道交通列车时刻表优化问题思路文章底部城市轨道交通列车时刻表优化问题 最新进度在文章最下方卡片,加入获取思路数据代码论文:2023十三届MathorCup交流 (第一时间在CSDN分享,文章底部) 题目为数据分析类题目。列车时刻表优化…

基于.Net开源Html解析器,此外还支持SVG、XML等格式

今天给大家推荐一个Html解析器,可以用于网络爬虫Html源码的解析、Html源码编辑等场景。 项目简介 这是一个基于.Net开发的,Html代码解析器,支持通过C#实现类似Jquery的方式来解析Html源码、节点创建、节点删除、节点修改、属性的添加修改等&…

【算法与数据结构】3 知行合一,线性查找的自定义类测试

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 本文收录于算法与数据结构体系专栏,本专栏对于0基础者极为友好,欢迎与我一起完成算法与数据结构的从0到1的跨越 线性查找的测试应用1.前言2.使用自定义类测试2.1⛏创建Student类并测…

记录一下verilog重复例化的两种方式

文章目录0 前言1 for循环方式例化方法2 数组的方式例化4 一些其他的技巧0 前言 这段时间例化了挺多mem,过程中也了解到了一些新的东西,在这里记录一下 1 for循环方式例化方法 先给出 sub_module module sub(input [7:0] din,output logic [7:0] dout…

手撕深度学习中的损失函数(上)

面试中经常会问到损失函数的相关问题,本文推导了深度学习中常用损失函数的计算公式和反向传播公式,并使用numpy实现。 定义损失函数基类: class Loss:def loss(self, predictions, targets):raise NotImplementedErrordef grad(self, predic…

SQL Server数据库-----基础知识

数据库基础数据类型 整数类型 int 范围 2的正负31次方 小数类型 decimal 范围 正负10的38次方,不包含两端的 固定长度的非Unicode字符 char 可变长度的非Unicode字符 varchar 如varchar(20)是最多可以有20个字符,-12-3 可变长度的Unicode字符 nvar…

xmind免费安装使用教程

一、简介 xmind 是一款功能强大的思维导图和脑图制作工具,它可以帮助用户将复杂的信息和想法以图形化的方式进行组织和展示,使得思维更加清晰和有条理。xmind 是一款跨平台的思维导图软件,支持 Windows、MacOS 和 Linux 系统。它提供了丰富的…

pytorch进阶学习(八):使用训练好的神经网络模型进行图片预测

课程资源: 【小学生都会的Pytorch】九、运用你的模型做预测(1)_哔哩哔哩_bilibili 笔记: pytorch进阶学习(四):使用不同分类模型进行数据训练(alexnet、resnet、vgg等&#xff09…

免费远程桌面连接工具合集

随着科技的进步和通信技术的发展,远程办公变得越来越普遍。这种办公模式有助于提高工作效率,对于员工来说很友好的是,上班变得更加灵活了。 今天就给大家推荐几款远程桌面连接工具,不仅可以电脑连接,手机也可以直接连…

读写分离导致读不到刚插入的数据

背景 前两天在做一个功能的时候,需要先插表,如果数据重复则从数据库中查询出这条数据,这段代码在测试环境并没有什么问题,但是到生产之后就会偶现的报一些错,就是读不到已插入的数据,导致后续业务出现问题…

超详细Django+vue+vscode前后端分离搭建

文章目录一、Django后端搭建1.1 创建项目和app1.2 注册app1.3 运行项目1.4 配置mysql数据库1.5 创建数据库类1.6 使用Django后台进行数据管理2、Django rest framework配置2.1 序列化2.2 添加视图2.3 添加路由2.4 在项目根目录下的urls中加入如下代码2.5 api测试2.6 筛选和搜索…

BGP协议解析(白话版)

之前一直没搞明白BGP有啥用,加了跟没加没啥区别,专门查资料写了这篇《BGP协议解析》。 下面使用eNSP模拟器演示! IBGP与EBGP的区别 BGP分为两种:IBGP与EBGP。 两个路由器的BGP号相同,建立邻居关系叫IBGP&#xff0…

树莓派连接串口时无法开机

树莓派连接串口时无法开机我的情况我的思考我的解决过程重点参考我的情况 因为项目需要,因此需要使用树莓派控制电机,而电机是一上电就会给树莓派发送数据,而这时树莓派还正处于开机时,结果就是开机失败。当将串口断开时就又可以…

PHP快速入门05-时间日期与时区,附30个常用案例

文章目录前言一、时间日期与时区1.1 时间与日期1.2 时区二、 30个日期时间函数的用法示例2.1 获取当前的时间戳2.2 将时间戳格式化为日期时间2.3 获取当前的日期2.4 获取当前的时间2.5 获取当前年份2.6 获取当前月份2.7 获取当前日期的第几天2.8 计算两个日期之间的天数差2.9 计…

央媒报道的长与短

传媒如春雨,润物细无声,大家好,我是51媒体 胡老师。 在最近的媒体服务中,遇到一个问题,与大家讨论下,很多媒体特别是央媒,在活动报道中不会完全按照新闻稿通稿的内容去报道,有的会根…

MQ选型,kafka、RocketMQ、RabbitMQ、ActiveMQ

MQ(Message Queue),是基础数据结构中“先进先出”的一种数据结构。指把要传输的数据(消息)放在队列中,用队列机制来实现消息传递——生产者产生消息并把消息放入队列,然后由消费者去处理。消费者…

java SimpleDateFormat和Calendar日期类

目录一、SimpleDateFormat使用二、Calendar使用一、SimpleDateFormat使用 使用Date直接输出日期时,是使用系统默认的格式输出,所以需要使用SimpleDateFormat来格式化日期。 那么SimpleDateFormat类怎么使用呢,我们需要先了解此类的格式化符号…

Codeforces Round 866 (Div. 2) 题解

目录 A. Yuras New Name(构造) 思路: 代码: B. JoJos Incredible Adventures(构造) 思路: 代码: C. Constructive Problem(思维) 思路: 代…