docker数据存储
- 概述
- 数据卷(Volumes)
- 特点
- 操作
- 绑定挂载(Bind Mounts)
- 内存挂载(tmpfs)
- 总结
概述
镜像构建过程中,所产生的layer都是只读层,只有在创建容器时才会生成一个可写的容器层(contatner layer)。如下图:
在默认情况下,容器内部创建的所有文件都存储在可写层中。这导致:
- 获取容器中的数据比较麻烦,而且在删除容器后,数据也就丢失了;
- 写入容器可写层需要存储驱动程序,这会比直接使用数据卷来写入宿主机文件系统的性能略差。
为了解决这些问题,Docker 提供了数据卷(Volumes) 、 绑定挂载(Bind Mounts)和内存挂载(tmpfs) 三种数据存储方式,无论选择哪种挂载类型,从容器内部来看,数据都是以目录或文件的形式暴露在容器的文件系统中。
数据卷(Volumes)
数据卷是Docker 中持久化数据的最佳、推荐方式。数据卷由Docker创建和管理,数据存储在由 Docker 管理的主机文件系统的一部分中(例如在 Linux 上的 /var/lib/docker/volumes/),非 Docker 进程不应修改此部分的文件系统;数据卷分为匿名卷、命名卷、卷驱动程序,通过docker volume create命令创建或者在创建容器时自动创建。
特点
相比与绑定挂载,数据卷由 Docker 完全管理,具备以下优势:
- 备份和迁移方便:Volumes 相比于绑定挂载更容易备份或迁移;
- 跨平台兼容:Volumes 可以在 Linux 和 Windows 容器上使用;
- 安全共享:多个容器可以更安全地共享 Volumes;
- 远程存储支持:通过 Volume 驱动,Volumes 可以存储在远程主机或云提供商上,并且支持加密等功能;
- 高性能:在 Docker Desktop 中,Volumes 的性能远高于 Mac 和 Windows 主机上的绑定挂载;
- 独立于容器生命周期:Volume 的内容独立于容器的生命周期,不会随着容器的删除而消失。
操作
1.常用命令
## 创建一个新的 Volume
docker volume create my-vol
## 列出 Volumes
docker volume ls
## 检查 Volume
docker volume inspect my-vol
## 删除 Volume
docker volume rm my-vol
2.容器操作
启动容器:指定 -v 或 --mount 使用数据卷
## 命名卷
docker run -d --name devtest --mount source=my-vol,target=/app nginx:latest
## 匿名卷
docker run -d --name devtest --mount target=/app nginx:latest
清理容器和 Volume:
docker container stop devtest
docker container rm devtest
docker volume rm my-vol
**备份、恢复和迁移 Volumes**
使用 --volumes-from 参数,你可以创建一个新容器来挂载现有的 Volume,并进行数据备份、恢复或迁移。
```bash
## 备份 Volume
docker run --rm --volumes-from dbstore -v $(pwd):/backup ubuntu tar cvf /backup/backup.tar /dbdata
## 恢复 Volume
docker run --rm --volumes-from dbstore2 -v $(pwd):/backup ubuntu bash -c "cd /dbdata && tar xvf /backup/backup.tar --strip 1"
移除 Volumes
Docker 数据 Volume 在容器删除后仍会保留。你可以使用 docker volume prune 命令来移除所有未使用的 Volumes,以释放存储空间。
docker volume prune
绑定挂载(Bind Mounts)
绑定挂载是将宿主机上任意的一个文件或目录挂载到容器中(宿主机上的文件或目录会直接映射到容器中)。虽然绑定挂载速度快,但它依赖于主机文件系统的目录结构。通常情况下,建议使用命名卷代替绑定挂载。
绑定挂载命令其实和数据卷一样,差别就在于源路径是宿主机地文件路径,而非数据卷;可以使用-v 或者–mount;
## 启动容器时挂载
docker run -d \
-it \
--name devtest \
--mount type=bind,source=/opt/target,target=/app \
nginx:latest
内存挂载(tmpfs)
tmpfs 挂载不在磁盘上持久化数据,数据仅在容器生命周期内有效。适用于不希望数据持久化的情况,如存储敏感信息或需要高性能 I/O 的场景。
总结
其实不管是数据券、绑定挂件、还是tmpfs都可以使用–mount,type选择指定的类型即可。
这篇文章写得简单了点,主要是介绍容器在启动时会创建一个可写层,并且所有的数据都是在可写层操作;想要数据持久化到宿主机,可以选择数据卷、绑定挂载的方式实现;数据卷、绑定挂载、内存挂载的操作命令只需要记住一条命令即可:
root docker run -d --name my-nginx --mount type=bind,source=/opt/bind-dir,dst=/app nginx:latest
区别在于type和source属性。