原文地址:https://www.cloudcrossing.xyz/post/50/
1 镜像
镜像是一种轻量级、可执行的独立软件包,用来打包 软件运行环境 和 基于运行环境开发的软件。它包含某个软件所需的所有内容,包括代码、运行时环境、库、环境变量和配置文件。
1.1 UnionFS(联合文件系统)
Union 文件系统(UnionFS)是一种分成、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下。Union 文件系统是 Docker 镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
就像一个榴莲千层一样 :)
特性:一次同时加载多个文件系统,但从外面只能看到一个文件系统。联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。
1.2 Docker镜像加载原理
Docker 的镜像实际上由一层一层的文件系统组成,这种层级的文件系统叫做 Union 文件系统(UnionFS)。
Union 文件系统的目录结构就像普通 linux 的目录结构一样,Docker 通过这些文件再加上宿主机的内核提供了一个 linux 的虚拟环境。每一层文件系统我们叫做一层 layer,联合文件系统可以对每一层文件系统设置三种权限,只读(readonly)、读写(readwrite)和写出(whiteout-able),但是 docker 镜像中每一层文件系统都是只读的。
从基本的看起,一个典型的 Linux 文件系统由 bootfs 和 rootfs 两部分组成。
bootfs(boot file system) 主要包含bootloader 和 kernel,bootloader 主要用于引导加载 kernel,当 kernel 被加载到内存中后 bootfs 会被 umount 掉。
rootfs (root file system) 包含的就是典型 Linux 系统中的/dev,/proc,/bin,/etc 等标准目录和文件。上图就是 Docker 镜像中最基础的两层结构,不同的 linux 发行版(如 ubuntu 和 CentOS ) 在 rootfs 这一层会有所区别,体现发行版本的差异性。
构建镜像的时候,从一个最基本的操作系统开始,每个构建的操作都相当于做一层的修改,增加了一层文件系统。一层层往上叠加,上层的修改会覆盖其底层的可见性。当你使用的时候,你只会看到一个完全的整体,你不知道里面有几层,也不清楚每一层所做的修改是什么。结构类似这样:
传统的 Linux 加载 bootfs 时会先将 rootfs 设为 read-only,然后在系统自检之后将 rootfs 从 read-only 改为 read-write,然后我们就可以在 rootfs 上进行读写操作了。
但 Docker 在 bootfs 自检完毕之后并不会把 rootfs 的 read-only 改为 read-write,而是利用 union mount(UnionFS 的一种挂载机制)将镜像中的其他的 layer 加载到之前的 read-only 的 rootfs 层之上,每一层 layer 都是 rootfs 的结构,并且是 read-only 的。
所以,我们是无法修改一个已有镜像里面的 layer 的!只有当我们创建一个容器,也就是将 Docker 镜像进行实例化,系统会分配一层空的 read-write 的 rootfs ,用于保存我们做的修改。一层 layer 所保存的修改是增量式的,就像 git 一样。
PS:容器启动时,一个新的可写成被加载到镜像的顶部。这一层通常被称为 “容器层” ,“容器层” 之下的都叫 “镜像层” 。
综上,镜像其实就是一个文件系统,它与宿主机的内核一起为程序提供一个虚拟的 linux 环境。在加载 Docker 镜像创建并启动 Docker 容器时,依据镜像,Docker 会为 容器 构建出一个虚拟的 linux 环境。
这也就是为什么 Docker 中的 centos 镜像才 200M 的原因,其精简了很多东西,只包含最基本的命令、工具和程序库,而底层直接用宿主机的的 kernel ,自己提供了 rootfs 。
分成的镜像
理论有点难理解,我们可以直接看回 centos7 。现在 pull 一个新的镜像,可以看到终端的输出,镜像是一层一层的下载的。
[root@localhost haha]# docker pull ubuntuUsing default tag: latest latest: Pulling from library/ubuntu c64513b74145: Pull complete 01b8b12bad90: Pull complete c5d85cf7a05f: Pull complete b6b268720157: Pull complete e12192999ff1: Pull complete Digest: sha256:3f119dc0737f57f704ebecac8a6d8477b0f6ca1ca0332c7ee1395ed2c6a82be7 Status: Downloaded newer image for ubuntu:latest
为什么 Docker 镜像要采用分层结构呢?
其中最大的好处就是 共享资源。其他相同环境的镜像都共同去享用同一个环境镜像,而不需要每个镜像要去创建一个底层环境。
比如:有多个镜像都从相同的 base 镜像构建而来,那么宿主机只需在磁盘上保存一份 base 镜像,同时内存中也只需加载一份 base 镜像,就可以为所有容器服务了。而且镜像的每一次都可以被共享。
2 Docker 容器数据卷
2.1 容器数据卷概述
Docker 容器产生的数据,如果不通过 docker commit 生成新的镜像,使得数据作为镜像的一部分保存下来,那么当容器删除后,数据自然也就没有了。那么如何在 Docker 容器中保证数据持久化呢?我们可以使用 Docker 容器数据卷。
PS: Docker 容器数据卷有点类似 Redis 里面的 rdb 和 aof 文件。
容器数据卷就是目录或文件,存在于一个或多个容器中,由 Docker 挂载到容器,但不属于联合文件系统,因此可以绕过联合文件系统提供一些用于持续存储或共享数据的特性。
其设计目的就是数据的持久化,完全独立于容器的生存周期,因此 Docker 不会在容器删除的时候删除其挂载的数据卷
特点:
1、数据卷可在容器之间共享或重用数据
2、数据卷中的更改可以直接生效
3、数据卷中的更改不会包含在镜像的更新中
4、数据卷的生命周期一直持续到没有容器使用它为止
2.2 添加容器数据卷
1、直接命令添加
docker run -it -v /宿主机绝对路径目录:/容器内目录 <镜像名>
docker run -it -v /宿主机绝对路径目录:/容器内目录:ro <镜像名> 表示禁止读写,只能查看,即read-only。
[root@localhost haha]# docker run -it -v /hosttest:/containertest centos[root@5cb2f21227a9 /]# lsbin containertest dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var [root@5cb2f21227a9 /]# [root@localhost haha]# [root@localhost haha]# cd ..[root@localhost home]# cd ..[root@localhost /]# lsbin boot dev etc home hosttest lib lib64 media mnt opt proc root run sbin srv sys tmp usr var [root@localhost /]#
我们在本地创建了一个 hosttest 文件夹,然后使用命令 docker run -it -v /hosttest:/containertest centos
创建并启动了 centos 容器。可以发现,在容器根目录下有一个我们指定与宿主机 hosttest 文件夹绑定的 container 文件夹。
接着使用命令 docker inspect
可以看到输出结果有下面这么一段,其表示将宿主机 hosttest 文件夹与容器中的 container 文件夹绑定起来了,并且读写权限为 true。
"Mounts": [ { "Type": "bind", "Source": "/hosttest", "Destination": "/containertest", "Mode": "", "RW": true, "Propagation": "rprivate" } ],
然后我们来试试是否真的挂载成功了,现在宿主机这边创建一个文件 test1.txt ,然后查看容器内是否有这个文件。
[root@localhost /]# cd hosttest[root@localhost hosttest]# lstest1.txt [root@localhost hosttest]# docker attach 5cb2f21227a9[root@5cb2f21227a9 /]# cd containertest[root@5cb2f21227a9 containertest]# lstest1.txt
结果是有的,说明我们挂载成功了。现在我们来试试,容器停止退出后,主机修改后数据是否同步。首先退出容器,然后创建一个新的文件 test_new.txt ,接着重启并进入容器查看是否有这个新文件。
[root@5cb2f21227a9 containertest]# lstest1.txt [root@5cb2f21227a9 containertest]# exitexit [root@localhost hosttest]# touch test_new.txt[root@localhost hosttest]# lstest1.txt test_new.txt [root@localhost hosttest]# docker psCONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES [root@localhost hosttest]# docker start 5cb2f21227a95cb2f21227a9 [root@localhost hosttest]# docker attach 5cb2f21227a9[root@5cb2f21227a9 /]# lsbin containertest dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var [root@5cb2f21227a9 /]# cd containertest[root@5cb2f21227a9 containertest]# lstest1.txt test_new.txt
以上输出结果说明,容器停止退出后,主机修改后数据是同步的。
2、Dockerfile 添加
这里先简单介绍 Dockerfile ,在【Docker学习笔记(三)】中我将会详细介绍 Dockerfile 。
(1)首先在根目录下新建 mydocker 文件夹并进入,然后创建一个文件 Dockerfile,并在 Dockerfile 中使用 VOLUME 指令给镜像添加一个或多个数据卷。
# volume testFROM centos VOLUME ["dataVolumeContainer1","dataVolumeContainer2"CMD echo "finished------------------success"CMD /bin/bash
第一句为注释
第二句定义了使用 centos 镜像作为基础镜像启动构建流程
第三句表示挂载的容器数据卷的文件夹名称
第四句输出指定字符串
第五句指定shell
(2)使用指定 Dockerfile build 生成镜像
[root@localhost mydocker]# docker build -f /mydocker/Dockerfile -t xyz/centos .Sending build context to Docker daemon 2.048kB Step 1/4 : FROM centos ---> 49f7960eb7e4 Step 2/4 : VOLUME ["dataVolumeContainer1","dataVolumeContainer2" ---> Running in ba37709e6097 Removing intermediate container ba37709e6097 ---> 8cd8f930eb1a Step 3/4 : CMD echo "finished------------------success" ---> Running in 3d05f7ec8ae9 Removing intermediate container 3d05f7ec8ae9 ---> d62062dc1b2f Step 4/4 : CMD /bin/bash ---> Running in f784a862da37 Removing intermediate container f784a862da37 ---> 5b762df8de53 Successfully built 5b762df8de53 Successfully tagged xyz/centos:latest [root@localhost mydocker]# docker imagesREPOSITORY TAG IMAGE ID CREATED SIZE xyz/centos latest 5b762df8de53 55 seconds ago 200MB ubuntu latest 735f80812f90 4 days ago 83.5MB nginx latest c82521676580 6 days ago 109MB tomcat latest 2d43521f2b1a 13 days ago 463MB centos latest 49f7960eb7e4 8 weeks ago 200MB
可以看到我们成功使用 Dockerfile 创建了一个镜像 xyz/centos。
(3)使用 镜像 xyz/centos 创建一个容器
[root@localhost mydocker]# docker run -it xyz/centos[root@2ade6afcbf0a /]# lltotal 0lrwxrwxrwx. 1 root root 7 May 31 18:02 bin -> usr/bin drwxr-xr-x. 2 root root 6 Jul 31 07:35 dataVolumeContainer1 drwxr-xr-x. 2 root root 6 Jul 31 07:35 dataVolumeContainer2 drwxr-xr-x. 5 root root 360 Jul 31 07:35 dev drwxr-xr-x. 1 root root 66 Jul 31 07:35 etc drwxr-xr-x. 2 root root 6 Apr 11 04:59 home ...
可以看到容器内指定的数据卷被创建了。
(4)查看主机对应默认地址
使用 docker inspect
查看容器内指定的数据卷对应的宿主机目录地址。
"Mounts": [ { "Type": "volume", "Name": "964dfe423c1074d1e2689e4f68f38766076fd808d94352aecdb87585fb515796", "Source": "/var/lib/docker/volumes/964dfe423c1074d1e2689e4f68f38766076fd808d94352aecdb87585fb515796/_data", "Destination": "dataVolumeContainer1", "Driver": "local", "Mode": "", "RW": true, "Propagation": "" }, { "Type": "volume", "Name": "320a381171241f0f4838face8e4bf390197573b62247fa293af7ed51ea002db0", "Source": "/var/lib/docker/volumes/320a381171241f0f4838face8e4bf390197573b62247fa293af7ed51ea002db0/_data", "Destination": "dataVolumeContainer2", "Driver": "local", "Mode": "", "RW": true, "Propagation": "" } ],
2.3 数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,但是它的目的是专门用来提供数据卷供其他容器挂载。
首先使用命令 docker run -it --name docker1 xyz/centos
创建一个容器 docker1 ,然后进入到 dataVolumeContainer1 里面新建一个文件 docker1.txt。然后将这个容器挂到后台。
[root@localhost mydocker]# docker run -it --name docker1 xyz/centos[root@5595f81fc0db /]# lsbin dataVolumeContainer1 dataVolumeContainer2 dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var [root@5595f81fc0db /]# cd dataVolumeContainer1[root@5595f81fc0db dataVolumeContainer1]# touch docker1.txt[root@5595f81fc0db dataVolumeContainer1]# [root@localhost mydocker]#
接着,使用命令 docker run -it --name docker2 --volumes-from docker1 xyz/centos
创建一个容器 docker2 ,并挂载 docker1 容器中的数据卷
[root@localhost mydocker]# docker run -it --name docker2 --volumes-from docker1 xyz/centos[root@abe10fe61dc8 /]# lsbin dataVolumeContainer1 dataVolumeContainer2 dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var [root@abe10fe61dc8 /]# cd dataVolumeContainer1[root@abe10fe61dc8 dataVolumeContainer1]# lsdocker1.txt [root@abe10fe61dc8 dataVolumeContainer1]#
这就是数据卷容器最基本的应用啦。也许会有人想问,我能不能再创建一个容器 docker3 挂载 docker1 呢?
当然可以。如果这样做了,就相当于有一个共享目录,连接着 docker1、docker2、docker3。
那这时候我删除了容器 docker1 的话,共享目录是不是会消失呢?
不会!因为数据容器卷的生命周期一直持续到没有容器使用它为止。