Docker 镜像的创建

创建镜像有三种方法：

基于已有镜像创建
基于本地模板创建
基于Dockerfile创建

1．基于现有镜像创建

（1）首先启动一个镜像，在容器里做修改 
docker create -it centos:7 /bin/bash

docker ps -a
CONTAINER ID   IMAGE      COMMAND       CREATED         STATUS    PORTS     NAMES
6df361c3fb5d   centos:7   "/bin/bash"   3 seconds ago   Created             brave_hamilton

（2）然后将修改后的容器提交为新的镜像，需要使用该容器的 ID 号创建新镜像
docker commit -m "new" -a "centos" 6df361c3fb5d centos:test
#常用选项： 
-m 说明信息
-a 作者信息
-p 生成过程中停止容器的运行

docker images
#查看镜像

2．基于本地模板创建

通过导入操作系统模板文件可以生成镜像，模板可以从 OPENVZ 开源项目下载，下载地址为<http://openvz.org/Download/template/precreated>

wget <http://download.openvz.org/template/precreated/debian-7.0-x86-minimal.tar.gz>

#导入为镜像 
cat debian-7.0-x86-minimal.tar.gz | docker import - debian:test

3．基于Dockerfile 创建

联合文件系统（UnionFS）

UnionFS(联合文件系统）：Union文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统，它支持对文件系统的修改作为一次提交来一层层的叠加，同时可以将不同目录挂载到同一个虚拟文件系统下。AUFS、OverlayFS 及 Devicemapper 都是一种 UnionFS。

Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承，基于基础镜像（没有父镜像），可以制作各种具体的应用镜像。

我们下载的时候看到的一层层的就是联合文件系统。

特性：一次同时加载多个文件系统，但从外面看起来，只能看到一个文件系统，联合加载会把各层文件系统叠加起来，这样最终的文件系统会包含所有底层的文件和目录。

镜像加载原理

Docker的镜像实际上由一层一层的文件系统组成，这种层级的文件系统就是UnionFS。

bootfs主要包含bootloader和kernel，bootloader主要是引导加载kernel，Linux刚启动时会加载bootfs文件系统。

在Docker镜像的最底层是bootfs，这一层与我们典型的Linux/Unix系统是一样的，包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了，此时内存的使用权已由bootfs转交给内核，此时系统也会卸载bootfs。

rootfs，在bootfs之上。包含的就是典型Linux系统中的/dev,/proc,/bin,/etc等标准目录和文件。rootfs就是各种不同的操作系统发行版，比如Ubuntu,Centos等等。

我们可以理解成一开始内核里什么都没有，操作一个命令下载debian，这时就会在内核上面加了一层基础镜像；再安装一个emacs，会在基础镜像上叠加一层image；接着再安装一个apache，又会在images上面再叠加一层image。最后它们看起来就像一个文件系统即容器的rootfs。在Docker的体系里把这些rootfs叫做Docker的镜像。但是，此时的每一层rootfs都是read-only的，我们此时还不能对其进行操作。当我们创建一个容器，也就是将Docker镜像进行实例化，系统会在一层或是多层read-only的rootfs之上分配一层空的read-write的rootfs。

为什么Docker里的centos的大小才200M？

因为对于精简的OS，rootfs可以很小，只需要包含最基本的命令、工具和程序库就可以了，因为底层直接用宿主机的kernel，自己只需要提供rootfs就可以了。由此可见对于不同的linux发行版，bootfs基本是一致的，rootfs会有差别，因此不同的发行版可以公用bootfs。

Dockerfile

Docker镜像是一个特殊的文件系统，除了提供容器运行时所需的程序、库、资源、配置等文件外，还包含了一些为运行时准备的一些配置参数（如匿名卷、环境变量、用户等）。镜像不包含任何动态数据，其内容在构建之后也不会被改变。

镜像的定制实际上就是定制每一层所添加的配置、文件。如果我们可以把每一层修改、安装、构建、操作的命令都写入一个脚本，用这个脚本来构建、定制镜像，那么镜像构建透明性的问题、体积的问题就都会解决。这个脚本就是 Dockerfile。

Dockerfile是一个文本文件，其内包含了一条条的指令(Instruction)，每一条指令构建一层，因此每一条指令的内容，就是描述该层应当如何构建。有了Dockerfile，当我们需要定制自己额外的需求时，只需在Dockerfile上添加或者修改指令，重新生成 image 即可，省去了敲命令的麻烦。

除了手动生成Docker镜像之外，可以使用Dockerfile自动生成镜像。Dockerfile是由多条的指令组成的文件，其中每条指令对应 Linux 中的一条命令，Docker 程序将读取Dockerfile 中的指令生成指定镜像。

Dockerfile结构

大致分为四个部分：

基础镜像信息
维护者信息
镜像操作指令
容器启动时执行指令。

Dockerfile每行支持一条指令，每条指令可携带多个参数，支持使用以“#“号开头的注释。

Docker 镜像结构的分层

镜像不是一个单一的文件，而是有多层构成。容器其实是在镜像的最上面加了一层读写层，在运行容器里做的任何文件改动，都会写到这个读写层。如果删除了容器，也就删除了其最上面的读写层，文件改动也就丢失了。 Docker使用存储驱动管理镜像每层内容及可读写层的容器层。

Dockerfile 中的每个指令都会创建一个新的镜像层；
镜像层将被缓存和复用；
当Dockerfile 的指令修改了，复制的文件变化了，或者构建镜像时指定的变量不同了，对应的镜像层缓存就会失效；
某一层的镜像缓存失效，它之后的镜像层缓存都会失效；
镜像层是不可变的，如果在某一层中添加一个文件，然后在下一层中删除它，则镜像中依然会包含该文件，只是这个文件在 Docker 容器中不可见了。

bootfs： bootfs加载器+内核，容器都是共享内核的，所以都有相同的bootfs。

rootfs只读层： rootfs可以有多层，对外表现看起来就是一个整体。

使用镜像运行一个容器实例时，就会在rootfs只读层上挂载一层可读可写层。

Dockerfile 操作常用的指令：

Dockerﬁle简介：

Dockerﬁle其实就是我们用来构建Docker镜像的源码，当然这不是所谓的编程源码，而是一些命令的组合，只要理解它的逻辑和语法格式，就可以编写Dockerﬁle了。

简单点说，Dockerﬁle的作用：它可以让用户个性化定制Docker镜像。因为工作环境中的需求各式各样，网络上的镜像很难满足实际的需求。

（1）FROM 镜像

指定新镜像所基于的基础镜像，第一条指令必须为FROM 指令，每创建一个镜像就需要一条 FROM 指令

（2）MAINTAINER 名字

说明新镜像的维护人信息

(3) RUN 命令

在所基于的镜像上执行命令，并提交到新的镜像中.

尽量减少run命令的条数。

当命令较长时，可以使用 \ 来换行；
多条命令可以使用 ; 或 && 合并成一条命令，减少镜像的层数。

(4）ENTRYPOINT

ENTRYPOINT ["要运行的程序"，"参数1"，"参数2"]

设定容器启动时第一个运行的命令及其参数。

可以通过使用命令 docker run --entrypoint 来覆盖镜像中的ENTRYPOINT指令的内容。

 两种格式：
 
 exec格式（数值格式）：ENTRYPOINT [“命令”，“选项”，“参数”]
 
 shell格式：ENTRYPOINT 命令 选项 参数
复制代码

前面四个命令就可以创建成一个粗略的镜像。

（5）CMD

CMD ["要运行的程序"，"参数1"，"参数2"]

启动容器时默认执行的命令或者脚本，Dockerfile只能有一条CMD命令。如果指定多条命令，只执行最后一条命令。

如果在docker run时指定了命令或者镜像中有ENTRYPOINT，那么CMD就会被覆盖。

CMD 可以为ENTRYPOINT 指令提供默认参数。

 两种格式：
 
 exec形式：CMD [“要运行的程序”，“参数1”, “参数2”]
 
 shell形式: CMD 命令 参数1 参数2
复制代码

ENTRYPOINT和CMD共存的情形： ENTRYPOIN指定命令，CMD传参

容器运行时的优先级：

docker run --entrypoint > Dockerfile ENTRYPOINT > docker run命令> Dockerfile CMD

ENTRYPOINT和CMD的区别：

ENTRYPOINT设定容器启动时第一个运行的命令；CMD是启动容器时默认执行的命令，如果指定多条CMD命令，只执行最后一条命令。

如果在docker run时指定了命令或者镜像中有ENTRYPOINT，那么CMD就会被覆盖，并且会将CMD中的命令作为参数传给ENTRYPOINT。

CMD可以为ENTRYPOINT进行传参。

（6）EXPOSE 端口号

指定新镜像加载到Docker 时要开启的端口。

用于暴露端口，否则即使做了端口映射，外部也找不到。

(7) ENV

ENV 环境变量变量值

设置一个环境变量的值，会被后面的RUN使用。

(8) ADD

将源文件复制到镜像的指定路径中，源文件要与 Dockerfile 位于相同目录中，或者是一个URL。（URL路径，在线路径）

有如下注意事项：

 1、
 如果源路径是个文件，且目标路径是以 / 结尾， 则docker会把目标路径当作一个目录，会把源文件拷贝到该目录下。
 如果目标路径不存在，则会自动创建目标路径。
 
 2、
 如果源路径是个文件，且目标路径是不以/结尾，则docker会把目标路径当作一个文件。
 如果目标路径不存在，会以目标路径为名创建一个文件，内容同源文件。
 如果目标文件是个存在的文件，会用源文件覆盖它，当然只是内容覆盖，文件名还是目标文件名。
 如果目标文件实际是个存在的目录，则会源文件拷贝到该目录下。注意， 这种情况下，最好显示的以/结尾，以避免混淆。
 
 3、
 如果源路径是个目录，且目标路径不存在，则docker会自动以目标路径创建一个目录，把源路径目录下的文件拷贝进来。
 如果目标路径是个已经存在的目录，则docker 会把源路径目录下的文件拷贝到该目录下。
 
 4、
 如果源文件是个归档文件，则docker会自动帮解压。（解压后复制源目录到镜像中的目录）
 URL下载和解压特性不能一起使用。任何压缩文件通过URL拷贝，都不会自动解压。
 （不支持下载和解压一起使用，下载就不会解压。即只解压本地压缩包，不会解压下载的压缩包）
复制代码

ADD 的优点： 在执行 <源文件> 为 tar 压缩文件的话，压缩格式为 gzip、bzip2 以及 xz 的情况下，会自动复制并解压到 <目标路径>。
ADD 的缺点： 在不解压的前提下，无法复制 tar 压缩文件。会令镜像构建缓存失效，从而可能会令镜像构建变得比较缓慢。具体是否使用，可以根据是否需要自动解压来决定。

(9) COPY

只复制本地主机上的文件/目录复制到目标地点，源文件/目录要与Dockerfile在相同的目录中。

ADD和COPY比较： （同样需求下，官方推荐使用 COPY）

1、共同点：

ADD和COPY都可以复制本地文件到镜像中。

2、区别：

ADD：如果是一个压缩文件，ADD会在复制后自动解压。且支持URL路径下载源文件，但URL下载和解压特性不能一起使用，任何压缩文件通过URL拷贝，都不会自动解压。

COPY：如果是压缩文件，COPY并不能解压。且COPY只能复制本地文件，不支持URL路径拷贝。

(10) VOLUME ["目录"]

在容器中创建一个挂载点（即创建数据卷）。

(11) USER 用户名/UID

指定运行容器时的用户。（用于切换用户）

(12) WORKDIR 路径

为后续的RUN、CMD、ENTRYPOINT 指定工作目录。（用于切换容器中的目录）

CMD 可以为ENTRYPOINT 指令提供默认参数。

 workdir /opt  #切换镜像层
 
 run cd /opt   #会添加镜像层
复制代码

(13)ONBUILD 命令

指定所生成的镜像作为一个基础镜像时所要运行的命令。

当在一个Dockerfile文件中加上ONBUILD指令，该指令对利用该Dockerfile构建镜像（比如为A镜像）不会产生实质性影响。

但是当编写一个新的Dockerfile文件来基于A镜像构建一个镜像（比如为B镜像）时，这时构造A镜像的Dockerfile文件中的ONBUILD指令就生效了，在构建B镜像的过程中，首先会执行ONBUILD指令指定的指令，然后才会执行其它指令。

（即加私货，这个命令不是给我用的，是给其他镜像用的）

（14） AGR

设置编译镜像时加入的参数。

ARG指令，可以引用在docker build构建镜像时指定的参数，即达到引用参数的效果。

使用ENV指令定义的环境变量始终会覆盖同名的ARG指令。

 ARG CONT_IMG_VER      #Dockfile中指定变量名 
 
 ENV CONT_IMG_VER=v1.0.0 
 
 RUN echo $CONT_IMG_VER  #AEG和ENV定义的变量名，不要重复，不然最后echo的是ENV定义的值
 
 docker build --build-arg CONT_IMG_VER=v2.0 .     #构建镜像时传入变量值
 
 #因为AEG和ENV定义的变量名重复了，ENV指令定义的环境变量始终会覆盖同名的ARG指令，所以最后输出的是ENV定义的值。
复制代码

创建镜像

编写完成Dockerfile之后，可以通过 docker build 命令来创建镜像。

基本的格式为 docker build [选项] 路径，该命令将读取指定路径下（包括子目录）的Dockerfile，并将该路径下所有内容发送给Docker服务端，由服务端来创建镜像。因此一般建议放置Dockerfile的目录为空目录。

另外，可以通过.dockerignore文件（每一行添加一条匹配模式）来让Docker忽略路径下的目录和文件。

要指定镜像的标签信息，可以通过-t选项。

在编写Dockerfile 时，有严格的格式需要遵循：

第一行必须使用FROM指令指明所基于的镜像名称；

之后使用MAINTAINER 指令说明维护该镜像的用户信息；

然后是镜像操作相关指令，如RUN指令/EXPOSE/ADD/ENV/ARG等等。每运行一条指令，都会给基础镜像添加新的一层。（多条命令可以使用 ; 或 && 合并成一条命令，减少镜像的层数）

最后使用CMD或者ENTRYPOINT指令指定启动容器时要运行的命令操作。

Dockerfile 案例

构建Apache镜像

 #（1）建立工作目录
 mkdir /opt/apache
 cd /opt/apache

 #（2）准备Dockerfile文件
 vim Dockerfile

 #基于的基础镜像
 FROM centos:7
 #维护镜像的用户信息
 MAINTAINER this is apache image <lwx>
 #镜像操作指令安装apache软件
 RUN yum -y update
 RUN yum -y install httpd
 #开启80端口
 EXPOSE 80
 #复制网站首页文件
 ADD index.html /var/www/html/
 #指定启动容器时第一个运行的命令，前台运行apache
 //方法一:
 #将执行脚本复制到镜像中
 ADD run.sh /run.sh
 RUN chmod 755 /run.sh
 #启动容器时执行脚本
 CMD ["/run.sh"]
 
 //方法二:
 ENTRYPOINT ["/usr/sbin/apachectl"]
 CMD ["-D", "FOREGROUND"]     #FOREGROUND前台运行
 #默认情况下apache是在后台运行需要-D指定FOREGROUND表示前台运行否则执行完第一条命令会停止镜像

 #（3）准备执行脚本。使用方法一的情况下需要准备执行脚本，使用方法二可跳过此步骤。
 vim run.sh
 #!/bin/bash
 #清理httpd的缓存
 rm -rf /run/httpd/*
 #指定为前台运行
 /usr/sbin/apachectl -D FOREGROUND
 #因为Docker容器仅在它的1号进程(PID为1)运行时，会保持运行。如果1号进程退出了，Docker容器也就退出了。

 #（4）准备网站页面
 echo "this is apache web" > index.html

 #（5）生成镜像（构建镜像）
 docker build -t httpd:centos .   #注意别忘了末尾有"."

 #（6）使用新镜像运行容器
 docker run -d -p 1314:80 httpd:centos   #指定映射端口1314

#使用宿主机IP和1314端口，测试网页访问
 http://192.168.1.11:1314/

总结

Dockerﬁle常见命令：

命令	作用
FROM image_name:tag	声明基础镜像
MAINTAINER user_name	声明镜像的作者
ENV key value	设置环境变量 (可以写多条)
RUN command	编译镜像时运行的脚本(可以写多条)
CMD	设置容器的启动命令
ENTRYPOINT	设置容器的入口程序
ADD source_dir/ﬁle dest_dir/ﬁle	将宿主机的文件复制到镜像内，如果是一个压缩文件，将会在复制后自动解压。支持URL路径下载源文件，但下载方式不能自动解压。
COPY source_dir/ﬁle dest_dir/ﬁle	和ADD相似，将宿主机的文件复制到镜像内，但是如果有压缩文件并不能解压。不支持URL路径下载。
WORKDIR path_dir	设置工作目录
ARG	设置编译镜像时加入的参数
VOLUMN	设置容器的挂载卷

基于Dockerfile创建镜像