docker数据管理

151 阅读12分钟

Docker的数据管理

管理Docker 容器中数据主要有两种方式:数据卷(Data Volumes)和数据卷容器( DataVolumes Containers) 。

数据卷

数据卷是一个供容器使用的特殊目录,位于容器中。可将宿主机的目录挂载到数据卷上,对数据卷的修改操作立刻可见,并且更新数据不会影响镜像,从而实现数据在宿主机与容器之间的迁移。数据卷的使用类似于Linux下对目录进行的mount操作。

docker system prune -a   #清空docker本地无用的磁盘空间
docker run -v 宿主机目录/文件:容器目录/文件    #设置数据卷,将宿主机的目录/文件挂载到容器内
docker run --volumes-from 数据卷容器     #将数据卷容器中的目录/文件挂载到容器内
docker run --link 源容器名:连接别名    #实现容器单向通过 容器名/连接别名 连接到源容器

需求:宿主机目录/var/www挂载到容器中的/data1。

docker pull centos: 7
 
注意:宿主机本地目录的路径必须是使用绝对路径。如果路径不存在,Docker会自动创建相应的路径。
docker run -it --name test4 -v /var/www:/data1 centos:7 bash
#-v选项可以在容器内创建数据卷
 
ls
echo "this is test1 file" > /data1/test.txt
exit
 
#返回宿主机进行查看
cd /var/www/
cat test.txt

数据卷容器

如果需要在容器之间共享一些数据,最简单的方法就是使用数据卷容器。数据卷容器是一个普通的容器,专门提供数据卷给其他容器挂载使用。

#创建一个容器作为数据卷容器
docker run -it --name test6 -v /data1 -v /data2 centos:7 bash        #创建并进入容器
echo "this is test6 file" > /data1/test.txt                          #容器内创建测试文件1
echo "THIS IS TEST6 FILE" > /data2/test.txt                          #容器内创建测试文件1
 
#使用--volumes-from来挂载test6容器中的数据卷到新的容器
docker run -it --name test7 --volumes-from test6 centos:7 bash       #创建并进入容器
cat data1/test.txt                                       #查看测试数据是否同步
cat data2/TEST.txt

容器互联(使用centos镜像)

容器互联是通过容器的名称在容器间建立一条专门的网络通信隧道。简单点说,就是会在源容器和接收容器之间建立一条隧道,接收容器可以看到源容器指定的信息

#创建并运行源容器取名web1
docker run -itd -P --name web1 centos:7 /bin/bash
#创建并运行接收容器取名web2,使用--link选项指定连接容器以实现容器互联
docker run -itd -P --name web2 --link web1:web1 centos:7 /bin/bash          #--link容器名:连接的别名
 
#进web2容器,ping web1
docker exec -it web2 bash
ping web1

Docker 镜像创建

创建镜像有三种方法,分别为基于已有镜像创建、基于本地模板创建以及基于Dockerfile创建

创建镜像:

使用现有的镜像启动容器,在容器中进行修改操作。再用docker comnit容器ID新镜像名称生成新的镜像

本地现有容器可用docker export 生成压缩包或者用网上下载已制作好的模板文件压缩包,再用cat包名1 docker import -镜像名生成新的镜像.

基于现有镜像创建

先基于镜像 docker run 运行容器,在容器中增删改操作,然后 docker commit 在本地提交成新的镜像

  1. 首先启动一个镜像,在容器里做修改

    docker create -it centos:7 bash

    docker ps -a

    docker start 9607ea2b0ede docker exec -it 9607ea2b0ede bash yum install net-tools -y # 可以在容器里面安装net-tools工具 exit

  1. 然后将修改后的容器提交为新的镜像,需要使用该容器的ID号创建新镜像

    docker commit -m "new" -a "centos" 9607ea2b0ede centos:test#常用选项: -m说明信息: -a作者信息; -p生成过程中停止容器的运行

    docker images

基于本地模板创建

docker export 将容器导出为模板文件,然后 docker import 将模板文件导入成镜像

通过导入操作系统模板文件可以生成镜像,模板可以从OPENVZ开源项目下载,下载地址为

openvz.org/Download/te…

wget http://download.openvz.org/template/precreated/debian-7.0-x86-minimal.tar.gz
#导入为镜像
cat debian-7.0-x86-minimal.tar.gz | docker import - debian:test

注:docker export import 导出容器export 

注意:export导出的是容器,不是镜像

docker export <CONTAINER ID >  > my_container.tar

导入容器为镜像import

cat my_container.tar |docker import - image_name:tag

基于Dockerfile创建

1)联合文件系统(UnionFS)

UnionFS(联合文件系统) : Union文 件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下。AUFS、OberlayFS及Devicemapper都是一种UnionFS。

  • Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。 
  • 特性:一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。 
  • 我们下载的时候看到的一层层的就是联合文件系统。 

2)镜像加载原理

  • Docker的镜像实际上由一层一层的文件系统组成,这种层级的文件系统就是UnionFS. 
  • bootfs主要包含bootloader和kernel,bootloader 主要是引导加载kernel,Li nux刚启动时会加载bootfs文件系统。 
  • 在Docker镜像的最底层是bootfs,这一-层与我们典型的Linux/Unix系统是一样的,包含boot加载器和内核。当boot加载完成之 后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。 
  • rootfs,在bootfs之. 上。包含的就是典型Linux系统中的/dev, /proc, /bin, /etc等标准目录和文件。rootfs 就是各种不同的操作系统发行版,比如Ubuntu, Centos等等。

我们可以理解成一开始内核里什么 都没有,操作一个命令下载debian,这时就会在内核上面加了一层基础镜像;再安装一个emacs,会在基础镜像上叠加一层image;接着再安装一个apache,又会在images.上面再叠加一层image。最后它们看起来就像一“个文件系统即容器的rootfs。在Docker的体系里把这些rootfs叫做Docker的镜像。但是,此时的每一层rootfs都是read-only的,我们此 时还不能对其进行操作。当我们创建一个容器,也就是将Docker镜像进行实例化,系统会在一层或是多层read-only的rootfs之上分配一层空的read-write的rootfs。 

3)为什么Docker里的centos的大小才200M?

因为对于精简的OS,rootfs可以很小,只需要包含最基本的命令、工具和程序库就可以了,因为底层直接用宿主机的kernel,自己只需要提供rootfs就可以了。 由此可见对于不同的linux发行版,bootfs基本是一致的,rootfs会有差别,因此不同的发行版可以公用bootfs。

4)Dockerfile

Docker镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数 (如匿名卷、环境变量、用户等)。

镜像不包含任何动态数据,其内容在构建之后也不会被改变

镜像的定制实际上就是定制每一层所添加的配置、文件

如果我们可以把每一层修改、安装、构建、操作的命令都写入一个脚本,用这个脚本来构建、定制镜像,那么镜像构建透明性的问题、体积的问题就都会解决。这个脚本就是Dockerfile.

Dockerfile结构大致分为四个部分: 基础镜像信息、维护者信息、镜像操作指令和容器启动时执行指令。Dockerfile每行 支持一条指令,每条指令可携带多个参数,支持使用以“#“号开头的注释。

5)Docker镜像结构的分层

镜像不是一个单一的文件,而是有多层构成。容器其实是在镜像的最上面加了一层读写层,在运行容器里做的任何文件改动,都会写到这个读写层。如果删除了容器,也就删除了其最上面的读写层,文件改动也就丢失了。

Docker使用存储驱动管理镜像每层内容及可读写层的容器层

(1) Dockerfile 中的每个指令都会创建一个新的镜像层; 

(2)镜像层将被缓存和复用; 

(3)当Dockerfile的指令修改了,复制的文件变化了,或者构建镜像时指定的变量不同了,对应的镜像层缓存就会失效; 

(4) 某一层的镜像缓存失效,它之后的镜像层缓存都会失效; 

(5) 镜像层是不可变的,如果在某一层中添加一个文件,然后在下一层中删除它,则镜像中依然会包含该文件,只是这个文件在Docker容器中不可见了。

Dockerfile操作常用的指令

1.FROM 镜像

指定新镜像所基于的镜像,第一条 指令必须为FROM指令,每创建一个镜像就需要一条FROM 指令

2.MAINTAINER 名字

说明新镜像的维护人信息

3.RUN 命令

在所基于的镜像上执行命令,并提交到新的镜像中

4.ENTRYPOINT [“要运行的程序”,“参数1”,“参数2”]

设定容器启动时第一个运行的命令及其参数。 可以通过 使用命令docker run --entrypoint 来覆盖镜像中的ENTRYPOINT指令的内容

5.CMD [“要运行的程序”,“参数1”,“参数2”]

上面 的是exec形式, shell形式: CMD命令 参数1 参数2

启动容器时默认执行的命令或者脚本,Dockerfile只 能有一条CMD命令。如果指定多条命令,只执行最后一条命令。

如果在docker run时指定了命令或者镜像中有ENTRYPOINT,那么cmd就会被覆盖

CMD可以为ENTRYPOINT指令提供默认参数

6.EXPOSE 端口号

指定新镜像加载到Docker 时要开启的端口

7.ENV 环境变量 变量值

设置一个环境变量的值,会被后面的RUN使用

8.ADD 源文件/目录 目标文件/目录

将源文件复制到镜像中,源文件要与Dockerfile 位于相同目录中,或者是一个URL 有如下注意事项:

1.如果源路径是个文件,且目标路径是以/结尾, 则docker会把目标路径当作一个目录,会把源文件拷贝到该目录下

如果目标路径不存在,则会自动创建目标路径

2.如果源路径是个文件,且目标路径是不是以/结尾,则docker会把目标路径当作一个文件

如果目标路径不存在,会以目标路径为名创建一“个文件,内容同源文件 

 如果目标文件是个存在的文件,会用源文件覆盖它,当然只是内容覆盖,文件名还是目标文件名 

 如果目标文件实际是个存在的目录,则会源文件拷贝到该目录下。注意, 这种情况下,最好显示的以/结尾,以避免混淆

3.如果源路径是个目录,且目标路径不存在,则docker会自动以目标路径创建一个目录,把源路径月录下的文件拷贝进来

如果目标路径是个已经存在的目录,则docker 会把源路径目录下的文件拷贝到该目录下

4.如果源文件是个归档文件(压缩文件),则docker会自动帮解压

URL"下载和解压特性不能一起使用。任何压缩文件通过URL拷贝,都不会自动解压

9.COPY 源文件/目录 目标文件/目录

只复制本地主机.上的文件/目录复制到目标地点,源文件/目录要与Dockerfile 在相同的目录中

ADD和COPY区别

共同点:都能复制本地文件/目录到镜像中

区别:COPY只能复制本地文件/目录,而ADD还能通过URL下载文件复制到镜像中,ADD还能把本地tar包解压成目录复制到像中,但ADD不能同时把通过URL下载的tar包进行解压复制到镜像中

10.VOLUME [“目 录"]

在容器中创建一个挂载点

11.USER 用户名/UID

指定运行容器时的用户

12.WORKDIR 路径

为后续的RUN、 CMD、 ENTRYPOINT指定工作目录

13.ONBUILD 命令

  • 指定所生成的镜像作为一个基础镜像时所要运行的命令 
  • 当在一个Dockerfile文件中加上ONBUILD指令, 该指令对利用该Dockerfile构建镜像(比如为A镜像)不会产生实质性影响 
  • 但是当编写一个新的Dockerfile文件来基于A镜像构建一个镜像( 比如为B镜像)时,这时构造A镜像的Dockerfile文件中的ONBUILD指令就生效了,在构建B镜像的过程中,首先会执行ONBUILD指令指定的指令,然后才会执行其它指令

14.HEALTHCHECK

健康检查

Dockerfile编写格式

  1. 第一行必须使用FROM指令指明所基于的镜像名称 
  2. 之后使用MAINTAINER指令说明维护该镜像的用户信息 
  3. 然后是镜像操作相关指令,如RUN指令。每运行一条指令,都会给基础镜像添加新的一层 
  4. 最后使用CMD指令指定启动容器时要运行的命令操作

容器启动时运行的命令优先级

docker run --entrvpoint 命令 > ENTRYPOINT 启动命令 > docker run 镜像 命令 > CMD 默认启动命令

例:

#指定基础镜像
FROM centos:7
#指定镜像及作者信息
MAINTAINER this is apache image <zs>
#使用Linux命令安装apache
RUN yum install -y gcc gcc-c++ make pcre pcre-devel expat-devel perl
ADD apr-1.6.2.tar.gz /opt/
ADD apr-util-1.6.0.tar.gz /opt/
ADD httpd-2.4.29.tar.bz2 /opt/
RUN mv /opt/apr-1.6.2 /opt/httpd-2.4.29/srclib/apr && mv /opt/apr-util-1.6.0 /opt/httpd-2.4.29/srclib/apr-util
RUN cd /opt/httpd-2.4.29 && ./configure --prefix=/usr/local/httpd --enable-so --enable-rewrite --enable-charset-lite --enable-cgi && make -j 4 && make install
RUN ln -s /usr/local/httpd/conf/httpd.conf /etc/
RUN ln -s /usr/local/httpd/bin/* /usr/local/bin/
#暴露程序的端口
EXPOSE 80
#把本地编写好的网页文件复制到容器镜像中的指定位置
ADD index.html /var/www/html
#指定容器运行时执行的命令
CMD ["/usr/local/bin/apachectl","-D","FOREGROUND"]