一. Docker网络实现原理
- docker使用linux桥接,在宿主机虚拟一个docker容器网桥(docker0)
- docker启动一个容器时会根据docker网桥的网段分配给容器一个IP地址,称为Container-IP
- 同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能通过容器的Container-IP直接通信
docker网桥是宿主机虚拟出来的,并不是真实存在的网络设备,外部网络是无法寻址到的,这也意味着外部网络无法直接通过Container-IP访问到容器。如果容器希望外部访问能够访问到,可以通过映射容器端口到宿主机(端口映射),即docker run 创建容器的时候,通过-p或者-P参数来启用。访问容器的时候,就通过【宿主机IP】:【容器端口】访问容器。
二. Docker的网络模式
- Host:容器不会虚拟出自己的网卡,配置主机的IP等,而是使用宿主机的IP和端口
- Container:创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口的范围。
- None:该模式关闭了容器的网络功能。
- Briidge:默认为该模式,桥接,此模式会为每一个容器分配,设置IP等,并将容器连接到一个docker0的虚拟网桥,通过docker0 网桥以及iptables nat表配置与宿主机通信
1. Host模式
- host模式:使用–net=host指定
- 相当于VMware中的桥接模式,与宿主机在同一个网络中,但是没有独立IP地址
- Docker 使用了Linux 的Namespace 技术来进行资源隔离,如PID Namespace隔离进程,Mount Namespace隔离文件系统,Network Namespace 隔离网络等。
- 一个Network Namespace 提供了一份独立的网络环境,包括网卡,路由,iptable 规则等都与其他Network Namespace 隔离。
- 一个Docker 容器一般会分配一个独立的Network Namespace
但是如果启动容器的时候使用host 模式,那么这个容器将不会获得一个独立的Network Namespace ,而是和宿主机共用一个Network Namespace 。容器将不会虚拟出自己的网卡,配置自己的IP等,而是使用宿主机的IP和端口.此时容器不再拥有隔离的、独立的网络栈,不拥有所有端口资源。
#创建容器tt1,指定网络模式为 host
#容器和宿主机共享网络命名空间,但没有独立IP地址。使用宿主机的IP,和宿主机共享端口范围。
docker run -d --name tt1 --net=host nginx
#访问宿主机的ip和80端口,则可以访问到tt1的nginx服务
curl http://192.168.10.11:80
2. Container模式
- container模式: 使用–net=contatiner:NAME_or_ID 指定
- 这个模式指定新创建的容器和已经存在的一个容器共享一个Network Namespace,而不是和宿主机共享。新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP,端口范围等。可以在一定程度上节省网络资源,容器内部依然不会拥有所有端口。
- 同样,两个容器除了网络方面,其他的如文件系统,进程列表等还是隔离的。
- 两个容器的进程可以通过lo网卡设备通信
#基于镜像centos:7 创建一个名为test1的容器
[root@yuji ~]# docker run -itd --name test1 centos:7 /bin/bash
93aff0eb3974084e658564fcd478df7e43091ebc0c8d002b15332f2d6a2c5c28
#查看容器test1的pid号
[root@yuji ~]# docker inspect -f '{{.State.Pid}}' test1
3798
#查看test1的网络命名空间编号,net:[4026532578]
[root@yuji ~]# ls -l /proc/3798/ns
总用量 0
lrwxrwxrwx 1 root root 0 6月 27 16:12 ipc -> ipc:[4026532575]
lrwxrwxrwx 1 root root 0 6月 27 16:12 mnt -> mnt:[4026532573]
lrwxrwxrwx 1 root root 0 6月 27 16:12 net -> net:[4026532578]
lrwxrwxrwx 1 root root 0 6月 27 16:12 pid -> pid:[4026532576]
lrwxrwxrwx 1 root root 0 6月 27 16:12 user -> user:[4026531837]
lrwxrwxrwx 1 root root 0 6月 27 16:12 uts -> uts:[4026532574]
#创建test2容器,使用container网络模式,和test1共享网络命名空间
[root@yuji ~]# docker run -itd --name test2 --net=container:test1 centos:7 bash
17c654c74aa868c21a7db26f1df480f4d46a72cc25457284c9b07c8400c36d09
#查看test2容器的pid
[root@yuji ~]# docker inspect -f '{{.State.Pid}}' test2
3931
#查看test2容器的网络命名空间编号,net:[4026532578],和test1相同。
[root@yuji ~]# ls -l /proc/3931/ns/
总用量 0
lrwxrwxrwx 1 root root 0 6月 27 16:26 ipc -> ipc:[4026532694]
lrwxrwxrwx 1 root root 0 6月 27 16:26 mnt -> mnt:[4026532692]
lrwxrwxrwx 1 root root 0 6月 27 16:26 net -> net:[4026532578]
lrwxrwxrwx 1 root root 0 6月 27 16:26 pid -> pid:[4026532695]
lrwxrwxrwx 1 root root 0 6月 27 16:26 user -> user:[4026531837]
lrwxrwxrwx 1 root root 0 6月 27 16:26 uts -> uts:[4026532693]
#可以看到test2和test1共享同一个网络命名空间
3. none模式
- none模式:使用 --net=none指定
- 使用none 模式,docker 容器有自己的network Namespace ,但是并不为Docker 容器进行任何网络配置。也就是说,这个Docker 容器没有网卡,ip, 路由等信息。
- 这种网络模式下,容器只有lo 回环网络,没有其他网卡。
- 这种类型没有办法联网,但是封闭的网络能很好的保证容器的安全性
- 该容器将完全独立于网络,用户可以根据需要为容器添加网卡。此模式拥有所有端口。(none网络模式配置网络)
- 特殊情况下才会用到,一般不用
4. bridge模式
bridge模式是docker的默认网络模式,不写 – net参数,就是bridge模式
相当于Vmware中的 nat 模式,容器使用独立network Namespace,并连接到docker0虚拟网卡。通过docker0网桥以及iptables nat表配置与宿主机通信,此模式会为每一个容器分配Network Namespace、设置IP等,并将一个主机上的 Docker 容器连接到一个虚拟网桥上。
- 当Docker进程启动时,会在主机上创建一个名为docker0的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过交换机连在了一个二层网络中
- 从docker0子网中分配一个IP给容器使用,并设置docker0的IP地址为容器的默认网关。在主机上创建一对虚拟网卡veth pair设备。veth设备总是成对出现的,它们组成了一个数据的通道,数据从一个设备进入,就会从另一个设备出来。因此,veth设备常用来连接两个网络设备
- Docker将veth pair 设备的一端放在新创建的容器中,并命名为eth0(容器的网卡),另一端放在主机中,以veth*这样类似的名字命名,并将这个网络设备加入到docker0网桥中。可以通过 brctl show 命令查看
- 容器之间通过veth pair进行访问
- 使用 docker run -p 时,docker实际是在iptables做了DNAT规则,实现端口转发功能。可以使用iptables -t nat -vnL 查看
#bridge模式是docker的默认网络模式,不用--net参数,就是bridge模式。
[root@yuji ~]# docker run -itd --name tt2 centos:7 /bin/bash
5b441ed075be84b9873c28ed590639e2a2bb9ae8f115c4bcd94bebcc733c4e57
#查看容器tt2的网络模式,为默认网络模式。
[root@yuji ~]# docker inspect tt2 | grep -i 'networkmode'
"NetworkMode": "default",
三. 自定义网络
直接使用bridge 模式,是无法指定IP运行docker 的,例如执行以下命令就会报错:
[root@yuji ~]# docker run -itd --name tt3 --network bridge --ip 172.18.0.10 centos:7 bash
47a226d858b1c29ea7ca995024395bcb9ea781dc70a18d0c4ff23471658219d3
docker: Error response from daemon: user specified IP address is supported on user defined networks only.
复制代码
创建自定义网络:
需要先自定义网络,再指定IP运行docker。
#(1)先自定义网络,设置网卡地址池,网卡名,网络模式名称
[root@yuji ~]# docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynetwork
12a643f6908df836a9c4c04eb4df96d902f079d1b96ffef1607f79456ca9fe0e
-------------注释---------------------------------------------------------------------
●docker1 :为执行ifconfig -a 命令时显示的网卡名,如果不使用 --opt 参数指定此名称,使用 ifconfig -a 查看网卡的网络信息时,看到的将会是类似 br-110eb56a0b22这样的名字,这显然不好记。
●mynetwork:为执行"docker network list" 命令时,显示的 bridge 网络模式名称。
-------------------------------------------------------------------------------------
#查看docker的网络列表
[root@yuji ~]# docker network ls
NETWORK ID NAME DRIVER SCOPE
87068f0dcef0 bridge bridge local
13c2115317cd host host local
12a643f6908d mynetwork bridge local #已生成自定义网络
10d4299d0f88 none null local
#(2)再使用该网段内的地址,创建自定义网络的容器test6
[root@yuji ~]# docker run -itd --name test6 --net mynetwork --ip 172.18.0.10 centos:7 /bin/bash
d2cb1f26d8de3f9de55df679357bc62a8bbef67b795c538e61d31a99ded72f8e
#查看容器test6的IP地址
[root@yuji ~]# docker inspect test6 | grep -i "IPv4Address"
"IPv4Address": "172.18.0.10"
#也可以docker exec进入容器后下载net-tools工具,之后使用ifconfig命令查看容器IP地址。
复制代码
删除自定义网络:
如果想要删除自定义的网络,可以使用 docker network rm 网络模式名称 进行删除,例如docker network rm mynetwork。
删除网络模式前,需要先确保使用该网络模式创建的容器已退出(即已停止)。如果容器仍在运行,则该网络无法删除。
#当使用自定义网络创建的容器处于运行状态时,无法删除自定义网络。
[root@yuji ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
d2cb1f26d8de centos:7 "/bin/bash" 7 minutes ago Up 7 minutes
[root@yuji ~]# docker network rm mynetwork
Error response from daemon: error while removing network: network mynetwork id 12a643f6908d0568257f64828f7d11e41b4c9147f57c364c04fd7d8ba64eff28 has active endpoints
#需要先将容器停止,之后再删除网络
[root@yuji ~]# docker stop d2cb1f26d8de
d2cb1f26d8de
[root@yuji ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
d2cb1f26d8de centos:7 "/bin/bash" 8 minutes ago Exited (137) 2 seconds ago test6
[root@yuji ~]# docker network rm mynetwork #删除自定义网络mynetwork
mynetwork
[root@yuji ~]# docker network ls #自定义网络已被删除
NETWORK ID NAME DRIVER SCOPE
87068f0dcef0 bridge bridge local
13c2115317cd host host local
10d4299d0f88 none null local
四. 暴露端口
端口映射,底层原理实际是做了一个DNAT转换。
方法一:随机映射端口(从32768开始)
docker run -itd --name=为容器指定名称 -P 镜像名称
复制代码
方法二:指定映射端口
docker run -itd --name=为容器指定名称 -p 宿主机端口:容器端口 镜像名称
复制代码
示例1:
#随机映射端口
docker run -itd --name web1 -P nginx
#查看映射端口号
docker ps -a
#使用宿主机IP:映射端口访问测试
curl http://192.168.10.11:49154
[root@yuji ~]# docker run -itd --name web1 -P nginx
32dd3964a7910a8a7a5aa3e25936d2840ce9f220dff638afd7c89b4bc3b2ea2f
[root@yuji ~]# docker ps -a #查看映射端口号,为49154
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
32dd3964a791 nginx "/docker-entrypoint.…" 6 seconds ago Up 4 seconds 0.0.0.0:49154->80/tcp, :::49154->80/tcp web1
[root@yuji ~]# curl http://192.168.10.11:49154 #使用宿主机IP:映射端口访问测试
复制代码
示例2:
#指定映射端口,将容器的80端口映射到宿主机的48888端口
docker run -itd --name web2 -p 48888:80 nginx
#使用宿主机IP:映射端口访问测试
curl http://192.168.41.46:48888
#指定映射端口,将容器的80端口映射到宿主机的48888端口
[root@yuji ~]# docker run -itd --name web2 -p 48888:80 nginx
b3f51b63019564657a59b373eabfc1befb83545f8f0e2c11b97866618b25aada
[root@yuji ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
b3f51b630195 nginx "/docker-entrypoint.…" 4 seconds ago Up 3 seconds 0.0.0.0:48888->80/tcp, :::48888->80/tcp web2
32dd3964a791 nginx "/docker-entrypoint.…" 7 minutes ago Up 7 minutes 0.0.0.0:49154->80/tcp, :::49154->80/tcp web1
#使用宿主机IP:映射端口访问测试
[root@yuji ~]# curl http://192.168.41.46:48888
#查看宿主机监听的端口号
[root@yuji ~]# netstat -natp|grep docker
tcp 0 0 0.0.0.0:48888 0.0.0.0:* LISTEN 2547/docker-proxy
tcp 0 0 0.0.0.0:49154 0.0.0.0:* LISTEN 2349/docker-proxy
tcp6 0 0 :::48888 :::* LISTEN 2553/docker-proxy
tcp6 0 0 :::49154 :::* LISTEN 2357/docker-proxy
#查看iptables规则,端口映射实际是做了一个DNAT转换,通过nat表进行转发的
[root@localhost ~]# iptables -nL -t nat
......
Chain DOCKER (2 references)
target prot opt source destination
RETURN all -- 0.0.0.0/0 0.0.0.0/0
DNAT tcp -- 0.0.0.0/0 0.0.0.0/0 tcp dpt:49154 to:172.17.0.2:80
DNAT tcp -- 0.0.0.0/0 0.0.0.0/0 tcp dpt:48888 to:172.17.0.3:80
复制代码
端口映射,底层原理实际是做了一个DNAT转换。
192.168.10.11:32768 映射到 172.17.0.5:80,192.168.10.11:48888 映射到 172.17.0.6:80。
五、总结
5.1 进入容器没有systemctl命令怎么解决
docker run -itd --name cenos_v1 --privileged=true centos:7 /sbin/init
docker exec -it cenos_v1 /bin/bash
5.2 Docker网络模式有哪些?分别提供哪些功能?
- Host :与宿主机共享网络名称空间/网络协议栈
- Container:多个容器之间共享一个network namespaces
- None :自闭空间
- bridge:默认模式通过Veth对连接容器与docker0网桥,网桥分配给容器IP,同时docker 0作为“局域网”内容器的网关,最后和宿主机网卡进行通讯
5.3 如何把脚本传入一个已经运行的容器
#使用cp命令复制进去容器
docker cp start.sh cenos_v1:/opt
#使用cp命令从容器复制出来
docker cp cenos_v1:/opt/start.sh ./
5.4 docker中,假设运行一个业务容器,但是业务容器需要暴露三个端口,启动后发现自己少加了一个端口。如何动态添加端口(如何对已经运行的容器添加或者修改端口)?
- 首先,我们可以修改/var/lib/docker/containers/containers_id中两个文件
- hostconfig.json 中的 portbinding:{}修改端口或添加端口
- 修改config.v2.json文件,修改对应的Ports{}来添加/修改端口
- 最后,重启守护进程。