Docker网络
Docker 网络实现原理
Docker使用Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址,称为Container-IP,同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能够通过容器的 Container-IP 直接通信。
Docker网桥是宿主机虚拟出来的,并不是真实存在的网络设备,外部网络是无法寻址到的,这也意味着外部网络无法直接通过 Container-IP 访问到容器。如果容器希望外部访问能够访问到,可以通过映射容器端口到宿主主机(端口映射),即 docker run 创建容器时候通过 -p 或 -P 参数来启用,访问容器的时候就通过[宿主机IP]:[容器端口]访问容器。
docker run -d --name test1 -P nginx
#随机映射端口(从32768开始)
docker run -d --name test2 -p 43000:80 nginx
#指定映射端口
浏览器访问:http://192.168.1.11:32768 、http://192.168.80.10:43000
Docker 的网络模式
- Host:容器将不会虚拟出自己的网卡,配置自己的IP等,而是使用宿主机的IP和端口。
- Container:创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围。
- None:该模式关闭了容器的网络功能。
- Bridge:默认为该模式,此模式会为每一个容器分配、设置IP等,并将容器连接到一个docker0虚拟网桥,通过docker0网桥以及iptables nat 表配置与宿主机通信。
- 自定义网络
#安装Docker时,它会自动创建三个网络,bridge(创建容器默认连接到此网络)、 none 、host
docker network ls 或 docker network list
#查看docker网络列表
1. Host模式
相当于Vmware中的桥接模式,与宿主机在同一个网络中,但没有独立IP地址。
Docker使用了Linux的Namespaces技术来进行资源隔离,如PID Namespace隔离进程,Mount Namespace隔离文件系统,Network Namespace隔离网络等。
一个Network Namespace提供了一份独立的网络环境,包括网卡、路由、iptable规则等都与其他的Network Namespace隔离。 一个Docker容器一般会分配一个独立的Network Namespace。 但如果启动容器的时候使用host模式,那么这个容器将不会获得一个独立的Network Namespace, 而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等,而是使用宿主机的IP和端口。
2、Container模式
在理解了host模式后,这个模式也就好理解了。这个模式指定新创建的容器和已经存在的一个容器共享一个Network Namespace,而不是和宿主机共享。新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围等。同样,两个容器除了网络方面,其他的如文件系统、进程列表等还是隔离的。两个容器的进程可以通过lo网卡设备通信。
docker run -itd --name test3 centos:7 /bin/bash
#--name 选项可以给容器创建一个自定义名称
docker inspect -f '{{.State.Pid}}' 5b5c749a7b78
#查看容器进程号
ls -l /proc/15981/ns
#查看容器的进程、网络、文件系统等命名空间编号
docker run -itd --name test4 --net=container:5b5c749a7b78 centos:7 /bin/bash
#创建新的容器test4并且是container模式,和test3共享一个Network Namespace
docker inspect -f '{{.State.Pid}}' e2ba82663228
#查看容器进程号
ls -l /proc/16399/ns
#查看容器的进程、网络、文件系统等命名空间编号
3、Bridge 模式(默认)
bridge模式是docker的默认网络模式,不用--net参数,就是bridge模式。
相当于Vmware中的 nat 模式,容器使用独立network Namespace,并连接到docker0虚拟网卡。通过docker0网桥以及iptables nat表配置与宿主机通信,此模式会为每一个容器分配Network Namespace、设置IP等,并将一个主机上的 Docker 容器连接到一个虚拟网桥上。
- 当Docker进程启动时,会在主机上创建一个名为docker0的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过交换机连在了一个二层网络中。
- 从docker0子网中分配一个IP给容器使用,并设置docker0的IP地址为容器的默认网关。在主机上创建一对虚拟网卡veth pair设备。veth设备总是成对出现的,它们组成了一个数据的通道,数据从一个设备进入,就会从另一个设备出来。因此,veth设备常用来连接两个网络设备。
- Docker将 veth pair 设备的一端放在新创建的容器中,并命名为 eth0(容器的网卡),另一端放在主机中, 以 * 这样类似的名字命名,并将这个网络设备加入到 docker0 网桥中。可以通过 brctl show 命令查看。veth
- 使用 docker run -p 时,docker实际是在iptables做了DNAT规则,实现端口转发功能。可以使用iptables -t nat -vnL 查看。
4、None模式(躺平)
使用none模式,Docker容器拥有自己的Network Namespace,但是,并不为Docker容器进行任何网络配置。
也就是说,这个Docker容器没有网卡、IP、路由等信息。
这种网络模式下容器只有lo回环网络,没有其他网卡。这种类型的网络没有办法联网,封闭的网络能很好的保证容器的安全性
自定义网络
直接使用bridge模式,是无法支持指定IP运行docker的,例如执行以下命令就会报错
docker run -itd --name test5 --network bridge --ip 172.18.0.10 centos:7 /bin/bash
#创建自定义网络 可以先自定义网络,再使用指定IP运行docker
docker network create --subnet=172.18.0.10/16 --opt "com.docker.network.bridge.name"="docker1" mynetwork
#docker1 为执行 ifconfig -a 命令时,显示的网卡名,如果不使用 --opt 参数指定此名称,那你在使用 ifconfig -a 命令查看网络信息时,看到的是类似 br-110eb56a0b22 这样的名字,这显然不怎么好记。
#mynetwork 为执行 docker network list 命令时,显示的bridge网络模式名称。
docker run -itd --name test6 --net mynetwork --ip 172.18.0.10 centos:7 /bin/bash
#重新在创建容器,用自定义网络模式
资源控制
一.CPU资源控制
1.1 cgroups概述
cgroups,是一个非常强大的linux内核工具,他不仅可以限制被 namespace 隔离起来的资源,还可以为资源设置权重、计算使用量、操控进程启停等等。所以 cgroups(Control groups)实现了对资源的配额和度量。
cgroups有四大功能:
- 资源限制:可以对任务使用的资源总额进行限制
- 优先级分配:通过分配的cpu时间时数量以及磁盘IO带宽大小,实际上相当于控制了任务运行优先级
- 资源统计:可以统计系统的资源使用量,如cpu时长,内存用量等
- 任务控制:cgroup可以对任务执行挂起、恢复等操作
1.2 设置cpu的使用率上限(重点)
- Linux通过CFS(Completely Fair Scheduler,完全公平调度器)来调度各个进程对CPU的使用。CFS默认的调度周期是100ms。
- 我们可以设置每个容器进程的调度周期,以及在这个周期内各个容器最多能使用多少CPU时间。
- 使用--cpu-period**即可设置调度周期,使用--cpu-quota即可设置在每个周期内容器能使用的cpu时间。两者可以配合使用。
- CFS周期的有效范围是1ms1s,对应的--cpu-period的数值范围是1000~1000000(--cpu-period的 单位为:微秒)。
- 而容器的CPU配额必须不小于1ms,即--cpu-quota的值必须>=1000。
##(1)运行一个容器
[root@localhost ~]# docker run -itd --name lwx centos:7 /bin/bash
[root@localhost ~]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
5d7c6e7d9201 centos:7 "/bin/bash" 10 seconds ago Up 10 seconds lwx
##(2)查看容器默认cpu使用率(主要要知道路径,方便以后查看),默认的容器cpu是没有限额的
1. cd /sys/fs/cgroup/cpu/docker/
#cpu使用率的两个文件--cpu-quota和--cpu-period都此文件夹内
2. cd 18f71b9394b508d5ac3499a01f31bed96a33a94e09a112935f9f5af1cc39a98c/
#进入容器id号文件夹
3. cat cpu.cfs_quota_us
-1
#cpu.cfs_ _quota_ us:表示该cgroups限制占用的时间(微秒),默认为-1,表示不限制。如果 设为50000,表示5占用0000100000-508的CPU。
4. cat cpu.cfs_period_us
100000
#cpu.cfs_period_us:表示该cpu分配的周期(微秒,所以文件中用us表示),默认为100000
##(3)进行cpu压力测试
[root@localhost ~]# docker ps -a
[root@localhost ~]# docker exec -it lwx bash
[root@18f71b9394b5 /]# vi /cpu.sh
#脚本内容:
#!/bin/bash
i=0
while true
do
let i++
done
chmod +x /cpu.sh
sh cpu.sh
#再打开一个终端,用top命令查看容器cpu使用率
## (4) 修改cpu使用率
[root@localhost ~]# docker run -itd --name wyn --cpu-quota 50000 centos:7
[root@localhost ~]# docker ps -a
[root@localhost ~]# cd /sys/fs/cgroup/cpu/docker
[root@localhost ~]#ls
[root@localhost ~]#cd 056115e22195cf07732b3608630349793945a33c80ea12125b4bb10d733cd697
[root@localhost 056115e22195cf07732b3608630349793945a33c80ea12125b4bb10d733cd697]# ls
cgroup.clone_children cpuacct.usage cpu.rt_period_us notify_on_release
cgroup.event_control cpuacct.usage_percpu cpu.rt_runtime_us tasks
cgroup.procs cpu.cfs_period_us cpu.shares
cpuacct.stat cpu.cfs_quota_us cpu.stat
两种方法更改cpu的利用率:
1.在docker -run的时候加上--cpu-period或者quota 数值定义
2.修改cpu.cfs_period_us或者cpu.cfs_quota_us数值,这种方法可以在容器运行时修改cpu使用率比较灵活
1.3 设置cpu资源占用比(--cpu shares)
设置多个容器时才有效
启动时定义两个容器的cpu资源占用比**
主机名:192.168.1.11
#(1)启动容器时定义两台主机的资源占用比
docker run -itd --name t1 --cpu shares 1024 centos:7(主机1设置)
docker run -itd --name t2 --cpu shares 2048 centos:7(主机2设置)
#(2)使用stress在两个容器上进行压测
t1容器
docker ps -a #查看容器运行状态
docker exec -it t1 bash #进入容器操作
yum install -y epel-release #安装epel在线源
yum install -y stress #安装压测工具
stress -c 4 #产生四个进程,每个进程都反复不停的计算随机数的平方根
--------------------------------------------------------------------
t2容器
docker ps -a #查看容器运行状态
docker exec -it t2 bash #进入容器操作
yum intall -y epel-release #安装epel在线源
yum install -y stress #安装压测工具
stress -c 4 #产生四个进程,每个进程都反复不停的计算随机数的平方根
##使用docker stats查看容器运行状态(动态更新)
docker stats #查看容器使用资源
cd /sys/fd/cgroup/cpu/docker/
cat cpu.shares
1024 #这里反馈1024,就是我们前面设置的cpu运行占有比的份额
1.4 设置容器绑定指定的cpu(--cpuset-cpus)
#先分配虚拟机4个CPU核数,--cpuset-cpus的cpu核数为0、1、2、3
docker run -itd --name t3 --cpuset-cpus 1,3 centos:7 bash
docker ps -a #查看是否容器是否成功运行
docker exec -it t3 bash #进入容器
yum install -y epel-release #yum安装epel源
yum install -y stress #安装stress压测软件
stress -c 4 #测试cpu
#退出容器,执行 top 命令再按 1 查看CPU使用情况。
top
#这时候可以看到时1号cpu和3号cpu在使用
二.对内存使用的限制
-m (--memory=) 选项用于限制容器可以使用的最大内存
--memory-swap 和 --memory 一起使用可以限制swap 的大小。
正常情况下,--memory-swap 的值包含容器的可用内存和可用swap。
所以,-m 300m --memory-swap=1g 的含义为: 容器可以使用300M的物理内存,并且可以使用 700M(1G-300M)的swap
- 如果 --memory-swap 设置为0或者 不设置,则容器可以使用swap 大小为 -m 值的两倍
- 如果 --memory-swap 的值和 -m 值相同,则容器不能使用 swap
- 如果 --memory-swap 的值为 -1 ,它表示容器程序使用的内存受限,而可以使用的swap空间不受限制(宿主机有多少swap,容器就可以使用多少)
MIB 2为的底数
MB 10为底数的值
1KiB = 2^10 1024 1MiB = 2^20 1048576 1024Ki 1GiB = 1,073,741,824
1KB = 10^3 1000 1MB=10^6 1000000 1GB=10^9 1TB
TiB 2^40 - 10^12
三.对磁盘IO的限制
#(1)
--device-read-bps: 限制某个设备上的读速度 bps(数据量),单位可以是kb,mb(M)或者gb。
例: docker run -itd --name test --device-read-bps /dev/sda:1M centos:7 /bin/bash
#(2)
--device-write-bps: 限制某个设备上的写速度(数据量),单位可以是kb,mb(M)或者gb。
例: docker run -itd --name test --device-write-bps /dev/sda:1M centos:7 /bin/bash
#(3)
--device-read-iops : 限制读某个设备的iops(次数)
#(4)
--device-write-iops: 限制写入某个设备iops(次数)
#(5)
#清理dockers占用的磁盘空间
docker system prune -a
复制代码
实例:
#创建容器,并限制写速度
[root@host103 ~]# docker run -itd --name test4 --device-write-bps /dev/sda:1mb centos:7 bash
#通过dd来验证写速度,oflag=direct可以规避文件系统的地址,防止文件系统卸载缓存当中
[root@98dbd982b24c /]# dd if=/dev/zero of=/opt/test.out bs=10M count=10 oflag=direct
10+0 records in
10+0 records out
10485760 bytes (10 MB) copied, 10.0035 s, 1.0 MB/