Docker网络

Docker 网络实现原理

Docker使用Linux桥接，在宿主机虚拟一个Docker容器网桥(docker0)，Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址，称为Container-IP，同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥，这样容器之间就能够通过容器的 Container-IP 直接通信。

Docker网桥是宿主机虚拟出来的，并不是真实存在的网络设备，外部网络是无法寻址到的，这也意味着外部网络无法直接通过 Container-IP 访问到容器。如果容器希望外部访问能够访问到，可以通过映射容器端口到宿主主机（端口映射），即 docker run 创建容器时候通过 -p 或 -P 参数来启用，访问容器的时候就通过[宿主机IP]:[容器端口]访问容器。

docker run -d --name test1 -P nginx 
#随机映射端口（从32768开始）

docker run -d --name test2 -p 43000:80 nginx 
#指定映射端口

浏览器访问：http://192.168.1.11:32768 、http://192.168.80.10:43000

Docker 的网络模式

Host：容器将不会虚拟出自己的网卡，配置自己的IP等，而是使用宿主机的IP和端口。
Container：创建的容器不会创建自己的网卡，配置自己的IP，而是和一个指定的容器共享IP、端口范围。
None：该模式关闭了容器的网络功能。
Bridge：默认为该模式，此模式会为每一个容器分配、设置IP等，并将容器连接到一个docker0虚拟网桥，通过docker0网桥以及iptables nat 表配置与宿主机通信。
自定义网络

#安装Docker时，它会自动创建三个网络，bridge（创建容器默认连接到此网络）、 none 、host

docker network ls 或 docker network list 
#查看docker网络列表

1. Host模式

相当于Vmware中的桥接模式，与宿主机在同一个网络中，但没有独立IP地址。

Docker使用了Linux的Namespaces技术来进行资源隔离，如PID Namespace隔离进程，Mount Namespace隔离文件系统，Network Namespace隔离网络等。

一个Network Namespace提供了一份独立的网络环境，包括网卡、路由、iptable规则等都与其他的Network Namespace隔离。一个Docker容器一般会分配一个独立的Network Namespace。但如果启动容器的时候使用host模式，那么这个容器将不会获得一个独立的Network Namespace，而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等，而是使用宿主机的IP和端口。

2、Container模式

在理解了host模式后，这个模式也就好理解了。这个模式指定新创建的容器和已经存在的一个容器共享一个Network Namespace，而不是和宿主机共享。新创建的容器不会创建自己的网卡，配置自己的IP，而是和一个指定的容器共享IP、端口范围等。同样，两个容器除了网络方面，其他的如文件系统、进程列表等还是隔离的。两个容器的进程可以通过lo网卡设备通信。

docker run -itd --name test3 centos:7 /bin/bash 
#--name 选项可以给容器创建一个自定义名称
docker inspect -f '{{.State.Pid}}' 5b5c749a7b78
#查看容器进程号
ls -l /proc/15981/ns 
#查看容器的进程、网络、文件系统等命名空间编号

docker run -itd --name test4 --net=container:5b5c749a7b78 centos:7 /bin/bash
#创建新的容器test4并且是container模式，和test3共享一个Network Namespace
docker inspect -f '{{.State.Pid}}' e2ba82663228
#查看容器进程号
ls -l /proc/16399/ns 
#查看容器的进程、网络、文件系统等命名空间编号

3、Bridge 模式（默认）

bridge模式是docker的默认网络模式，不用--net参数，就是bridge模式。

相当于Vmware中的 nat 模式，容器使用独立network Namespace，并连接到docker0虚拟网卡。通过docker0网桥以及iptables nat表配置与宿主机通信，此模式会为每一个容器分配Network Namespace、设置IP等，并将一个主机上的 Docker 容器连接到一个虚拟网桥上。

当Docker进程启动时，会在主机上创建一个名为docker0的虚拟网桥，此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似，这样主机上的所有容器就通过交换机连在了一个二层网络中。
从docker0子网中分配一个IP给容器使用，并设置docker0的IP地址为容器的默认网关。在主机上创建一对虚拟网卡veth pair设备。veth设备总是成对出现的，它们组成了一个数据的通道，数据从一个设备进入，就会从另一个设备出来。因此，veth设备常用来连接两个网络设备。
Docker将 veth pair 设备的一端放在新创建的容器中，并命名为 eth0（容器的网卡），另一端放在主机中，以 * 这样类似的名字命名，并将这个网络设备加入到 docker0 网桥中。可以通过 brctl show 命令查看。veth
使用 docker run -p 时，docker实际是在iptables做了DNAT规则，实现端口转发功能。可以使用iptables -t nat -vnL 查看。

4、None模式（躺平）

使用none模式，Docker容器拥有自己的Network Namespace，但是，并不为Docker容器进行任何网络配置。

也就是说，这个Docker容器没有网卡、IP、路由等信息。

这种网络模式下容器只有lo回环网络，没有其他网卡。这种类型的网络没有办法联网，封闭的网络能很好的保证容器的安全性

自定义网络

直接使用bridge模式，是无法支持指定IP运行docker的，例如执行以下命令就会报错

docker run -itd --name test5 --network bridge --ip 172.18.0.10 centos:7 /bin/bash

#创建自定义网络 可以先自定义网络，再使用指定IP运行docker

docker network create --subnet=172.18.0.10/16 --opt "com.docker.network.bridge.name"="docker1" mynetwork
#docker1 为执行 ifconfig -a 命令时，显示的网卡名，如果不使用 --opt 参数指定此名称，那你在使用 ifconfig -a 命令查看网络信息时，看到的是类似 br-110eb56a0b22 这样的名字，这显然不怎么好记。
#mynetwork 为执行 docker network list 命令时，显示的bridge网络模式名称。

docker run -itd --name test6 --net mynetwork --ip 172.18.0.10 centos:7 /bin/bash
#重新在创建容器，用自定义网络模式

资源控制

一.CPU资源控制

1.1 cgroups概述

cgroups,是一个非常强大的linux内核工具，他不仅可以限制被 namespace 隔离起来的资源，还可以为资源设置权重、计算使用量、操控进程启停等等。所以 cgroups(Control groups)实现了对资源的配额和度量。

cgroups有四大功能：

资源限制：可以对任务使用的资源总额进行限制
优先级分配：通过分配的cpu时间时数量以及磁盘IO带宽大小，实际上相当于控制了任务运行优先级
资源统计：可以统计系统的资源使用量，如cpu时长，内存用量等
任务控制：cgroup可以对任务执行挂起、恢复等操作

1.2 设置cpu的使用率上限（重点）

Linux通过CFS(Completely Fair Scheduler,完全公平调度器）来调度各个进程对CPU的使用。CFS默认的调度周期是100ms。
我们可以设置每个容器进程的调度周期，以及在这个周期内各个容器最多能使用多少CPU时间。
使用--cpu-period**即可设置调度周期，使用--cpu-quota即可设置在每个周期内容器能使用的cpu时间。两者可以配合使用。
CFS周期的有效范围是1ms1s,对应的--cpu-period的数值范围是1000~1000000（--cpu-period的单位为：微秒）。
而容器的CPU配额必须不小于1ms,即--cpu-quota的值必须>=1000。

 ##（1）运行一个容器
 [root@localhost ~]# docker run -itd --name lwx centos:7 /bin/bash
 [root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE                              COMMAND                  CREATED          STATUS                    PORTS                                                                                                                 NAMES
5d7c6e7d9201   centos:7                           "/bin/bash"              10 seconds ago   Up 10 seconds                                                                                                                                   lwx

 ##（2）查看容器默认cpu使用率（主要要知道路径，方便以后查看），默认的容器cpu是没有限额的
 1. cd /sys/fs/cgroup/cpu/docker/            
 #cpu使用率的两个文件--cpu-quota和--cpu-period都此文件夹内
 
 2. cd 18f71b9394b508d5ac3499a01f31bed96a33a94e09a112935f9f5af1cc39a98c/
 #进入容器id号文件夹
 
 3. cat cpu.cfs_quota_us
 -1
 
 #cpu.cfs_ _quota_ us:表示该cgroups限制占用的时间(微秒)，默认为-1，表示不限制。如果 设为50000,表示5占用0000100000-508的CPU。
 
 4. cat cpu.cfs_period_us
 100000
 
 #cpu.cfs_period_us:表示该cpu分配的周期（微秒，所以文件中用us表示），默认为100000

 ##（3）进行cpu压力测试
 [root@localhost ~]# docker ps -a
 [root@localhost ~]# docker exec -it lwx bash
 
 [root@18f71b9394b5 /]# vi /cpu.sh
 #脚本内容：
 #!/bin/bash
 i=0
 while true
 do
   let i++
 done
 

 chmod +x /cpu.sh
 sh cpu.sh
 
  #再打开一个终端，用top命令查看容器cpu使用率

 ## (4) 修改cpu使用率
 [root@localhost ~]# docker run -itd --name wyn --cpu-quota 50000 centos:7
 [root@localhost ~]# docker ps -a
 [root@localhost ~]# cd /sys/fs/cgroup/cpu/docker
 [root@localhost ~]#ls
 [root@localhost ~]#cd 056115e22195cf07732b3608630349793945a33c80ea12125b4bb10d733cd697
 [root@localhost 056115e22195cf07732b3608630349793945a33c80ea12125b4bb10d733cd697]# ls
 cgroup.clone_children  cpuacct.usage         cpu.rt_period_us   notify_on_release
 cgroup.event_control   cpuacct.usage_percpu  cpu.rt_runtime_us  tasks
 cgroup.procs           cpu.cfs_period_us     cpu.shares
 cpuacct.stat           cpu.cfs_quota_us      cpu.stat

两种方法更改cpu的利用率：

1.在docker -run的时候加上--cpu-period或者quota 数值定义

2.修改cpu.cfs_period_us或者cpu.cfs_quota_us数值，这种方法可以在容器运行时修改cpu使用率比较灵活

1.3 设置cpu资源占用比（--cpu shares）

设置多个容器时才有效

启动时定义两个容器的cpu资源占用比**

主机名：192.168.1.11

 #（1）启动容器时定义两台主机的资源占用比
 docker run -itd --name t1 --cpu shares 1024 centos:7(主机1设置)
 docker run -itd --name t2 --cpu shares 2048 centos:7(主机2设置）

 #（2）使用stress在两个容器上进行压测
 t1容器
 docker ps -a                         #查看容器运行状态
 docker exec -it t1 bash             #进入容器操作
 yum install -y epel-release          #安装epel在线源
 yum install -y stress                #安装压测工具
 stress -c 4                          #产生四个进程，每个进程都反复不停的计算随机数的平方根
 --------------------------------------------------------------------
 t2容器
 docker ps -a                         #查看容器运行状态
 docker exec -it t2 bash              #进入容器操作     
 yum intall -y epel-release           #安装epel在线源
 yum install -y stress                #安装压测工具
 stress -c 4                          #产生四个进程，每个进程都反复不停的计算随机数的平方根

##使用docker stats查看容器运行状态（动态更新）
 docker stats                        #查看容器使用资源
 
 cd /sys/fd/cgroup/cpu/docker/
 cat cpu.shares
 1024                                #这里反馈1024，就是我们前面设置的cpu运行占有比的份额

1.4 设置容器绑定指定的cpu(--cpuset-cpus)

#先分配虚拟机4个CPU核数，--cpuset-cpus的cpu核数为0、1、2、3
 docker run -itd --name t3 --cpuset-cpus 1,3 centos:7 bash
 
 docker ps -a            #查看是否容器是否成功运行
 docker exec -it t3 bash         #进入容器
 yum install -y epel-release         #yum安装epel源
 yum install -y stress           #安装stress压测软件
 stress -c 4         #测试cpu

#退出容器，执行 top 命令再按 1 查看CPU使用情况。
 top         
 #这时候可以看到时1号cpu和3号cpu在使用

二.对内存使用的限制

-m （--memory=) 选项用于限制容器可以使用的最大内存

--memory-swap 和 --memory 一起使用可以限制swap 的大小。

正常情况下，--memory-swap 的值包含容器的可用内存和可用swap。

所以，-m 300m --memory-swap=1g 的含义为：容器可以使用300M的物理内存，并且可以使用 700M（1G-300M）的swap

如果 --memory-swap 设置为0或者 不设置，则容器可以使用swap 大小为 -m 值的两倍
如果 --memory-swap 的值和 -m 值相同，则容器不能使用 swap
如果 --memory-swap 的值为 -1 ，它表示容器程序使用的内存受限，而可以使用的swap空间不受限制（宿主机有多少swap，容器就可以使用多少）

MIB 2为的底数

MB 10为底数的值

1KiB = 2^10 1024 1MiB = 2^20 1048576 1024Ki 1GiB = 1,073,741,824

1KB = 10^3 1000 1MB=10^6 1000000 1GB=10^9 1TB

TiB 2^40 - 10^12

三.对磁盘IO的限制

 #(1)
 --device-read-bps: 限制某个设备上的读速度 bps（数据量），单位可以是kb，mb（M）或者gb。
 
 例： docker run -itd --name test --device-read-bps /dev/sda:1M centos:7 /bin/bash
 
 #(2)
 --device-write-bps: 限制某个设备上的写速度（数据量），单位可以是kb，mb（M）或者gb。
 
 例： docker run -itd --name test --device-write-bps /dev/sda:1M centos:7 /bin/bash
 
 #(3)
 --device-read-iops : 限制读某个设备的iops(次数）
 
 #(4)
 --device-write-iops: 限制写入某个设备iops(次数)
 
 #(5)
 #清理dockers占用的磁盘空间
 docker system prune -a
 
 
复制代码

实例：

 #创建容器，并限制写速度
 [root@host103 ~]# docker run -itd  --name test4 --device-write-bps /dev/sda:1mb centos:7 bash
 
 #通过dd来验证写速度,oflag=direct可以规避文件系统的地址，防止文件系统卸载缓存当中
 [root@98dbd982b24c /]# dd if=/dev/zero of=/opt/test.out bs=10M count=10 oflag=direct
 10+0 records in
 10+0 records out
 10485760 bytes (10 MB) copied, 10.0035 s, 1.0 MB/

Docker网络模式和资源控制