二进制搭建Kubernetes集群操作系统初始化配置部署 etcd 集群在 master01 节点上操作在 nod

操作系统初始化配置

#关闭防火墙，清除防火墙规则
systemctl stop firewalld
systemctl disable firewalld  
iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X
#-X可以清除一些自定义的链表规则

#关闭selinux
setenforce 0
sed -i 's/enforcing/disabled/' /etc/selinux/config

#关闭swap
swapoff -a                             #临时关闭交换分区
sed -ri 's/.*swap.*/#&/' /etc/fstab    #永久关闭交换分区 

#根据规划设置主机名
hostnamectl set-hostname master01 && su
hostnamectl set-hostname node01 && su
hostnamectl set-hostname node02 && su#添加主机名和IP的映射关系
vim /etc/hosts
 192.168.136.10 master01
 192.168.136.20 node01
 192.168.136.30 node02

#调整内核参数
vim /etc/sysctl.d/k8s.conf
 #开启网桥模式，可将网桥的流量传递给iptables链
 net.bridge.bridge-nf-call-ip6tables = 1
 net.bridge.bridge-nf-call-iptables = 1
 #关闭ipv6协议
 net.ipv6.conf.all.disable_ipv6=1
 net.ipv4.ip_forward=1
 #开启路由转发功能 
 sysctl --system   #加载系统的内核参数 #时间同步
 yum install ntpdate -y ntpdate time.windows.com
 #将时间同步加入计划性任务，每30分钟执行一次
 crontab -e
 */30 * * * * /usr/sbin/ntpdate time.windows.com

部署 etcd 集群

在 master01 节点上操作

 #-----------------------准备cfssl证书生成工具----------
 wget https://pkg.cfssl.org/R1.2/cfssl_linux-amd64 -o /usr/local/bin/cfssl
 wget https://pkg.cfssl.org/R1.2/cfssljson_linux-amd64 -O /usr/local/bin/cfssljson
 wget https://pkg.cfssl.org/R1.2/cfssl-certinfo_linux-amd64 -o /usr/local/bin/cfssl-certinfo
 #-o：指定下载目录
 #Linux命令行两种下载方式：
 #wget 源URL地址 [-o 下载到指定路径]
 #curl 源URL地址 [-o 下载到指定路径]
 
 chmod +x /usr/local/bin/cfssl*
 
 --------------------- 虚线内注释 ------------------------------------------------
 cfssl：证书签发的工具命令。
 cfssljson：将cfssl生成的证书（json格式）变为文件承载式证书。
 cfssl-certinfo：验证证书的信息。
 cfssl-certinfo -cert <证书名称>   #查看证书的信息
 -------------------------------------------------------------------------------
 
 
 #------------------------生成Etcd证书-----------------------
 #k8s目录用于存放生成证书的脚本文件
 mkdir /opt/k8s/
 cd /opt/k8s/
 
 #上传 etcd-cert.sh 和 etcd.sh 到 /opt/k8s/ 目录中，为两个文件增加执行权限
 chmod +x etcd-cert.sh etcd.sh
 
 #创建用于生成CA证书、etcd 服务器证书以及私钥的目录
 mkdir /opt/k8s/etcd-cert/
 mv etcd-cert.sh etcd-cert/    #将etcd-cert.sh移动到该目录
 cd /opt/k8s/etcd-cert/   #切换到该目录
 ./etcd-cert.sh        #运行脚本生成CA证书、etcd 服务器证书以及私钥
 
 #查看etcd-cert目录，以.json和.csr结尾的文件都是请求生成证书的文件，以pem结尾的文件都是最终生成的证书文件。
 ls                  
 ca-config.json  ca-csr.json  ca.pem        server.csr       server-key.pem
 ca.csr          ca-key.pem   etcd-cert.sh  server-csr.json  server.pem
 
 
 #上传 etcd-v3.4.9-linux-amd64.tar.gz 到 /opt/k8s/ 目录中，启动etcd服务
 #下载地址https://github.com/etcd-io/etcd/releases/download/v3.4.9/etcd-v3.4.9-1inux-amd64.tar.gz
 cd /opt/k8s/
 tar zxvf etcd-v3.4.9-linux-amd64.tar.gz
 
 #查看安装包解压后的目录，该目录包含了etcd的启动文件etcd和etcd的管理文件etcdctl
 cd /opt/k8s/etcd-v3.4.9-linux-amd64/
 ls
 --------------------------------------------------------------------------------
 etcd：就是etcd服务的启动命令，后面可跟各种启动参数
 etcdctl：主要为etcd服务提供了命令行操作
 --------------------------------------------------------------------------------
 
 #创建/opt/etcd目录，并创建三个子目录cfg、bin、ssl。cfg用于存放配置文件，bin用于存放执行文件，ssl用于存放证书文件
 mkdir -p /opt/etcd/{cfg,bin,ssl}
 
 #将etcd和etcdctl两个文件移动到/opt/etcd/bin目录
 mv etcd etcdctl /opt/etcd/bin/
 #将证书文件复制到etcd01节点的/opt/etcd/ssl/目录
 cp /opt/k8s/etcd-cert/*.pem /opt/etcd/ssl/
 
 cd /opt/k8s/
 #运行脚本，会卡在前台
 ./etcd.sh etcd01 192.168.136.10 etcd02=https://192.168.136.20:2380,etcd03=https://192.168.136.30:2380
 #另开一台终端，查看进程信息
 ps -ef | grep etcd
 
 #将etcd目录中的所有文件发送给etcd02和etcd03节点
 scp -r /opt/etcd/ root@192.168.136.20:/opt/
 scp -r /opt/etcd/ root@192.168.136.30:/opt/
 #传输etcd的系统服务管理文件
 scp /usr/lib/systemd/system/etcd.service root@192.168.136.20:/usr/lib/systemd/system/
 scp /usr/lib/systemd/system/etcd.service root@192.168.136.30:/usr/lib/systemd/system/

在 node01 节点上操作

vim /opt/etcd/cfg/etcd
#[Member]
ETCD_NAME="etcd02"											#修改
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
ETCD_LISTEN_PEER_URLS="https://192.168.136.20:2380"			#修改
ETCD_LISTEN_CLIENT_URLS="https://192.168.136.20:2379"		#修改

#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.136.20:2380"		#修改
ETCD_ADVERTISE_CLIENT_URLS="https://192.168.136.20:2379"				#修改
ETCD_INITIAL_CLUSTER="etcd01=https://192.168.136.10:2380,etcd02=https://192.168.136.20:2380,etcd03=https://192.168.136.30:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"

systemctl start etcd
systemctl enable etcd
systemctl status etcd

在 node02 节点上操作

vim /opt/etcd/cfg/etcd
#[Member]
ETCD_NAME="etcd03"											#修改
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
ETCD_LISTEN_PEER_URLS="https://192.168.136.30:2380"			#修改
ETCD_LISTEN_CLIENT_URLS="https://192.168.136.30:2379"		#修改

#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.136.30:2380"		#修改
ETCD_ADVERTISE_CLIENT_URLS="https://192.168.136.30:2379"				#修改
ETCD_INITIAL_CLUSTER="etcd01=https://192.168.136.10:2380,etcd02=https://192.168.136.20:2380,etcd03=https://192.168.136.30:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"

systemctl start etcd
systemctl enable etcd
systemctl status etcd

检查etcd群集状态

 #三个etcd节点都可用查看
 #切换到/opt/etcd/ssl目录，证书可使用相对路径。如果不在该目录下，证书要使用绝对路径。
 #查看etcd集群每个节点的健康状态，true表示健康
 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.136.10:2379,https://192.168.136.20:2379,https://192.168.136.30:2379" endpoint health --write-out=table
 
 #查看etcd集群成员列表
 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.136.10:2379,https://192.168.136.20:2379,https://192.168.136.30:2379" --write-out=table member list
 
 #查看etcd集群中哪个节点是leader，true表示leader
 ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.136.10:2379,https://192.168.136.20:2379,https://192.168.136.30:2379" endpoint status --write-out=table
 
 #------------------注释---------------------------------------
--cert-file：识别HTTPS端使用SSL证书文件
--key-file：使用此SSL密钥文件标识HTTPS客户端
--ca-file：使用此CA证书验证启用https的服务器的证书
--endpoints：集群中以逗号分隔的机器地址列表
cluster-health：检查etcd集群的运行状况
#-------------------------------------------------------------
 
 #因为是通过客户端的方式进行访问，所以用2379端口，检查每个节点的状态

部署 docker引擎

所有 node 节点部署docker引擎

yum install -y yum-utils device-mapper-persistent-data lvm2 
yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo 
yum install -y docker-ce docker-ce-cli containerd.io

systemctl start docker.service
systemctl enable docker.service

部署 Master 组件

在 master01 节点上操作

#上传 master.zip 和 k8s-cert.sh 到 /opt/k8s 目录中，解压 master.zip 压缩包
cd /opt/k8s/
unzip master.zip
chmod +x *.sh

mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}

#创建用于生成CA证书、相关组件的证书和私钥的目录
mkdir /opt/k8s/k8s-cert
mv /opt/k8s/k8s-cert.sh /opt/k8s/k8s-cert
cd /opt/k8s/k8s-cert/
./k8s-cert.sh

ls *pem
admin-key.pem  apiserver-key.pem  ca-key.pem  kube-proxy-key.pem  
admin.pem      apiserver.pem      ca.pem      kube-proxy.pem

cp ca*pem apiserver*pem /opt/kubernetes/ssl/

#上传 kubernetes-server-linux-amd64.tar.gz 到 /opt/k8s/ 目录中，解压 kubernetes 压缩包
cd /opt/k8s/
tar zxvf kubernetes-server-linux-amd64.tar.gz

cd /opt/k8s/kubernetes/server/bin
cp kube-apiserver kubectl kube-controller-manager kube-scheduler /opt/kubernetes/bin/
ln -s /opt/kubernetes/bin/* /usr/local/bin/

#创建 bootstrap token 认证文件，apiserver 启动时会调用，然后就相当于在集群内创建了一个这个用户，接下来就可以用 RBAC 给他授权
cd /opt/k8s/
vim token.sh
#!/bin/bash
#获取随机数前16个字节内容，以十六进制格式输出，并删除其中空格
BOOTSTRAP_TOKEN=$(head -c 16 /dev/urandom | od -An -t x | tr -d ' ')
#生成 token.csv 文件，按照 Token序列号,用户名,UID,用户组 的格式生成
cat > /opt/kubernetes/cfg/token.csv <<EOF
${BOOTSTRAP_TOKEN},kubelet-bootstrap,10001,"system:kubelet-bootstrap"
EOF

chmod +x token.sh
./token.sh

cat /opt/kubernetes/cfg/token.csv

cd /opt/k8s/
./apiserver.sh 192.168.136.10 https://192.168.136.10:2379,https://192.168.136.20:2379,https://192.168.136.30:2379

ps aux | grep kube-apiserver

netstat -natp | grep 6443   #安全端口6443用于接收HTTPS请求，用于基于Token文件或客户端证书等认证

cd /opt/k8s/

#启动 scheduler 服务
./scheduler.sh
ps aux | grep kube-scheduler

#启动 controller-manager 服务
./controller-manager.sh
ps aux | grep kube-controller-manager

#生成kubectl连接集群的证书
./admin.sh

kubectl create clusterrolebinding cluster-system-anonymous --clusterrole=cluster-admin --user=system:anonymous

#通过kubectl工具查看当前集群组件状态
kubectl get cs
NAME                 STATUS    MESSAGE             ERROR
controller-manager   Healthy   ok                  
scheduler            Healthy   ok                  
etcd-2               Healthy   {"health":"true"}   
etcd-1               Healthy   {"health":"true"}   
etcd-0               Healthy   {"health":"true"}  

#查看版本信息
kubectl version

部署Worker Node组件

在所有node节点上操作

#创建kubernetes工作目录
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}

#上传 node.zip 到 /opt 目录中，解压 node.zip 压缩包，获得kubelet.sh、proxy.sh
cd /opt/
unzip node.zip
chmod +x kubelet.sh proxy.sh

//在 master01 节点上操作
#把 kubelet、kube-proxy 拷贝到 node 节点
cd /opt/k8s/kubernetes/server/bin
scp kubelet kube-proxy root@192.168.136.20:/opt/kubernetes/bin/
scp kubelet kube-proxy root@192.168.136.30:/opt/kubernetes/bin/

#上传 kubeconfig.sh 文件到 /opt/k8s/kubeconfig 目录中，生成 kubeconfig 的配置文件
mkdir /opt/k8s/kubeconfig

cd /opt/k8s/kubeconfig
chmod +x kubeconfig.sh
./kubeconfig.sh 192.168.136.10 /opt/k8s/k8s-cert/

scp bootstrap.kubeconfig kube-proxy.kubeconfig root@192.168.136.20:/opt/kubernetes/cfg/
scp bootstrap.kubeconfig kube-proxy.kubeconfig root@192.168.136.30:/opt/kubernetes/cfg/

#RBAC授权，使用户 kubelet-bootstrap 能够有权限发起 CSR 请求
kubectl create clusterrolebinding kubelet-bootstrap --clusterrole=system:node-bootstrapper --user=kubelet-bootstrap

//在 node01 节点上操作
#启动 kubelet 服务
cd /opt/
./kubelet.sh 192.168.136.20
ps aux | grep kubelet

//在 master01 节点上操作，通过 CSR 请求
#检查到 node01 节点的 kubelet 发起的 CSR 请求，Pending 表示等待集群给该节点签发证书
kubectl get csr
NAME                                                   AGE  SIGNERNAME                                    REQUESTOR           CONDITION
node-csr-duiobEzQ0R93HsULoS9NT9JaQylMmid_nBF3Ei3NtFE   12s  kubernetes.io/kube-apiserver-client-kubelet   kubelet-bootstrap   Pending

#通过 CSR 请求
kubectl certificate approve node-csr-duiobEzQ0R93HsULoS9NT9JaQylMmid_nBF3Ei3NtFE

#Approved,Issued 表示已授权 CSR 请求并签发证书
kubectl get csr
NAME                                                   AGE  SIGNERNAME                                    REQUESTOR           CONDITION
node-csr-duiobEzQ0R93HsULoS9NT9JaQylMmid_nBF3Ei3NtFE   2m5s kubernetes.io/kube-apiserver-client-kubelet   kubelet-bootstrap   Approved,Issued

#查看节点，由于网络插件还没有部署，节点会没有准备就绪 NotReady
kubectl get node
NAME            STATUS     ROLES    AGE    VERSION
192.168.136.20   NotReady   <none>   108s   v1.20.11

//在 node01 节点上操作
#加载 ip_vs 模块
for i in $(ls /usr/lib/modules/$(uname -r)/kernel/net/netfilter/ipvs|grep -o "^[^.]*");do echo $i; /sbin/modinfo -F filename $i >/dev/null 2>&1 && /sbin/modprobe $i;done

#启动proxy服务
cd /opt/
./proxy.sh 192.168.136.20
ps aux | grep kube-proxy

部署网络组件

部署 flannel

//在 node01 节点上操作
#上传 cni-plugins-linux-amd64-v0.8.6.tgz 和 flannel.tar 到 /opt 目录中
cd /opt/
docker load -i flannel.tar

mkdir /opt/cni/bin
tar zxvf cni-plugins-linux-amd64-v0.8.6.tgz -C /opt/cni/bin

//在 master01 节点上操作
#上传 kube-flannel.yml 文件到 /opt/k8s 目录中，部署 CNI 网络
cd /opt/k8s
kubectl apply -f kube-flannel.yml 

kubectl get pods -n kube-system
NAME                    READY   STATUS    RESTARTS   AGE
kube-flannel-ds-hjtc7   1/1     Running   0          7s

kubectl get nodes
NAME            STATUS   ROLES    AGE   VERSION
192.168.136.20   Ready    <none>   81m   v1.20.11

部署 Calico

//在 master01 节点上操作
#上传 calico.yaml 文件到 /opt/k8s 目录中，部署 CNI 网络
cd /opt/k8s
vim calico.yaml
#修改里面定义Pod网络（CALICO_IPV4POOL_CIDR），与前面kube-controller-manager配置文件指定的cluster-cidr网段一样
    - name: CALICO_IPV4POOL_CIDR
      value: "192.168.0.0/16"
  
kubectl apply -f calico.yaml

kubectl get pods -n kube-system
NAME                                       READY   STATUS    RESTARTS   AGE
calico-kube-controllers-659bd7879c-4h8vk   1/1     Running   0          58s
calico-node-nsm6b                          1/1     Running   0          58s
calico-node-tdt8v                          1/1     Running   0          58s


#等 Calico Pod 都 Running，节点也会准备就绪
kubectl get nodes


---------- node02 节点部署 ----------
//在 node01 节点上操作
cd /opt/
scp kubelet.sh proxy.sh root@192.168.136.30:/opt/
scp -r /opt/cni root@192.168.136.30:/opt/

//在 node02 节点上操作
#启动kubelet服务
cd /opt/
chmod +x kubelet.sh
./kubelet.sh 192.168.136.30

//在 master01 节点上操作
kubectl get csr
NAME                                                   AGE  SIGNERNAME                                    REQUESTOR           CONDITION
node-csr-BbqEh6LvhD4R6YdDUeEPthkb6T_CJDcpVsmdvnh81y0   10s  kubernetes.io/kube-apiserver-client-kubelet   kubelet-bootstrap   Pending
node-csr-duiobEzQ0R93HsULoS9NT9JaQylMmid_nBF3Ei3NtFE   85m  kubernetes.io/kube-apiserver-client-kubelet   kubelet-bootstrap   Approved,Issued

#通过 CSR 请求
kubectl certificate approve node-csr-BbqEh6LvhD4R6YdDUeEPthkb6T_CJDcpVsmdvnh81y0

kubectl get csr
NAME                                                   AGE  SIGNERNAME                                    REQUESTOR           CONDITION
node-csr-BbqEh6LvhD4R6YdDUeEPthkb6T_CJDcpVsmdvnh81y0   23s  kubernetes.io/kube-apiserver-client-kubelet   kubelet-bootstrap   Approved,Issued
node-csr-duiobEzQ0R93HsULoS9NT9JaQylMmid_nBF3Ei3NtFE   85m  kubernetes.io/kube-apiserver-client-kubelet   kubelet-bootstrap   Approved,Issued

#加载 ipvs 模块
for i in $(ls /usr/lib/modules/$(uname -r)/kernel/net/netfilter/ipvs|grep -o "^[^.]*");do echo $i; /sbin/modinfo -F filename $i >/dev/null 2>&1 && /sbin/modprobe $i;done

#使用proxy.sh脚本启动proxy服务
cd /opt/
chmod +x proxy.sh
./proxy.sh 192.168.136.30

#查看群集中的节点状态
kubectl get nodes

部署 CoreDNS

//在所有 node 节点上操作
#上传 coredns.tar 到 /opt 目录中
cd /opt
docker load -i coredns.tar

//在 master01 节点上操作
#上传 coredns.yaml 文件到 /opt/k8s 目录中，部署 CoreDNS 
cd /opt/k8s
kubectl apply -f coredns.yaml

kubectl get pods -n kube-system 
NAME                          READY   STATUS    RESTARTS   AGE
coredns-5ffbfd976d-j6shb      1/1     Running   0          32s

#DNS 解析测试
kubectl run -it --rm dns-test --image=busybox:1.28.4 sh
If you don't see a command prompt, try pressing enter.
/ # nslookup kubernetes
Server:    10.0.0.2
Address 1: 10.0.0.2 kube-dns.kube-system.svc.cluster.local

Name:      kubernetes
Address 1: 10.0.0.1 kubernetes.default.svc.cluster.local

部署 Dashboard

//在 master01 节点上操作
#上传 recommended.yaml 文件到 /opt/k8s 目录中，部署 CoreDNS 
cd /opt/k8s
vim recommended.yaml
#默认Dashboard只能集群内部访问，修改Service为NodePort类型，暴露到外部：
kind: Service
apiVersion: v1
metadata:
  labels:
    k8s-app: kubernetes-dashboard
  name: kubernetes-dashboard
  namespace: kubernetes-dashboard
spec:
  ports:
    - port: 443
      targetPort: 8443
      nodePort: 30001     #添加
  type: NodePort          #添加
  selector:
    k8s-app: kubernetes-dashboard

#创建service account并绑定默认cluster-admin管理员集群角色
kubectl create serviceaccount dashboard-admin -n kube-system
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin
kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk '/dashboard-admin/{print $1}')

#使用输出的token登录Dashboard
https://NodeIP:30001