容器技术 k8s service 浅析

808 阅读7分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第7天。

什么是 Service

Service可以看做是一组同类的Pod对外的访问接口,借助Service,应用可以方便的实现服务发现和负载均衡。

图片

Kubernetes Service 从逻辑上代表了一组 Pod,具体是哪些 Pod 则是由 label 来挑选。Service 有自己 IP,而且这个 IP 是不变的。客户端只需要访问 Service 的 IP,Kubernetes 则负责建立和维护 Service 与 Pod 的映射关系。无论后端 Pod 如何变化,对客户端不会有任何影响,因为 Service 没有变。

创建集群内部访问 service

kubectl expose deployment xxx --name=服务名 --type=ClusterIP --port=暴露的端口 --target-port=指向集群中的Pod的端口 [-n 命名空间]
# 会产生一个CLUSTER-IP,这个就是service的IP,在Service的生命周期内,这个地址是不会变化的
expose deployment nginx --name=svc-nginx1 --type=ClusterIP --port=80 --target-port=80 -n w

可以看到这里 service 是借助于 deployment 来暴露IP:端口的,为什么这样设计呢?因为如果是借助于 Pod 来暴露 IP:端口的时候,Pod 挂了也就挂了啊。。。其实真正转发的时候只需要用 label 就行了,用不到这个 deployment。

查看 service:

kubectl get service -n w

图片

目前这个集群还是只能在集群内部访问的。

创建集群外部访问 service

只需要把上面命令中的 type 指定为 NodePort 即可。图片

图片

访问IP:端口:http://虚拟机IP + 映射本机端口


service 的背后

Service在很多情况下只是一个概念,真正起作用的其实是kube-proxy服务进程,每个Node节点上都运行了一个kube-proxy的服务进程。当创建Service的时候会通过API Server向etcd写入创建的Service的信息,而kube-proxy会基于监听的机制发现这种Service的变化,然后它会将最新的Service信息转换为对应的访问规则。

图片

kube-proxy目前支持三种工作模式:

userspace 模式

userspace模式下,kube-proxy会为每一个Service创建一个监听端口,发向Cluster IP的请求被Iptables规则重定向到kube-proxy监听的端口上,kube-proxy根据LB算法选择一个提供服务的Pod并和其建立链接,以将请求转发到Pod上。该模式下,kube-proxy充当了一个四层负责均衡器的角色。由于kube-proxy运行在userspace中,在进行转发处理时会增加内核和用户空间之间的数据拷贝,虽然比较稳定,但是效率比较低。

图片

iptables 模式

iptables模式下,kube-proxy为service后端的每个Pod创建对应的iptables规则,直接将发向Cluster IP的请求重定向到一个Pod IP。该模式下kube-proxy不承担四层负责均衡器的角色,只负责创建iptables规则。该模式的优点是较userspace模式效率更高,但不能提供灵活的LB策略,当后端Pod不可用时也无法进行重试。

图片

ipvs 模式

ipvs模式和iptables类似,kube-proxy监控Pod的变化并创建相应的ipvs规则。ipvs相对iptables转发效率更高。除此以外,ipvs支持更多的LB算法。

图片


# 此模式必须安装ipvs内核模块,否则会降级为iptables
# 开启ipvs
# kubectl edit cm kube-proxy -n kube-system
# 修改mode: "ipvs"
# kubectl delete pod -l k8s-app=kube-proxy -n kube-system
[root@node1 ~]# ipvsadm -Ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
 -> RemoteAddress:Port           Forward Weight ActiveConn InActConn
 # 如果没有启用 ipvs 的话,这个命令的输出也就到这里为止
TCP  172.17.0.1:31206 rr
 -> 10.244.102.152:80           Masq    1      0          0        
 -> 10.244.102.153:80           Masq    1      0          0        
TCP  192.168.122.1:31206 rr
 -> 10.244.102.152:80           Masq    1      0          0        
 -> 10.244.102.153:80           Masq    1      0          0        
TCP  192.168.190.141:31206 rr
 -> 10.244.102.152:80           Masq    1      0          0        
 -> 10.244.102.153:80           Masq    1      0          0        
TCP  10.96.0.1:443 rr
 -> 192.168.190.141:6443         Masq    1      0          0        
TCP  10.96.0.10:53 rr
 -> 10.244.235.208:53           Masq    1      0          0        
 -> 10.244.235.210:53           Masq    1      0          0        
TCP  10.96.0.10:9153 rr
 -> 10.244.235.208:9153         Masq    1      0          0        
 -> 10.244.235.210:9153         Masq    1      0          0        
TCP  10.106.249.47:80 rr
 -> 10.244.102.152:80           Masq    1      0          0        
 -> 10.244.102.153:80           Masq    1      0          0        
TCP  10.111.114.186:80 rr
 -> 10.244.102.152:80           Masq    1      0          0        
 -> 10.244.102.153:80           Masq    1      0          0        
TCP  10.244.235.192:31206 rr
 -> 10.244.102.152:80           Masq    1      0          0        
 -> 10.244.102.153:80           Masq    1      0          0        
TCP  127.0.0.1:31206 rr
 -> 10.244.102.152:80           Masq    1      0          0        
 -> 10.244.102.153:80           Masq    1      0          0        
UDP  10.96.0.10:53 rr
 -> 10.244.235.208:53           Masq    1      0          0        
 -> 10.244.235.210:53           Masq    1      0          0        


service 资源清单


apiVersion: v1 # 版本
kind: Service # 类型
metadata: # 元数据
name: # 资源名称
namespace: # 命名空间
spec:
selector: # 标签选择器,用于确定当前Service代理那些Pod
  app: nginx
type: NodePort # Service的类型,指定Service的访问方式
clusterIP: # 虚拟服务的IP地址
sessionAffinity: # session亲和性,支持ClientIP、None两个选项,默认值为None
ports: # 端口信息
   - port: 8080 # Service端口
    protocol: TCP # 协议
    targetPort : # Pod端口
    nodePort:  # 主机端口


Endpoint

Endpoint是kubernetes中的一个资源对象,存储在etcd中,用来记录一个service对应的所有pod的访问地址,它是根据service配置文件中selector描述产生的。

Endpoints是实现实际服务的端点集合。换句话说,service和pod之间的联系是通过endpoints实现的。

图片

查看方法也简单:图片

需要注意的是,只有处于 Running 状态,且 readinessProbe 检查通过的 Pod,才会出现在 Service 的 Endpoints 列表里。并且,当某一个 Pod 出现问题时,Kubernetes 会自动把它从 Service 里摘除掉。


负载分发策略

对Service的访问被分发到了后端的Pod上去,目前kubernetes提供了两种负载分发策略:

  • 如果不定义,默认使用kube-proxy的策略,比如随机、轮询等。

  • 基于客户端地址的会话保持模式,即来自同一个客户端发起的所有请求都会转发到固定的一个Pod上,这对于传统基于Session的认证项目来说很友好,此模式可以在spec中添加sessionAffinity: ClusterIP选项。

我们来做个实验:1、创建三个 pod:

apiVersion: apps/v1
kind: Deployment      
metadata:
name: pc-deployment
namespace: dev
spec:
replicas: 3
selector:
  matchLabels:
    app: nginx-pod
template:
  metadata:
    labels:
      app: nginx-pod
  spec:
    containers:
    - name: nginx
      image: nginx:1.17.1
      ports:
      - containerPort: 80

2、查看创建结果

# kubectl get pods -n w -o wide --show-labels
NAME                             READY   STATUS   RESTARTS   AGE     IP               NODE                   NOMINATED NODE   READINESS GATES   LABELS
pc-deployment-6696798b78-2jpf4   1/1     Running   0         2m50s   10.244.102.155   localhost.localdomain   <none>           <none>            app=nginx-pod,pod-template-hash=6696798b78
pc-deployment-6696798b78-lggkb   1/1     Running   0         2m50s   10.244.102.156   localhost.localdomain   <none>           <none>            app=nginx-pod,pod-template-hash=6696798b78
pc-deployment-6696798b78-vsxj8   1/1     Running   0         2m50s   10.244.102.154   localhost.localdomain   <none>           <none>            app=nginx-pod,pod-template-hash=6696798b78

3、为了方便后面的测试,修改下三台nginx的index.html页面。

kubectl exec -it pc-deployment-6696798b78-2jpf4 -n w /bin/sh
echo "10.244.102.155" > /usr/share/nginx/html/index.html

4、测试一下是否写入成功

# curl 10.244.102.154
10.244.102.154

5、创建集群负载服务:

apiVersion: v1
kind: Service
metadata:
name: service-clusterip
namespace: w
spec:
selector:
  app: nginx-pod
clusterIP: 10.97.97.97 # service的ip地址,如果不写,默认会生成一个
type: ClusterIP
ports:
 - port: 80  # Service端口      
  targetPort: 80 # pod端口

6、 查看service的详细信息

# 在这里有一个Endpoints列表,里面就是当前service可以负载到的服务入口[root@k8s-master wlf]# kubectl describe svc service-clusterip -n w
Name:             service-clusterip
Namespace:         w
Labels:           <none>
Annotations:       <none>
Selector:          app=nginx-pod
Type:             ClusterIP
IP:                10.97.97.97
Port:             <unset>  80/TCP
TargetPort:        80/TCP
Endpoints:         10.244.102.154:80,10.244.102.155:80,10.244.102.156:80
Session Affinity: None
Events:           <none>

7、查看ipvs的映射规则【rr 轮询】

TCP  10.97.97.97:80 rr
 -> 10.244.102.154:80           Masq    1      0          0        
 -> 10.244.102.155:80           Masq    1      0          0        
 -> 10.244.102.156:80           Masq    1      0          0     

8、默认访问测试图片

是轮询吧。

9、修改分发策略

apiVersion: v1
kind: Service
metadata:
name: service-clusterip
namespace: dev
spec:
selector:
  app: nginx-pod
clusterIP: 10.97.97.97 # service的IP地址,如果不写,默认会生成一个
type: ClusterIP
sessionAffinity: ClientIP # 修改分发策略为基于客户端地址的会话保持模式
ports:
   - port: 80 # Service的端口
    targetPort: 80 # Pod的端口

10、再测试图片


无头 service

开发人员可能不想使用Service提供的负载均衡功能,而希望自己来控制负载均衡策略,针对这种情况,kubernetes提供了HeadLiness Service,这类Service不会分配Cluster IP,如果想要访问service,只能通过service的域名进行查询。

创建一个无头service:

apiVersion: v1
kind: Service
metadata:
name: service-headliness
namespace: dev
spec:
selector:
  app: nginx-pod
clusterIP: None # 将clusterIP设置为None,即可创建headliness Service
type: ClusterIP
ports:
 - port: 80    
  targetPort: 80

进入pod 中:

kubectl exec -it pc-deployment-6696798b78-2jpf4 -n w bash
# cat /etc/resolv.conf
nameserver 10.96.0.10
search w.svc.cluster.local svc.cluster.local cluster.local localdomain
options ndots:5

通过Service的域名进行查询:

dig @10.96.0.10 service-headliness.w.svc.cluster.local

service-headliness.w.svc.cluster.local.30 IN A10.244.102.155
service-headliness.w.svc.cluster.local.30 IN A10.244.102.154
service-headliness.w.svc.cluster.local.30 IN A10.244.102.156