Web 容器以进程的方式在计算机上运行,我们知道进程是系统资源分配的最小单元,线程是系统任务执行的最小单元。从这个角度看,Web 容器就像是邮包收件人所居住的楼宇或小区,HTTP 这套物流快递体系只能将邮包投递到楼宇前台或者小区物业等处,而楼宇前台或小区物业并不属于物流快递体系,就像 Web 容器并不属于计算机网络基础设施一样。之所以这样分工,原因是网络路由信息由域名服务器 DNS、路由器等设备掌握,Web 容器内部体系结构信息只有它自己知道。从 Web 容器接收到 HTTP 请求,到将其投送至特定的应用,这期间还会经历一个复杂的过程,了解这个过程对于日常开发和问题分析都会有所帮助。接下来,老兵哥我将陪着你一起来剖析这个过程。
JAVA 语言领域的 Web 容器类型非常多,包括 Tomcat、Jetty、Resin、Websphere、Weblogic、JBoss、Glassfish、GonAS 等,其中 Tomcat 是由 Apache Software Foundation 维护的开源 Web 容器。Tomcat 市场占用率接近 60%,截止目前是最受欢迎的 Web 容器,如下图所示横跨 Web 服务器和 Java 应用服务器。
我们就以 Tomcat 为例来看看 Web 容器的内部结构,作为符合 JAVA Servlet 标准规范的容器,Tomcat 是一款基于组件的 Java Web 应用服务器,核心组件都是灵活可配的。Tomcat 最外层是 Catalina Servlet 容器,其他组件是按照特定格式要求配置在这个顶层容器当中,配置文件就是安装目录下的:/conf/server.xml。通过这份配置文件,我们就可以了解 Tomcat 的体系结构,示例文件如下所示(快速浏览一遍,后面详细剖析):
上述结构中包含了 Tomcat 的核心组件:Server 组件在最顶层,代表整个 Tomcat 容器。一个 Server 组件中可以包含一个或多个 Service 组件。Service 在 Connector 和 Engine 外面包了一层,把它们组装在一起对外提供服务。一个 Service 可以包含多个 Connector,但是只能包含一个 Engine。不同 Connector 负责接收不同端口上相应协议的请求,而 Engine 负责处理请求。Engine 包含一个或多个 Host,Host 包含一个或多个 Context,Engine、Host、Context 都属于容器组件,一个 Host 组件代表一个虚拟主机,一个 Context 组件代表在隶属 Host 上运行的一个 Web 应用。
2.1.1 顶层类组件 Server
它是整个配置文件的唯一根元素,代表整个 Tomcat 容器,内部可以包含多个 Service。Server 主要职责就是管理多个 Service,对外提供给客户端访问,同时维护所有 Service 的生命周期,包括初始化服务、结束服务、定位客户端要访问的 Service 等等。所有 Tomcat 组件的生命周期都是通过 Lifecycle 接口来控制的,组件只要继承这个接口并实现其中的方法就可以统一被父组件控制了,这样层层递进 Server 组件就可以控制所有组件的生命周期了,而控制 Server 就是通过启动和关停 Tomcat。在前面配置示例中,Server 的配置如下所示:
<Server port="8005" shutdown="SHUTDOWN">
其中,属性 shutdown 指定关闭 Server 的指令。属性 port 指定 Server 接收 shutdown 指令的端口号,设置为“-1”可以禁掉该端口。
2.1.2 顶层类组件 Service
Service 主要职责就是将 Engine 与 Connector 装配在一起对外提供服务,一个 Service 可以包含多个 Connector,但只能包含一个 Engine,其中 Connector 负责从客户端接收请求,Engine 负责处理 Connector 接收进来的请求。如前面配置示例中,Service 的配置如下所示:
<Service name="Catalina">
我们可以通过属性 name 为 Service 指定名称,不同的 Service 负责监管其下属 Connector 所绑定的端口。
2.1.3 连接器组件 Connector
Tomcat 的工作模式可以分为下面两类:
作为 Web 服务器:请求是直接来自于客户端 HTTP 请求(或浏览器)。
作为 Java Web 应用服务器:请求来自于前置 Web 服务器,通常包括:Apache、IIS、Nginx 等。Tomcat 主要优势是作为 JSP/Servlet 容器,在处理静态资源方面效率偏低。因此,它通常要跟 Apache、IIS、Nginx 等 Web 服务器集成使用。AJP 协议主要负责 Tomcat 和集成 Web 服务器的交互连接。
每个 Service 可以有一个或多个 Connector,不同工作模式下,Tomcat 需要为各种类型的请求分别定义相应的 Connector,这样才能正确接收客户端对应协议的请求。定义 Connector 可以使用多种属性,某些属性只适用于某种特定的 Connector 类型。一般说来,常见的 Connector 有 4 种类型:HTTP、SSL、AJP、Proxy。
作为通信接口,Connector 为其所属特定的 Service 接收外部客户端请求,以及回送应答至外部客户端。具体职责包括创建 Request、Response 对象用于跟外部客户端交换数据,并将 Request 交给配套的 Engine 来处理。通过修改 Connector 的属性取值,我们可以控制 Service 所监听的网络协议及端口号,具体示例如下:
Engine 内部可以包含多个 Host,它是 Service 组件中负责请求处理的组件。它从一个或多个 Connector 中接收请求并处理,并将处理结果封装成应答交给 Connector,最终回传给外部客户端。在前文配置文件示例中,Engine 的配置如下所示:
<Engine name="Catalina" defaultHost="localhost">
其中,属性 name 用于日志和错误信息,其取值在整个 Server 中保证唯一。属性 defaultHost 指定了默认的Host 名称,当 HTTP 请求所指定的 Host 名称不存在时,一律使用 defaultHost 指定的 Host 来处理。因此,defaultHost 的值,必须与 Engine 中的某个 Host 组件的属性 name 取值匹配。
2.1.5 容器类组件 Host
Host 代表一个虚拟主机,它对应计算机网络上的一个实体,即某个在 DNS 服务器上注册过的域名或者 IP 地址,例如:www.abc.com 或 201.187.10.21。Host 内部可以包含多个 Context,每个 Context 表示一个 Web 应用。Host 负责安装、展开、启动和结束每个 Web 应用。
其中,属性 name 指定虚拟主机的名称。属性 appBase 指定 Web 应用所在的目录,默认值是 webapps,这是一个相对路径,标识 Tomcat 安装根目录下的 webapps 文件夹。属性 unpackWARs 指定是否将 Web 应用的 WAR 文件解压。如果取值为 true,Tomcat 将以解压后的文件结构运行该 Web 应用;如果为 false,Tomcat 将直接使用 WAR 文件运行 Web 应用。属性 autoDeploy 指定是否自动部署 Web 应用。
2.1.6 容器类组件 Context
Context 代表在特定虚拟主机上运行的一个 Web 应用,负责处理某个特定 Web 应用的所有请求。每个 Web 应用要么基于 WAR 文件,要么基于 WAR 文件解压后对应的文件目录。在前文配置文件示例中,我们没有看到 Context 的配置,这是因为 Host 开启了自动部署,Web 应用没有在配置文件中配置静态部署,而是由 Tomcat 通过特定的规则自动部署,Context 组件也将被自动创建。Context 通过属性 path 来唯一标识自身。考虑到 Web 应用自动部署与本文主题关系不大,老兵哥我就不再展开,如果你对此内容感兴趣,可以找资料做扩展阅读。
从上述体系结构剖析来看,Tomcat 这款 Java Web 应用服务器的功能还是非常强大的,它可以在一个实例进程当中同时支持多种协议,同时支持多个虚拟主机,每个虚拟主机下还支持部署多款应用,具备强大的扩展性和灵活性。为什么它具备这样一种体系结构呢?这其实跟 Tomcat 诞生时的基础架构相匹配的,当时服务器是以小型机或 PC 服务器为主,缺乏现在容器这种切分资源的虚拟技术,进程是系统资源分配的最小单元。为了更加充分地利用每台计算机上的资源,我们通常要在同一台计算机上部署多款应用,但是在一台计算机上运行多个 Tomcat 实例所带来的复杂度是非常高的,不如在同一个 Tomcat 实例中部署多款 Web 应用,这样在配置运维等管理上面更加便利。
在这种架构下,Tomcat 处理 HTTP 请求就需要经过上述复杂的过程,这也再次印证老兵哥我坚信的一个观点:不存在绝对好或坏的架构,匹配当时业务场景的架构就是好架构!随着互联网业务的发展和云计算的兴起,为了更好地管理大规模应用集群,我们需要借助容器等虚拟化技术将大颗粒资源分割成更小的、标准的单元,每个容器中只安装一个 Web 容器,每个 Web 容器中只部署一个应用,在标装化下我们就可以采用云计算的自动化操作。
按照这个趋势发展下去,Web 容器的架构用不着这么复杂了,其价值也会不断弱化。以前,Tomcat 都是需要单独安装的,应用是后续再部署到 Tomcat 当中的。但目前在 Spring Boot 的开发模式下,Tomcat 是以 Starter 方式作为内嵌 Web 容器,它已经不再需要独立安装部署了。在越来越标装化的趋势下,Tomcat 基本上采用默认配置,用户基本上不用太关注它了。剖析了解它的原因,就是老兵哥我在开题中所说的:知其然,知其所以然。