该系列博客是记录自己的学习笔记,若有错误请大佬们指出
狗头声明,本文适用于:新手学习进步,老鸟回顾消遣
该系列以《图解HTTP》为基本路线,该书有11章节,所以本系列也决定编写11篇水文技术博客进行适当的拓展和补充,希望可以帮助大家。
1、代理、网关、与隧道
在HTTP通信中,除了客户端与服务器外,还有一些转发通信数据的应用程序,例如代理、网关、与隧道,配合服务器工作。
(1)、HTTP代理
代理(Proxy)是一种有转发功能的应用程序,它扮演了位于服务器和客户端“中间人”的角色,接收由客户端发送的请求并转发给服务器,同时也接收服务器返回的响应并转发给客户端。
代理服务器的基本行为就是接收客户端发送的请求后转发给其他服务器。代理不改变请求 URI,会直接发送给前方持有资源的目标服务器。
持有资源实体的服务器被称为源服务器。从源服务器返回的响应经过代理服务器后再传给客户端。
为什么不直接找
源服务器去获取资源呢?显然是因为不能直接获取,所以要个能直接获取到该资源的中间人做代理。例如:小明经常浏览社交网站,这个网站IP假设为www.zhihu.com(6.6.6.6), 公司发现了,将6.6.6.6 过滤(Block)掉
小明急中生智,使用了代理:
代理IP = 9.9.9.9
代理端口 =9999
小明和代理建立TCP连接(9.9.9.9:9999),把自己的需求告诉代理,想访问"www.zhihu.com"
代理用自己的IP与6.6.6.6:80建立另外一个TCP连接,并将6.6.6.6:80返回的Http网页,原封不动地发给小明,使用的是代理TCP连接。 简而言之:代理是中间人,使用代理的主机发出的IP报文的目的IP是代理的,但是会在应用层里明确告诉代理,自己真实需求是什么?
所以代理的存在就是解决一些问题的,因为通过一个“中间层”可以解决很多事情,如负载均衡、内容缓存、安全防护、加密等等
所以有一句至理名言,解决编程问题的心法就是:“计算机科学领域里的任何问题,都可以通过引入一个中间层来解决”
各种代理方式
- 缓存代理:代理转发响应时,缓存代理(Caching Proxy)会预先将资源的副本(缓存)保存在代理服务器上。
当代理
再次接收到对相同资源的请求时,就可以不从源服务器那里获取资源,而是将之前缓存的资源作为响应返回。 - 透明代理:转发请求或响应时,不对报文做任何加工的代理类型被称为透明代理(Transparent Proxy)。反之,对报文内容进行加工的代理被称为非透明代理。
- 正向代理:靠近客户端,代表客户端向服务器发送请求;
- 反向代理:靠近服务器端,代表服务器响应客户端的请求;
反向代理与负载均衡
反向代理面向客户端时屏蔽了源服务器,客户端看到的只是代理服务器,源服务器究竟有多少台、是哪些 IP 地址都不知道。于是代理服务器就可以掌握请求分发的“大权”,决定由后面的哪台服务器来响应请求。
常用的负载均衡算法的目标都是尽量把外部的流量合理地分散到多台源服务器,提高系统的整体资源利用率和性能。
代理相关的HTTP头部字段
由图可知,Via 是一个通用字段,请求头或响应头里都可以出现。每当报文经过一个代理节点,代理服务器就会把自身的信息追加到字段的末尾,就像是经手人盖了一个章。
(2)、网关
《图解HTTP》的网关讲的很简略,但是网关好像比较复杂,不过暂时也没有用到它的地方,秉承着用不着学了也没用的懒人心法,这里就不拓展学习。
网关是转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,它就像自己拥有资源的源服务器一样对请求进行处理。 有时客户端可能都不会察觉,自己的通信目标是一个网关。
网关的工作机制和代理十分相似。而网关能使通信线路上的服务器提供非HTTP协议服务。
利用网关能提高通信的安全性,因为可以在客户端与网关之间的通信线路上加密以确保连接的安全。比如,网关可以连接数据库,使用SQL语句查询数据。另外,在 Web 购物网站上进行信用卡结算时,网关可以和信用卡结算系统联动
(3)、隧道
隧道可按要求建立起一条与其他服务器的通信线路,届时使用SSL等加密手段进行通信。隧道的目的是确保客户端能与服务器进行安全的通信。
隧道本身不会去解析 HTTP 请求。也就是说,请求保持原样中转给之后的服务器。隧道会在通信双方断开连接时结束
2、缓存代理
上文提到的“缓存代理”是需要展开学习的。缓存在第四章的拓展中学习了;代理在本文了解了,所以现在可以更好的了解“缓存代理”。
正如本文标题所言,缓存代理是HTTP与Web服务器的协作;当然与304相关,缓存代理是第四章缓存的拓展,后续是全栈了再进行拓展我就是懒。
《图解HTTP》的缓存代理讲解,就一两面,先了解即可