HTTP 是一个在计算机世界里专门在两点之间传输文字、图片、音频、视频等超文本数据的约定和规范
-
http:超文本传输协议(Hypertext Transfer Protocol)
-
URI :统一资源标识符(Uniform Resource Identififier)
-
URL:统一资源定位符(Uniform Resource Location)
-
URN:统一资源名
-
CDN: 内容分发网络(Content Delivery Network)它应用了 HTTP 协议里的缓存和代理技术,代替源站响应客户端的请求。简单来说,它可以缓存源站的数据,让浏览器的请求不用“千里迢迢”地到达源站服务器,直接在“半路”就可以获取响应。如果 CDN 的调度算法很优秀,更可以找到离用户最近的节点,大幅度缩短响应时间。
-
DNS:域名系统(Domain Name System)用有意义的名字来作为 IP 地址的等价替代
-
Crawler:爬虫--可以自动访问 Web 资源的应用程序,爬虫来由:绝大多数是由各大搜索引擎“放”出来的,抓取网页存入庞大的数据库,再建立关键字索引,这样我们才能够在搜索引擎中快速地搜索到互联网角落里的页面。爬虫缺点:过度消耗网络资源,占用服务器和带宽,影响网站对真实数据的分析,甚至导致敏感信息泄漏。所以,又出现了“反爬虫”技术,通过各种手段来限制爬虫。其中一项就是“君子协定”robots.txt,约定哪些该爬,哪些不该爬。
-
WAF:网络应用防火墙,专门检测 HTTP 流量,是防护 Web 应用的安全技术
-
TCP/IP:一系列网络通信协议的统称,TCP--传输层、IP--网际层(主要目的是解决寻址和路由问题,以及如何在两点间传送数据包)
-
TCP:传输控制协议(Transmission Control Protocol),它位于 IP 协议之上,基于 IP 协议提供可靠的、字节流形式的通信,是 HTTP 协议得以实现的基础。“可靠”是指保证数据不丢失,“字节流”是指保证数据完整
HTTP 是一个"传输协议",但它不关心寻址、路由、数据完整性等传输细节,而要求这些工作都由下层来处理。因为互联网上最流行的是 TCP/IP 协议,而它刚好满足 HTTP 的要求,所以互联网上的 HTTP 协议就运行在了 TCP/IP 上,HTTP 也就可以更准确地称为“HTTP over TCP/IP“
- HTTPS:“HTTP over SSL/TLS”运行在 SSL/TLS 协议上的 HTTP
- SSL/TLS:安全传输协议-- 综合了对称加密、非对称加密、摘要算法、数字签名、数字证书等技术
- Proxy:代理是 HTTP 协议中请求方和应答方中间的一个环节,作为“中转站”,既可以转发客户端的请求,也可以**转发服务器的应答。正向代理:**靠近客户端,代表客户端向服务器发送请求,**反向代理:**靠近服务器端,代表服务器响应客户端的请求;由于代理在传输过程中插入了一个“中间层”,所以可以在这个环节做很多事情:负载均衡:把访问请求均匀分散到多台机器,实现访问集群化;内容缓存:暂存上下行的数据,减轻后端的压力;安全防护:隐匿 IP, 使用 WAF 等工具抵御网络攻击,保护被代理的机器;数据处理:提供压缩、加密等额外的功能。