打开抖音时一般会使用到哪些协议
1 抖音网络是怎么交互的
1.网络接入
先让手机能访问抖音服务器
1.1 网络接入-互联网
1.2 路由
不同网段发包/交互
路由主要属于IP层,一部分属于传输层。
路由不是改IP地址,是改MAC地址,找到发包口
void send_one_pkt()
{
rt = find_rt(dst) //包含主机出口网口&Nexthop
...
l2->dst_mac = rt->next_hop->mac //怎么获取路由的mac
p = append(p,l2)
...
send(p,rt_port) //发包需要指定网卡为什么
}
动态路由BGP/OSPF等
1.3 ARP协议-找下一跳的mac
逻辑同网段才能发送ARP
ARP请求广播,ARP应答单播
免费ARP?ARP代理
ARP本质上是查找下一跳的MAC,不是请求目标地址
1.4 IP地址
唯一标识,互联网通用。抖音客户端一个,抖音服务端一个。
Mac地址不能代替IP地址吗
Ipv4不够用,一般怎么解决
1.5 NAT
内部用户通过NAT,改写原地址,局域网里可以使用同一IP,但到外部网是由NAT改写为不同的IP。
多个内网客户端访问同一个目标地址+端口,源端口恰好一样,冲突了,解决方案。
NAT不仅改IP,还会改端口。
2 将我的服务开放给用户
系统的熟悉和学习到企业级网络接入核心组件及基本原理
当面试,别人问到你从输入网页加载到内容加载出来,可以和别人能交谈
可以自己从零到一搭建属于自己的网站/博客(网络基础设施)
当访问服务器出现问题时,可以针对性的进行故障分析及解决
2.1 接入问题引入
经典问题: 浏览器输入网站域名www.toutiao.com 到网页加载出来,都经历了哪些过程?
1.域名解析
2.TCP建连
3.SSL握手
浏览器抓包
根源或者本质?
graph TD
DNS --> TCP --> TLS --> HTTP请求
2.2 字节接入框架
A life of a request
3 域名系统
3.1 Host管理
example公司
主机表
Host-> ip 映射
随着example公司业务规模和员工数量增长,使用该方式面临诸多问题。
流量和负载:用户规模指数级增长,文件大小越来越大,统一分发引起较大的网络流量和cpu负载
名称冲突:无法保证主机名称的唯一性,同名主机添加导致服务故障
时效性:分发靠工人上传,时效性太差
解决方法:使用域名系统替换hosts文件
关于域名空间:
域名空间被组织成树形结构
域名空间通过划分zone的方式进行分层授权管理
全球公共域名空间仅对应一棵树
根域名服务器:查询起点
域名组成格式:[a-zA-Z0-9],以点划分label
顶级域gTLD:.gov、.edu、.com、.mil、.org
域名报文格式:
3.1.1 域名购买与配置迁移
域名购买:
购买二级域名:example.com
域名备案:防止在网上从事非法的网站经营活动,打击不良互联网信息的传播,一般在云厂商处即可实名认证并备案。
修改配置:清空/etc/hosts
配置/etc/resolv.conf中的nameservers为公共DNS迁移原配置,通过控制添加解析记录即可
3.1.2 如何开放外部用户访问
如何建设外部网站,提升公司外部影响力?
方案:租赁一个外网ip,专用于外部用户访问门户网站,将www.example.com 解析到ip100.1.2.3,将该ip绑定到一台物理机上,并发布公网route,用于外部用户访问
4 自建DNS服务器
4.1 问题
内网域名的解析也得出公网去获取,效率低下
外部用户看到内网ip地址,容易被hacker攻击。
云厂商权威DNS容易出故障,影响用户体验
持续扩大公司品牌技术影响力,使用自己的DNS系统
4.2 DNS查询过程
4.3 DNS记录类型
A/AAAA:IP指向记录,用于指向IP,前者为IPv4记录,后者为Ipv6记录
CNAME:别名记录,配置值为别名或主机名,客户端根据别名继续解析以提取IP地址
TXT:文本记录,购买证书时需要
MX:邮件交换记录,用于指向邮件交换服务器
NS:解析服务器记录,用于指定哪台服务器对于该域名解析
SOA记录:起始授权机构记录,每个zone有且仅有唯一的一条SOA记录,SOA是描述zone属性以及主要权威服务器的记录
4.4 权威DNS系统架构
思考:站在企业角度思考,我们需要的是哪种DNS服务器?
答案:权威DNS、LocalDNS(可选)
常见的开源DNS:bind、nsd、knot、coredns
DNS Query
DNS Response
DNS Update
DNS Notify
DNS XFR
经过研发人员的不断努力,example公司有了自己的权威DNS系统。
5 接入HTTPS协议
页面出现白页/出现某些奇怪的东西
返回了403的页面
搜索不了东西
搜索问题带了小尾巴,页面总是要闪几次
页面弹窗广告
搜索个汽车就有人给我打电话推销4s店和保险什么的
HTTP明文传输,弊端越来越明显
https不就是http后面加了个s吗?
5.1 对称加密和非对称加密
常见的加密算法:
对称加密:一份秘钥
非对称解密:公钥和私钥
5.2 SSL的通信过程
client random
Server random
premaster secret
加密算法协商
graph TD
加密算法协商 --> 对称密钥sessionkey
5.3 证书链
公钥确定是可信的吗?会不会被劫持?
Server 端发送是带签名的证书链
Client收到仍然会验证
5.4 使用https
6 接入全站加速
6.1 背景
外网用户访问站点,一定是一帆风顺的吗?可能出现的问题有哪些?
源站容量低,可承载的并发量请求数低,容易被打垮
报文经过的网络设备越多,出问题的概率越大,丢包、劫持、mtu问题
自主选路网络链路长,时延高
响应慢、卡顿
极大的流失了大部分的用户群体,NPS留存率数据不乐观。
6.2 解决方案
源站容量问题 增加后端机器扩容;静态内存,使用静态加速缓存
网络传输问题 动态加速DCDN
全站加速 静态加速+动态加速
6.2.1 静态加速 CDN
当前的访问过程
针对静态文件传输,网络优化方式?
缓存
解决服务器端的“第一公里”问题
缓解甚至消除了不同运营商之间互连的瓶颈造成的问题
解决了各省的出口带宽压力
优化了网上热点内容的问题
6.2.2 动态加速 DCDN
针对POST等非静态请求等不能在用户边缘缓存的业务,基于智能选路技术,从众多回源路线中择优选择一条线路进行传输。
6.2.3 DCDN原理
RTT示例:
用户到核心:35ms
用户到边缘:20ms
用户到汇源:10ms
用户到核心:10ms
常规请求耗时计算:
Via DCDN:100ms
20(TCP)+20* 2(TLS)+20+10+10(routine)
Direct:140ms
35(TCP)+35 * 2(TLS)+35(routine)