开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第2天,点击查看活动详情
很多互联网大企业都会有自己的数据中心,里面存储了大量的用户数据、网络资源等。例如我们访问Bilibili的某个视频,App发送的请求会分发给数据中心,在里面查找完后再返回给用户。数据中心按照类型有专用数据中心和云数据中心以及混合数据中心。
- 专用数据中心是不向外提供服务的,例如Facebook中大量的用户数据,仅供研究。
- 云数据中心会向外提供服务,例如阿里云、亚马逊云等,他们一般会使用虚拟化技术。类似于操作系统中的虚拟化,所有的程序都认为自己占用的是CPU和内存的所有资源,云服务的用户也认为自己是在独占一个物理机。
- 混合数据中心综合上述两者。
云数据中心有以下几个特点:
- pay-as-you-go:付多少钱给多少资源
- 根据需求动态扩展:例如双十一,阿里会挪用部分用户的机器充当大量交易的算力。
- 多租户:多个用户共用一台物理机,但是不同用户不能互访资源
- 动态管理:可靠(失效隔离)、迁移(边缘计算认为,资源放在越靠近用户,响应速度更快,所以需要将数据从数据中心迁移到边缘计算机中)
数据中心如何对外工作?(举例)
- 用户在浏览器搜索周杰伦
- 用户代理会将该请求传给TLA(Top level aggregation)
- TLA向下传给MLA(Middle level aggregation)
- MLA向下传给worker
- 很多worker查找内容,有的worker查找文本,有的查找图片、歌曲等等。
- 将查到的内容向上传递,一直传到TLA,TLA会对其进行排序,然后显示给用户。
数据中心网络VS互联网
- 互联网有很多自治域,而数据中心网络只有一个域,它是一个局域网
- 互联网是分布式控制,而数据中心是集中的
- 在发送包进行路由查找时,互联网是按一条最短路径,而DCN是多条路一起查找,这样能够均衡负载
传统DCN结构问题
- 静态网络配置,出现单点故障时不能工作
- 资源割裂,例如左边需求大于资源,而右边相反。另外,它的服务器不可移动的(得改IP)
- 带宽保障不行,下面许多A累计带宽很大,而上面CR的累计带宽很小
改进——Fat tree
- k个pod,一个pod是一组服务器的集合,途中所有的交换机都是K端口的(图中是4)
- 边缘交换机(Eage),有四个端口,两个(k/2)向上,两个向下。
- 汇聚交换机(Aggregation),也是两个向上(连着核心交换机Core),两个向下
- 总共有(k/2)^2=4个核心交换机。每个核心交换机第i个端口连接第i个pod
Fat-Tree的特性
- 能耗很低:不需要很多接口的交换机
- 所有交换机都一样,制作成本能够降低
- 扩展性高:例如上面4端口的交换机可以支持(K^3)/4=16个服务器。24端口能支持3456个服务器
Fat-Tree的不足
- 不支持动态迁移,也就是服务器从pod1到pod2需要换IP
- 需要定制化路由(Fat-Tree路由)