浅谈数据中心网络(一)

146 阅读3分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第2天,点击查看活动详情

很多互联网大企业都会有自己的数据中心,里面存储了大量的用户数据、网络资源等。例如我们访问Bilibili的某个视频,App发送的请求会分发给数据中心,在里面查找完后再返回给用户。数据中心按照类型有专用数据中心和云数据中心以及混合数据中心

image.png

  1. 专用数据中心是不向外提供服务的,例如Facebook中大量的用户数据,仅供研究。
  2. 云数据中心会向外提供服务,例如阿里云、亚马逊云等,他们一般会使用虚拟化技术。类似于操作系统中的虚拟化,所有的程序都认为自己占用的是CPU和内存的所有资源,云服务的用户也认为自己是在独占一个物理机。
  3. 混合数据中心综合上述两者。

云数据中心有以下几个特点:

  1. pay-as-you-go:付多少钱给多少资源
  2. 根据需求动态扩展:例如双十一,阿里会挪用部分用户的机器充当大量交易的算力。
  3. 多租户:多个用户共用一台物理机,但是不同用户不能互访资源
  4. 动态管理:可靠(失效隔离)、迁移(边缘计算认为,资源放在越靠近用户,响应速度更快,所以需要将数据从数据中心迁移到边缘计算机中)

数据中心如何对外工作?(举例)

  1. 用户在浏览器搜索周杰伦
  2. 用户代理会将该请求传给TLA(Top level aggregation)
  3. TLA向下传给MLA(Middle level aggregation)
  4. MLA向下传给worker
  5. 很多worker查找内容,有的worker查找文本,有的查找图片、歌曲等等。
  6. 将查到的内容向上传递,一直传到TLA,TLA会对其进行排序,然后显示给用户。

image.png

数据中心网络VS互联网

  1. 互联网有很多自治域,而数据中心网络只有一个域,它是一个局域网
  2. 互联网是分布式控制,而数据中心是集中的
  3. 在发送包进行路由查找时,互联网是按一条最短路径,而DCN是多条路一起查找,这样能够均衡负载

传统DCN结构问题

image.png

  1. 静态网络配置,出现单点故障时不能工作
  2. 资源割裂,例如左边需求大于资源,而右边相反。另外,它的服务器不可移动的(得改IP)
  3. 带宽保障不行,下面许多A累计带宽很大,而上面CR的累计带宽很小

改进——Fat tree

image.png

  • k个pod,一个pod是一组服务器的集合,途中所有的交换机都是K端口的(图中是4)
  • 边缘交换机(Eage),有四个端口,两个(k/2)向上,两个向下。
  • 汇聚交换机(Aggregation),也是两个向上(连着核心交换机Core),两个向下
  • 总共有(k/2)^2=4个核心交换机。每个核心交换机第i个端口连接第i个pod

Fat-Tree的特性

  1. 能耗很低:不需要很多接口的交换机
  2. 所有交换机都一样,制作成本能够降低
  3. 扩展性高:例如上面4端口的交换机可以支持(K^3)/4=16个服务器。24端口能支持3456个服务器

Fat-Tree的不足

  1. 不支持动态迁移,也就是服务器从pod1到pod2需要换IP
  2. 需要定制化路由(Fat-Tree路由)