开发者故事 | 高校研究生利用 DOCA 提升数据中心网络传输性能

avatar

NVIDIA DOCA 先行者 · 开发者故事系列第一弹来啦!

在年初结束的 NVIDIA DOCA 应用代码分享活动中,我们见证了开发者们的奇思妙想。在一众优秀的参赛者中,有五位开发者脱颖而出获得奖项,并在此讲述他们参赛的心路历程以及与 DOCA 结缘的故事。

我们第一期的故事主角是本次活动一等奖得主陈勤。作为计算机科学与技术专业在读硕士研究生,陈勤在初次接触 NVIDIA DOCA 软件框架时就定下了自己的目标——利用 DOCA 解决数据中心高性能网络传输的流控问题。如今,他将这一想法成功地落到了实践上。

破局之作:基于 DOCA 的自适应路由

陈勤本次创作的项目题为“基于 DOCA 的自适应路由”,该项目通过 NVIDIA BlueField-2 DPU 卸载基于主动探测的自适应路由算法,实现了 VXLAN 等 Overlay 流量的逐流负载均衡。通过该项目,陈勤不仅探索了基于 DPU 的新型负载均衡方案的可行性和有效性,还提供了有效的源代码和测试数据作为支持。

**进入 Github 查看项目详情:**github.com/markchen778…

**创作背后的挑战:**用 DOCA 驱动数据中心网络负载均衡

随着云计算和 AI 等技术的蓬勃发展,数据中心网络负载均衡一直是热议话题。为了解决数据中心高性能网络传输的流控问题,陈勤根据过去几年的开发经验,构思出了比较适合卸载到 NVIDIA BlueField-2 DPU 上的调度算法——通过 DOCA 的核心功能 DOCA-Flow 和 DPU 的基础功能进行流量转发和处理,卸载了一些主机上的流量调度功能。

在利用 DOCA-Flow 的一些 API 进行开发的过程中,陈勤也遇到了一些意料之外的挑战,比如某些流表的下发逻辑虽然能够编译通过,但是运行时却出现异常。经过反复修改和尝试,陈勤最终将代码调整到符合自己的预期,这个过程需要大量的耐心。

谈及此次活动的参与心得,陈勤表示:“把 DOCA 的应用代码放在开源平台上跟大家分享,不仅对高性能网络和 AI 基础架构研发人员有一定的借鉴意义,对我个人来说,也能够通过这次活动认识到更多身处相同研究领域的开发者,让我了解到行业内对 DPU 的关注点集中在何处。”

DOCA 先行者快问快答

Q 您是从什么渠道了解到 DOCA 的?什么契机使您成为 DOCA 开发者?

A 我是通过导师的介绍和 NVIDIA 的公众号了解到 DOCA 的。因为我的研究方向就是 SmartNIC 相关,而 NVIDIA BlueField 系列 DPU 产品是行业佼佼者且生态友好,所以立马就注册了。

Q 最初从事 DOCA 开发时,有具体明确的目标吗?

A 主要想利用 DOCA 解决数据中心高性能网络传输的流控问题,DPU 是可编程的基础设施,所以想借此自定义相关协议的流控,譬如利用 PCC 开发一些自定义的拥塞控制算法。

Q 除了这次活动,可以分享一下过往其他成功的 DOCA 开发经历吗?

A 我还参加了2022 年举办的 DOCA 有奖征文比赛,详细介绍了 NVIDIA BlueField-2 DPU 和 DPDK 的开发入门指南,拿了不错的名次。

Q 您对 DOCA 的评价如何呢?

A 我觉得 DOCA 的文档很齐全,生态友好,希望能加强和高校的合作。

Q 您觉得成为 DOCA 开发者对您的生活和工作带来了哪些改变?

A 为我带来了潜在的工作机会,我在社区也获得了其他 DOCA 开发者和很多前辈的肯定,让我对自己更有信心。

Q NVIDIA DOCA 中国开发者社区对您有哪些帮助?

A 在这里我可以及时获取 DOCA 最新版本的情况,结识更多相同领域的开发者,并能时常获得社区专家的答疑解惑,有很大的成长。

“随着 AI 技术的蓬勃爆发,网络成为分布式训练的瓶颈,利用 DPU 来探索提升高性能网络表现是一个行之有效的路径。希望以后能和更多 DOCA 开发者一起推动高性能网络和异构计算的发展。”——NVIDIA DOCA 应用代码分享活动一等奖获得者 陈勤

加入我们,共建 DOCA 开发者生态

截止目前,全球共有 14000 多名 DOCA 开发者,其中近一半来自中国。NVIDIA DOCA 中国开发者社区还在不断壮大,各种丰富的活动与内容也将持续呈现。

欢迎点击:developer.nvidia.cn/doca-sdk-ea… 立即注册并下载 NVIDIA DOCA,开启您的开发之旅!让我们一起用 DOCA 创造价值!

GTC 2024 大会高性能 AI 网络会议中文专场将于 3 月 19 日下午 14:00 在线举办。

注册**/****观看链接:**www.nvidia.cn/gtc-global/…

(请点击“Add to schedule" 注册,大会开始后登陆即可观看)

观众专属福利

  • 3 月 24 日前观看专场演讲视频,线上签到并成功加入微信群的观众将获得 NVIDIA 撰写的全球首本《数据处理器: DPU 编程入门》书籍。
  • 3 月 19 日当天,前十名在线提问的观众将额外获得 NVIDIA 官方 T 恤衫一件。

一起探讨人工智能网络的核心技术实现及其正在发挥的重要作用。