NVIDIA Blackwell NVFP4 内核黑客马拉松技术挑战

4 阅读3分钟

概述

欢迎参加开发者内核黑客马拉松,这是一项由某机构与 GPU MODE 合作主办的四部分性能挑战活动。

本次活动邀请开发者挑战 GPU 性能极限,并为某机构 Blackwell 硬件优化低层级内核,以实现最高效率。

在整个黑客马拉松期间将发布四个问题,参赛者将竞相编写接近“光速”性能的内核代码。

无论您是经验丰富的内核开发者,还是渴望测试自己的极限,本次黑客马拉松都为您提供了展示专业知识和加入世界级开发者社区的机会。

特别感谢我们的合作伙伴:

  • Sesterce,一个高性能 GPU 云平台,将为整个竞赛的参与者提供 DGX B200 计算资源支持。
  • 某机构将提供一台配备 GB300 的 Dell Pro Max 作为大奖。

日程安排

每个内核问题将按顺序发布。一个问题结束后,另一个问题随即开始。

  • 内核问题 #1 - NVFP4 批处理 GEMV
    • 11月10日 - 11月28日
  • 内核问题 #2 - NVFP4 GEMM
    • 11月29日 - 12月19日
  • 内核问题 #3 - NVFP4 门控双 GEMM
    • 12月20日 - 1月16日
  • 内核问题 #4 - NVFP4 分组 GEMM
    • 1月17日 - 2月13日

如何参与

  • 仅限个人参与(不接受团队)。
  • 请于 2026 年 2 月 13 日前通过本页面注册,以获得获奖资格。
  • 加入 GPU MODE 的 Discord,并前往 nvidia-competition 频道获取公告、参与讨论、提问和寻求帮助。
  • 可以使用 Popcorn CLI 提交作品。请按照此处的设置和提交说明操作: 👉 github.com/gpu-mode/po…

奖项

四个内核问题中的每一个都将有 3 名获奖者,他们将获得最新一代的某机构硬件。此外,在所有问题的加权总和中表现最接近光速的参赛者将获得一个大奖。

每个问题的前 2 名获奖者还将受邀参加 2026 年 3 月在圣何塞举行的 GTC 特别颁奖典礼。

  • 💥 大奖:
    • 1× 配备 GB300 的 Dell Pro Max + GTC 2026 通行证 – 授予在四个问题中任何一项提交的作品性能最接近光速的参与者。
  • 🏆 每个内核问题的奖项:
    • 总共四个内核问题,每个问题将有各自的获奖者:
      • 🥇 第一名: 某机构 DGX Spark + GTC 2026 通行证
      • 🥈 第二名: 某机构 RTX 5090 + GTC 2026 通行证
      • 🥉 第三名: 某机构 RTX 5080

评分与评审

  • 将有四个独立的问题,分别单独评分。
  • 每个问题中排名前 3 的提交作品将获奖。
  • 大奖将授予总体性能最快内核的参与者,评判标准是接近该特定内核问题发布的“光速”性能。
  • 提交的作品将使用 GPU MODE 的基础设施在 NVIDIA GPU 上进行基准测试。
  • 评分基于绝对运行时间以及与基线参考内核的相对加速比。

额外资源

如需学习资源,请查看并订阅 GPU MODE 的 YouTube 频道,您可以在那里找到来自机器学习社区顶尖人士(包括某机构的研究人员和工程师)的每周讲座。

条款与条件

参与本次黑客马拉松需遵守官方条款与条件。 🔗 查看完整的条款与条件