
获得徽章 0
vLLM 学习
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/
2025-01-03 18:30
·
文章数
26
·
订阅人数
1
Triton 学习
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →https://triton.hyper.ai/
2024-10-17 18:14
·
文章数
35
·
订阅人数
2
TVM 中文
汇集 TVM 中文学习资料、教程及案例,欢迎关注~
更多请访问:https://tvm.hyper.ai/
2022-12-07 11:40
·
文章数
74
·
订阅人数
6