获得徽章 0
vLLM 学习
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/
文章数
30
·
订阅人数
2
·
神经星星
Triton 学习
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →https://triton.hyper.ai/
文章数
40
·
订阅人数
2
·
神经星星
TVM 中文
汇集 TVM 中文学习资料、教程及案例,欢迎关注~
更多请访问:https://tvm.hyper.ai/
文章数
79
·
订阅人数
6
·
神经星星