首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
GPUStack
掘友等级
高性能模型推理平台
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
GPUStack
6小时前
关注
GPUStack v2:推理加速释放算力潜能,开源重塑大模型推理下半场
在大模型推理的下半场,GPUStack v2 不再是简单的模型服务平台,而是高性能推理生态的协调者与赋能者。...
0
评论
分享
GPUStack
1月前
关注
0.9B PaddleOCR-VL 登顶 SOTA!GPUStack 高效推理部署实战指南
百度发布0.9B的PaddleOCR-VL模型登顶SOTA!来看如何通过GPUStack高效推理部署,体验行业顶尖的OCR文档解析模型。...
0
评论
分享
GPUStack
1月前
关注
昇腾多机推理极速上手:10倍简化的 DeepSeek R1 超大规模模型部署
昇腾多机推理太复杂?易出错?试试 GPUStack。通过 GPUStack 快速在昇腾上丝滑运行 MindIE 分布式推理...
0
评论
分享
GPUStack
3月前
关注
忘掉Ollama! 将GPT OSS私有部署推理性能提升100倍的部署教程
基于开源大模型服务平台 GPUStack 与自定义安装的 vLLM 版本完成 GPT OSS 系列模型的生产部署推理。并对比 Ollama 与 vLLM 在生产并发场景下的...
0
评论
分享
GPUStack
4月前
关注
GPUStack v0.7重磅发布:macOS与Windows安装包、昇腾MindIE多机推理、模型使用计量与寒武纪MLU支持
GPUStack 是一个 100% 开源的模型服务平台,支持多种 GPU(如 NVIDIA、AMD、Apple Silicon、昇腾、寒武纪等)构建异构 GPU 集群...
0
评论
分享
GPUStack
7月前
关注
45分钟从零搭建私有MaaS平台和生产级的Qwen3模型服务
在 45 分钟内搭建 GPUStack 模型服务平台并运行生产级的 Qwen3 模型服务的操作教程。...
0
评论
分享
GPUStack
7月前
关注
GPUStack v0.6超重磅更新:vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复,上百项增强打造最好用的模型推理平台
vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复,上百项增强打造业界最好用的模型推理平台。...
0
评论
分享
GPUStack
7月前
关注
GPUStack v0.5:模型Catalog、图生图功能上线,多维优化全面提升产品能力与使用体验
GPUStack 是一个专为运行 AI 模型设计的开源 GPU 集群管理器,致力于支持基于任何品牌的异构 GPU 构建统一管理的算力集群。无论这些 GPU 运行在 Appl...
0
评论
分享
GPUStack
11月前
关注
GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型
千呼万唤,GPUStack 迄今最受用户关注、超多新功能的版本重磅发布!文生图模型、Speech-to-Text 语音模型和 Text-to-Speech语音模型、推理引擎...
0
评论
分享
GPUStack
1年前
关注
配置NVIDIA Container Runtime和容器运行GPUStack教程
配置 NVIDIA Container Runtime 容器运行时环境,并使用容器方式运行 GPUStack 的操作教程...
0
评论
分享
GPUStack
1年前
关注
RAG三件套运行的新选择 - GPUStack
安装 GPUStack 和 Dify,并使用 Dify 来对接 GPUStack 部署的对话模型、Embedding 模型和 Reranker 模型。...
0
评论
分享
GPUStack
1年前
关注
制作并量化GGUF模型上传到HuggingFace和ModelScope
使用 llama.cpp 制作并量化 GGUF 模型,并将模型上传到 HuggingFace 和 ModelScope 模型仓库...
1
评论
分享
GPUStack
1年前
关注
在昇腾Ascend 910B上运行Qwen2.5推理
使用 GPUStack 在昇腾 Ascend 910B 上运行 Qwen2.5 全系列的推理性能表现...
0
评论
分享
GPUStack
1年前
关注
GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略
GPUStack 0.2 版本新增了单机多卡分布式推理、跨主机分布式推理、纯 CPU 推理、Binpack 和 Spread 放置策略以及指定 Worker 调度、手动指定...
0
评论
分享
GPUStack
1年前
关注
GPUStack正式发布: 为大模型而生的开源GPU集群管理器
GPUStack 正式发布并开源,一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。https://gpustack.ai...
0
评论
分享
个人成就
文章被点赞
1
文章被阅读
4,503
掘力值
216
关注了
0
关注者
4
收藏集
0
关注标签
14
加入于
2024-06-24