首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Seal软件
掘友等级
Seal数澈软件
Manage GPU clusters for running LLMs
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
45
文章 40
沸点 5
赞
45
返回
|
搜索文章
最新
热门
GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型
千呼万唤,GPUStack 迄今最受用户关注、超多新功能的版本重磅发布!文生图模型、Speech-to-Text 语音模型和 Text-to-Speech语音模型、推理引擎版本管理、离线支持等各种特性
配置NVIDIA Container Runtime和容器运行GPUStack教程
配置 NVIDIA Container Runtime 容器运行时环境,并使用容器方式运行 GPUStack 的操作教程
RAG三件套运行的新选择 - GPUStack
安装 GPUStack 和 Dify,并使用 Dify 来对接 GPUStack 部署的对话模型、Embedding 模型和 Reranker 模型。
制作并量化GGUF模型上传到HuggingFace和ModelScope
使用 llama.cpp 制作并量化 GGUF 模型,并将模型上传到 HuggingFace 和 ModelScope 模型仓库
在昇腾Ascend 910B上运行Qwen2.5推理
使用 GPUStack 在昇腾 Ascend 910B 上运行 Qwen2.5 全系列的推理性能表现
GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略
GPUStack 0.2 版本新增了单机多卡分布式推理、跨主机分布式推理、纯 CPU 推理、Binpack 和 Spread 放置策略以及指定 Worker 调度、手动指定 GPU 调度等核心特性。
GPUStack正式发布: 为大模型而生的开源GPU集群管理器
GPUStack 正式发布并开源,一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。https://gpustack.ai
建立成功平台工程的关键:自助式 IaC
让我们来探讨一下平台工程的好处、成功的平台团队用于授权开发人员自助服务基础架构的三种主要方法,以及选择支持所用方法的基础架构即代码(IaC)框架的重要性。
不谈虚的,平台即产品真的有那么好吗?
在本篇文章中,我们将抛开媒体的宣传和炒作,从开发人员的角度出发更加客观地来审视 PaaP,谈谈企业组织在采用该策略时需要考虑哪些要素。
API 开发的后盾:平台工程提供强力动态支持
根据平台工程的基础概念和定义,了解平台工程通过改进开发者体验、整合、管理内部API等方式,促进API开发
下一页
个人成就
优秀创作者
文章被点赞
219
文章被阅读
96,437
掘力值
5,775
关注了
0
关注者
86
收藏集
0
关注标签
11
加入于
2022-06-12