大模型

大模型

大模型

大模型学习

暂无订阅共4篇文章创建于2025-03-09

双卡4090 vllm启动Qwen/Qwen3-30B-A3B-FP8

1.下载模型和安装vllm 2. vLLM启动 3.curl测试 curl查看模型 curl http://localhost:30000/v1/models curl测试问题: 答案如下: 牛逼啊轻

10月前
1.7k
点赞
评论

Kimi 7B 语音转文字

1. 模型准备 2. 安装和初步推理 clone仓库需要clone整个子模块安装完依赖后使用python infer.py测试

10月前
459
3
评论

jina-embeddings-v3模型本地GPU使用教程

如何在本地GPU环境中使用jinaai/jina-embeddings-v3模型生成文本嵌入向量。jina-embeddings-v3是一款拥有5.7亿参数的先进文本嵌入模型，支持89种语言，最大输入

12月前
1.3k
点赞
评论

QwQ 32B AWQ实践记录

阿里QwQ-32B推理模型本地部署教程 1.下载权重和环境安装 pip安装vllm版本 2.vllm 启动serve 2.1 curl 测试 curl -H "Authorization: Beare

1年前
639
点赞
评论