首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大模型
aigonna
创建于2025-03-09
订阅专栏
大模型学习
暂无订阅
共4篇文章
创建于2025-03-09
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
双卡4090 vllm启动Qwen/Qwen3-30B-A3B-FP8
1.下载模型和安装vllm 2. vLLM启动 3.curl测试 curl查看模型 curl http://localhost:30000/v1/models curl测试问题: 答案如下: 牛逼啊轻
Kimi 7B 语音转文字
1. 模型准备 2. 安装和初步推理 clone仓库需要clone整个子模块 安装完依赖后使用python infer.py测试
jina-embeddings-v3模型本地GPU使用教程
如何在本地GPU环境中使用jinaai/jina-embeddings-v3模型生成文本嵌入向量。jina-embeddings-v3是一款拥有5.7亿参数的先进文本嵌入模型,支持89种语言,最大输入
QwQ 32B AWQ实践记录
阿里QwQ-32B推理模型本地部署教程 1.下载权重和环境安装 pip安装vllm版本 2.vllm 启动serve 2.1 curl 测试 curl -H "Authorization: Beare