Herdsman(牧马人本地推理引擎) 是一个基于 Go 语言构建的 AI 模型全生命周期管理工具。它旨在简化本地 AI 模型的下载、安装、管理以及运行过程,并对外提供兼容 OpenAI 格式的标准化 API 接口,让开发者能够轻松构建基于本地大模型的应用。
🚀 Herdsman概述
Herdsman(牧马人本地推理引擎) 作为一个"模型管家",解决了本地部署 AI 模型时的复杂性问题。它不仅支持文本生成(LLM),还支持向量化(Embedding)、重排序(Reranker)、语音识别(ASR)和图像生成(Image Generation)等多种任务。
核心能力:
- 模型全生命周期管理:自动化的模型下载、校验、解压安装和版本控制
- 多模态支持:支持 Qwen/GLM/DeepSeek/Mistral/Phi 等 LLM,BGE 等 Embedding 模型,FunASR 等语音模型,以及 Stable Diffusion 图像生成模型
- 硬件感知与适配:自动检测运行环境(CPU/GPU),支持 NVIDIA/AMD/Intel 等多种硬件架构,智能选择最佳运行时配置
- 标准化接口:提供完全兼容 OpenAI 的 Chat/Embeddings/Images API,可无缝对接现有应用生态
- 插件化运行时:通过统一的 Runtime 接口封装底层推理引擎(如
llama.cpp、foundry-local、funasr等),屏蔽不同推理后端的差异
- 可视化管理面板:提供现代化的 Web 管理界面,支持模型管理、对话交互、图像生成等功能
Herdsman官网地址:FlowyAIPC — 让你的PC真正成为主动生产工具