在本地运行大语言模型有诸多优点:
比如可以保护隐私、不会产生费用、可以无视网络问题、可以尝鲜各种开源模型等等。
Ollama是本地部署并运行LLM的工具。
Ollama支持当前主要的开源大模型, 比如llama2、千文qwen、mistral等。
下载并安装 Ollama
Ollama下载地址:ollama.com/download
安装开源模型
现在Ollama已经安装完了,我们需要在终端中输入下方命令运行一个大语言模型进行测试,这里以对在中文方面表现相对好些的千问为例,大家也可以使用其他的模型。
ollama run qwen2
命令行运行本地模型
上一步是首次安装模型,安装完成后再次运行 ollama run qwen2
命令行运行的效果:
在浏览器中运行 qwen2
a、首先安装一个Docker容器,下载地址:www.docker.com/products/do…
正常安装就行了。
b、然后安装 docker
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
运行这条命令去拉取 Open WebUI 的 docker 镜像并运行
修改端口映射,映射到 localhost:3000 端口
最后去访问 localhost:3000 随便注册一个用户名密码
c、选择语言和模型