Ollama 本地部署 qwen2 模型

1,361 阅读1分钟

在本地运行大语言模型有诸多优点:

比如可以保护隐私不会产生费用可以无视网络问题可以尝鲜各种开源模型等等。

Ollama是本地部署并运行LLM的工具。

Ollama支持当前主要的开源大模型, 比如llama2、千文qwen、mistral等。

Ollama官网上的开源模型列表。

下载并安装 Ollama

Ollama下载地址:ollama.com/download

安装开源模型

现在Ollama已经安装完了,我们需要在终端中输入下方命令运行一个大语言模型进行测试,这里以对在中文方面表现相对好些的千问为例,大家也可以使用其他的模型。

ollama run qwen2

命令行运行本地模型

上一步是首次安装模型,安装完成后再次运行 ollama run qwen2

命令行运行的效果:

在浏览器中运行 qwen2

a、首先安装一个Docker容器,下载地址:www.docker.com/products/do…

正常安装就行了。

b、然后安装 docker

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

运行这条命令去拉取 Open WebUI 的 docker 镜像并运行

附:Open WebUI github 地址

修改端口映射,映射到 localhost:3000 端口

最后去访问 localhost:3000 随便注册一个用户名密码

c、选择语言和模型