小白秒变AI大神!DeepSeek方+第三方+命令行调用指南,10分钟搞定

168 阅读4分钟

DeepSeek 介绍

DeepSeek 是杭州深度求索人工智能基础技术研究有限公司,开发的一个 AI 产品平台,这家公司陆续发布了多款大语言模型。对外提供了大模型服务与接口调用平台。

DeepSeek 模型列表

DeepSeek 陆续发布过如下大模型,目前最新的核心大模型是 DeepSeek V3 系列模型与 DeepSeek R1 模型。 {.audio .d-block}

  • DeepSeek R1
  • DeepSeek V3
  • DeepSeek Coder V2
  • DeepSeek VL
  • DeepSeek V2
  • DeepSeek Coder
  • DeepSeek Math
  • DeepSeek LLM

DeepSeek Chat V3 模型

DeepSeek V3 为自研混合专家模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。 DeepSeek V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1 405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

DeepSeek R1 模型

deepseek-reasoner 是 DeepSeek 推出的推理模型。在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。DeepSeek R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

核心模型价格

模型上下文长度最大思维链长度最大输出长度百万 tokens 输入价格(缓存命中)百万 tokens 输入价格(缓存未命中)百万 tokens 输出价格
chat64K-8K0.5 元2 元8 元
reasoner64K32K8K1 元4 元16 元

这是两个主要模型的参数和使用价格。核心参数是上下文 64k,最大输出 8k。虽然官方提供的服务是收费的,但是我们可以通过部署。 deepseek 的开源模型实现免费使用。在集成到 dify 的时候,你需要按照这些参数填写相关的配置。

DeepSeek 使用方式

DeepSeek 的使用方式主要包含如下几个方式。

  1. 通过 DeepSeek 官网
  2. 第三方服务,基于 DeepSeek 开源模型搭建起来的服务
  3. 官方的 API 调用,可以绕过一些界面问题
  4. 霍格沃兹测试开发学社搭建的 dify ollama 服务
  5. 本地部署开源版本的大模型

openai 命令行调用方式

pip install -U openai

openai \
  -b https://api.deepseek.com/v1/ \
  -k $DEEPSEEK_TOKEN \
  api chat.completions.create \
  -m deepseek-chat \
  -g user 我想学习短视频剪辑

openai -b https://api.deepseek.com/v1/ -k $DEEPSEEK_TOKEN api chat.completions.create -m deepseek-chat -g user 我想学习短视频剪辑

openai -b http://127.0.0.1:11434/v1/ -k $DEEPSEEK_TOKEN api chat.completions.create -m deepseek-r1 -g user 我想学习短视频剪辑

除了使用网页界面外,官方也支持通过多种其他的方式调用,比如命令行的方式、api 调用方式等。因为 DeepSeek 兼容 openai 的 api,所以我们可以使用 openai 的命令行工具进行调用。openai 的 python 包本身也是基于 http 接口进行的调用封装。

curl 命令调用方式

curl https://api.deepseek.com/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <DeepSeek API Key>" \
  -d '{
        "model": "deepseek-chat",
        "messages": [
          {"role": "system", "content": "You are a helpful assistant."},
          {"role": "user", "content": "Hello!"}
        ],
        "stream": false
      }'

当然也可以直接调用官方的 http 接口。使用任意语言或者 http 请求发送工具进行调用。

python 编程调用

# Please install OpenAI SDK first: `pip3 install openai`

from openai import OpenAI

client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "You are a helpful assistant"},
        {"role": "user", "content": "Hello"},
    ],
    stream=False
)

print(response.choices[0].message.content)

这是 openai python 库调用的例子,当然也可以使用任何第三方的封装库,因为 openai 的 api 已经是行业事实上的标准,而 DeepSeek 又兼容了 openai 的 api,所以所有的大模型开发框架都支持 DeepSeek。比如 lang chain langgraph autogen 等。

推荐阅读

软件测试/测试开发丨常见面试题与流程篇(附答案)

软件测试/测试开发丨学习笔记之Allure2测试报告

软件测试/测试开发丨Pytest测试用例生命周期管理-Fixture

软件测试/测试开发丨Python学习笔记之基本数据类型与操作

软件测试/测试开发丨学习笔记之列表、元组、集合

软件测试/测试开发丨Python常用数据结构-学习笔记

软件测试/测试开发丨Python控制流-判断&循环

软件测试/测试开发丨Python学习笔记之内置库科学计算、日期与时间处理

软件测试/测试开发丨面试题之软素质与反问面试官篇(附答案)

软件测试/测试开发丨iOS 自动化测试踩坑(一): 技术方案、环境配置与落地实践