学习1

0 阅读2分钟

LangChain学习笔记

学前:Chain是什么?它和直接调用API有什么区别? 通识:认识人工智能、了解神经网络原理(前向传播、计算误差、反向追责、调整权重)、大语言模型(Transformer根据概率输出,模型规模和训练数据量极大出现“涌现”,例如GPT) 、大模型应用(利用大模型的推理、分析、生成能力,结合传统编程的计算、控制能力来实现的混合式应用,例如ChatGpt)

准备工作: 大模型服务:①注册Deepseek,注册完毕之后,创建自己的API Key,管理好密钥。 接着再去接口文档中,调用API来访问Deepse模型,可以利用postman来发出post请求,来验证密钥是否成功创立; 问题1:发送post请求报错

  • 分析核心原因:Insufficient Balance余额不足,需要充值额度,才可以调用大模型 image.png

  • 利用工具调用Deepseek大模型成功 image.png

②注册阿里云百炼,新用户拥有众多免费的大模型试用,但有试用期。 同样创建API Key。不同的是,阿里云百炼可以在线体验大模型,还可以提交https请求调用API。 继续利用工具调用qianwen大模型

image.png

③注册Ollama,首先下去官网下载对应操作系统给的软件,注意区别开安装路径,在控制台输入*可指定安装路径

OllamaSetup.exe /DIR=X:\develop\ollama

接着按需下载对应的大模型

接口规范:URL;API_KEY;请求参数 model:模型名称 message:发送给模型的消息 stream:消息发送模式,流式或阻塞 system的content可以设定大模型的定位,还有temperature、top_p等参数

{
    "model": "deepseek-v4-pro",
    "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user",
            "content": "Hello!"
        }
    ],
    "thinking": {
        "type": "enabled"
    },
    "reasoning_effort": "high",
    "stream": false
}