青训营X豆包MarsCode 技术训练营第一课 | 豆包MarsCode AI 刷题

65 阅读3分钟

简介:本文是个人入门ai模型训练的了解相关介绍,主要有关大模型的定义和入门训练模型langchain的搭载使用。

一、大语言模型

  1. 大语言模型是使用深度学习技术(如神经网络)的人工智能模型,参数数量多,通过 “猜词” 基于大量训练数据理解和生成人类语言,能体现对上下文及世界常识的认知,但并不完全理解语言,可能会犯错误或生成不合理内容。

LangChain

  1. 是基于大语言模型预测能力的应用开发工具,具有灵活性和模块化特性,支持 Python 和 JavaScript 版本,本教程使用 Python 版本。

  2. 安装方法:

    • 基本安装:pip install langchain
    • 安装时引入常用开源 LLM 库:pip install langchain[llms],并更新到最新版本。
    • 从源代码安装:克隆存储库并运行pip install -e
  3. LangChain 的预构建链功能像乐高积木,方便开发者快速构建项目或定制功能链条。

  4. GitHub 社区活跃,可找到大量教程和最佳实践,其 API 文档是重要参考,遇到问题可更新版本或提交问题反馈。

###这里想说下,刚入手搭配环境很多语法都不清楚看不懂,还是推荐完整的,点击量高的视频学习,掌握常见语法,当然还有大佬的每日博客也值得推荐!

OpenAI API

  1. LangChain 本质上是对各种大模型 API 的套壳,了解 OpenAI API 的基本设计思路有助于理解 LangChain 底层逻辑。

  2. OpenAI API 中重点说明的两类模型是 Chat Model 和 Text Model:

    • Chat Model 用于产生人类和 AI 之间的对话,代表模型有 gpt - 3.5 - turbo(ChatGPT)和 GPT - 4 等,可接收消息列表作为输入,适合处理对话或多轮次交互,能管理对话历史和进行角色模拟。
    • Text Model 在 ChatGPT 之前常用,代表模型是 text - davinci - 003,可接收对话输入返回回答文本,对于简单单轮文本生成任务可能更适合。
  3. 使用 OpenAI API 的步骤:

    • 注册账号并获取 API Key。
    • 安装 OpenAI 库(pip install openai)。
    • 导入 API Key(可通过设置环境变量等方式)。
    • 导入 OpenAI 库并创建 Client。
    • 指定模型并调用相应方法,如 Text 模型调用completions.create,Chat 模型调用chat.completions.create
    • 打印输出大模型返回的文字。 ###/这里补充下掘金ai练中也会有些老版语法,遇到问题多问问ai(p:里面的自带的不太全面)。

总结时刻

  1. 理解了 OpenAI 从 Text 模型到 Chat 模型的进化,以及在不同场景下选择使用的模型。掌握了这两种模型的基本调用流程,为后续学习打下基础。
  2. 大语言模型并非 OpenAI 一家独大,HuggingFace 网站提供很多开源模型,但该领域进展迅速,流行的开源模型会不断变化,且新的开源模型可能暂时不容易通过 LangChain 使用,但 LangChain 作为流行的 LLM 框架,迟早会封装新的开源模型,其框架和组件设计基本固定。 ###/ai模型出现也不短,记得今年年初还跟着一个哔哩的音色模型训练的视频学习过,那个也算精细化了有很多参数可选(不过电脑配置要求高,得训练个六七小时,最后没捣鼓成功),昨天刚试了火山方舟里面的,很简单,二十秒的wav文件几分钟就出结果,(p:应该还算可以),刚好青训营眼熟选了ai方向,希望通过这中间不断学习,在这一方面不断精进,也能做出点有意思的东西。