简介:本文是个人入门ai模型训练的了解相关介绍,主要有关大模型的定义和入门训练模型langchain的搭载使用。
一、大语言模型
- 大语言模型是使用深度学习技术(如神经网络)的人工智能模型,参数数量多,通过 “猜词” 基于大量训练数据理解和生成人类语言,能体现对上下文及世界常识的认知,但并不完全理解语言,可能会犯错误或生成不合理内容。
LangChain
-
是基于大语言模型预测能力的应用开发工具,具有灵活性和模块化特性,支持 Python 和 JavaScript 版本,本教程使用 Python 版本。
-
安装方法:
- 基本安装:
pip install langchain。 - 安装时引入常用开源 LLM 库:
pip install langchain[llms],并更新到最新版本。 - 从源代码安装:克隆存储库并运行
pip install -e。
- 基本安装:
-
LangChain 的预构建链功能像乐高积木,方便开发者快速构建项目或定制功能链条。
-
GitHub 社区活跃,可找到大量教程和最佳实践,其 API 文档是重要参考,遇到问题可更新版本或提交问题反馈。
###这里想说下,刚入手搭配环境很多语法都不清楚看不懂,还是推荐完整的,点击量高的视频学习,掌握常见语法,当然还有大佬的每日博客也值得推荐!
OpenAI API
-
LangChain 本质上是对各种大模型 API 的套壳,了解 OpenAI API 的基本设计思路有助于理解 LangChain 底层逻辑。
-
OpenAI API 中重点说明的两类模型是 Chat Model 和 Text Model:
- Chat Model 用于产生人类和 AI 之间的对话,代表模型有 gpt - 3.5 - turbo(ChatGPT)和 GPT - 4 等,可接收消息列表作为输入,适合处理对话或多轮次交互,能管理对话历史和进行角色模拟。
- Text Model 在 ChatGPT 之前常用,代表模型是 text - davinci - 003,可接收对话输入返回回答文本,对于简单单轮文本生成任务可能更适合。
-
使用 OpenAI API 的步骤:
- 注册账号并获取 API Key。
- 安装 OpenAI 库(
pip install openai)。 - 导入 API Key(可通过设置环境变量等方式)。
- 导入 OpenAI 库并创建 Client。
- 指定模型并调用相应方法,如 Text 模型调用
completions.create,Chat 模型调用chat.completions.create。 - 打印输出大模型返回的文字。 ###/这里补充下掘金ai练中也会有些老版语法,遇到问题多问问ai(p:里面的自带的不太全面)。
总结时刻
- 理解了 OpenAI 从 Text 模型到 Chat 模型的进化,以及在不同场景下选择使用的模型。掌握了这两种模型的基本调用流程,为后续学习打下基础。
- 大语言模型并非 OpenAI 一家独大,HuggingFace 网站提供很多开源模型,但该领域进展迅速,流行的开源模型会不断变化,且新的开源模型可能暂时不容易通过 LangChain 使用,但 LangChain 作为流行的 LLM 框架,迟早会封装新的开源模型,其框架和组件设计基本固定。 ###/ai模型出现也不短,记得今年年初还跟着一个哔哩的音色模型训练的视频学习过,那个也算精细化了有很多参数可选(不过电脑配置要求高,得训练个六七小时,最后没捣鼓成功),昨天刚试了火山方舟里面的,很简单,二十秒的wav文件几分钟就出结果,(p:应该还算可以),刚好青训营眼熟选了ai方向,希望通过这中间不断学习,在这一方面不断精进,也能做出点有意思的东西。