Datawhale组队学llm-universe task01

57 阅读2分钟

开始

最近正好在尝试用把AI嵌入到自己的web应用里头去,目前尝试的主要是langchain4j和springAI,正好来组队学习。

正文

LLM简介

(LLM,Large Language Model),基于transformer的神经网络,当参数叠加到一定量产生了质变,这就是我们今天熟知的大语言模型。特点和应用大家已经很熟了,可以快速过一下,我觉得主要还是分类和预测。

RAG

检索增强生成(RAG, Retrieval-Augmented Generation) 。该架构巧妙地整合了从庞大知识库中检索到的相关信息,并以此为基础,指导大型语言模型生成更为精准的答案,从而显著提升了回答的准确性与深度。 这门技术其实传统开发就已经用到了,主要是搜索引擎场景使用,把文本转成向量(多个维度的特征),帮助更准确地查找有管理的词,后面可以了解一下elasticsearch、milvus这些,提示模型性能性价比很高的一种方式。

langchain

LangChain 框架是一个开源工具,充分利用了大型语言模型的强大能力,以便开发各种下游应用。它的目标是为各种大型语言模型应用提供通用接口,从而简化应用程序的开发流程。 用python写的一个大模型开发框架,方便调各种工具,可以配合fastapi嵌入网站。对于传统的java程序员,我们可以考虑一下langchain4j。这里主要熟悉核心组件和生态。

开发流程

主要还是搭建-调试-迭代,和网站开发基本一致,不过方法上有所差异。

服务器搭建

  1. 在校的同学记得领个优惠。
  2. 搭建ECS,码农可以跳过这步
  3. vscode 远程连接开发,码农可跳过
  4. Jupyter Notebook 搞数据科学的同学应该比较熟悉了
  5. GitHub Codespaces 非必须,github连接不稳定的同学不推荐,直接把代码clone到本地练习就好

总结

datawhale的同学教程做的很用心,在介绍技术的同时还不忘帮大家试水各种开发工具和平台(内附服务器羊毛),对于平民新手玩家可以说是非常友好了,不愧是以学习者为中心的组织,也期待我的试水过程能丰富平台内容。