Datawhale组队学llm-universe task01最近正好在尝试用把AI嵌入到自己的web应用里头去，目前尝

开始

最近正好在尝试用把AI嵌入到自己的web应用里头去，目前尝试的主要是langchain4j和springAI，正好来组队学习。

正文

LLM简介

（LLM，Large Language Model），基于transformer的神经网络，当参数叠加到一定量产生了质变，这就是我们今天熟知的大语言模型。特点和应用大家已经很熟了，可以快速过一下，我觉得主要还是分类和预测。

RAG

检索增强生成（RAG, Retrieval-Augmented Generation） 。该架构巧妙地整合了从庞大知识库中检索到的相关信息，并以此为基础，指导大型语言模型生成更为精准的答案，从而显著提升了回答的准确性与深度。这门技术其实传统开发就已经用到了，主要是搜索引擎场景使用，把文本转成向量（多个维度的特征），帮助更准确地查找有管理的词，后面可以了解一下elasticsearch、milvus这些，提示模型性能性价比很高的一种方式。

langchain

LangChain 框架是一个开源工具，充分利用了大型语言模型的强大能力，以便开发各种下游应用。它的目标是为各种大型语言模型应用提供通用接口，从而简化应用程序的开发流程。用python写的一个大模型开发框架，方便调各种工具，可以配合fastapi嵌入网站。对于传统的java程序员，我们可以考虑一下langchain4j。这里主要熟悉核心组件和生态。

开发流程

主要还是搭建-调试-迭代，和网站开发基本一致，不过方法上有所差异。

服务器搭建

在校的同学记得领个优惠。
搭建ECS，码农可以跳过这步
vscode 远程连接开发，码农可跳过
Jupyter Notebook 搞数据科学的同学应该比较熟悉了
GitHub Codespaces 非必须，github连接不稳定的同学不推荐，直接把代码clone到本地练习就好

总结

datawhale的同学教程做的很用心，在介绍技术的同时还不忘帮大家试水各种开发工具和平台（内附服务器羊毛），对于平民新手玩家可以说是非常友好了，不愧是以学习者为中心的组织，也期待我的试水过程能丰富平台内容。