开篇：《SpringAI+DeepSeek 大模型应用开发实战》

崔将军的AI学习笔记

2025-07-05 167 阅读7分钟

初识

Transformer 的诞生与发展
- 提出背景：2017 年 6 月，谷歌在论文《Attention Is All You Need》中提出 Transformer 架构，首次仅以注意力机制实现序列建模与转换，打破 RNN、CNN 主导的传统架构，为 NLP、CV 等领域带来范式变革。
- 技术突破：
  - 创新点：通过多头注意力机制实现并行计算，解决 RNN 无法并行训练、长序列依赖丢失问题，简化模型结构。
  - 性能优势：在 WMT2014 英德翻译任务中，Transformer 将 BLEU 值从 28.4 提升至 28.5；英法翻译任务中达到 41.8 BLEU，刷新当时机器翻译最佳成绩。
  - 训练效率：使用 8 块 P100 GPU 训练仅需 3.5 天，较当时主流模型大幅降低计算资源与时间成本。

ChatGPT 的诞生与发展
- 发展脉络：
  - 2018 年 6 月，OpenAI 发布基于 Transformer 的 GPT-1，首次验证预训练 + 微调模式在 NLP 的有效性。
  - 2022 年 11 月，基于 GPT-3.5 的 ChatGPT 上线，通过对话式交互降低 AI 使用门槛，引发全球 AI 应用热潮。
- 产品特点：
  - 交互能力：基于大规模语料训练，可理解复杂语义、上下文关联，实现类人对话。
  - 生成能力：支持文章撰写、代码生成、创意策划等多场景内容输出。
  - 影响：推动 AI 应用从实验室走向消费端，加速企业 AI 战略布局与行业技术迭代。

各行业接入 DeepSeek 情况
- 技术优势：
  - 成本效益：据公开测试数据，相比同类模型，DeepSeek 推理效率提升 3 倍，显存占用降低至 1/5 。
  - 模型规模：“满血版” 671B 参数模型，可处理多模态、复杂逻辑推理任务。
- 行业应用：
  - 金融领域：陆金所将 DeepSeek 应用于智能客服、风险评估等 9 大场景，提升服务效率与风控能力。
  - 教育领域：武汉大学等高校引入其辅助教学，如智能答疑、论文辅助写作。
  - 政务系统：广东、江苏等地将其集成至政务服务平台，优化民生问题智能解答。
  - 电力行业：9 家央企完成技术对接，用于电网故障预测、智能巡检等场景。

Java 的发展与现状
- 市场表现：自 1995 年发布以来，Java 在 TIOBE 编程语言排行榜中 83 次登顶（截至 2024 年），全球运行超 25 亿个 Java 服务。
- 行业覆盖：作为主流后端语言，占据 90% 以上后端开发市场，广泛应用于金融、电信、物联网等 91% 的行业领域。

传统 Java 应用 AI 化面临的问题
- 技术缺口：缺乏适配 Java 生态的统一大模型开发框架，未形成标准化开发流程与技术方案。
- 人才缺口：兼具 Java 开发与 AI 算法能力的复合型人才稀缺，传统 Java 开发者需补足 AI 算法、模型部署等技能。

Spring AI 的诞生
- 框架特点：继承 Spring 生态 “约定优于配置” 理念，模块化集成主流 AI 组件（如 LLM 调用、向量数据库适配）。
- 技术价值：提供标准化开发模板，降低 Java 应用接入 AI 的技术门槛；与 DeepSeek 等模型协同，实现从开发到部署的技术闭环。

笔记重点
- 目标：聚焦 SpringAI 核心技术，覆盖模型接入、API 调用、业务场景开发等全流程能力培养。
- 案例体系：通过多模态对话机器人、智能客服系统、知识库问答等实战项目，强化工程实践能力。

学习要求
- 技术基础：需掌握 JavaWeb 开发、熟练使用 SpringBoot 框架，熟悉 MyBatis/Plus 数据持久化操作。
- 环境要求：开发环境需配置 JDK 17 及以上版本，推荐使用 IntelliJ IDEA 等主流开发工具。

笔记内容
- 知识模块：
  - AI 基础：涵盖 Transformer 架构演进、大模型原理、注意力机制等核心知识。
  - 应用开发：包含模型部署方案、API 调用规范、微服务集成技术。
  - 实战进阶：涉及会话管理优化、向量数据库应用、多模态交互实现。
- 技术要点：Function Calling 功能设计、RAG（检索增强生成）架构搭建、流式响应技术优化。

知识小结

知识点	核心内容	重点 / 易混淆点	难度系数
Transformer 算法	2017 年谷歌在论文《Attention Is All You Need》中提出，以注意力机制替代 RNN、CNN，实现序列建模与转换，推动 AI 领域变革。其多头注意力机制可并行计算，解决长序列依赖问题，大幅提升训练效率与模型性能，在 NLP、CV 等领域广泛应用。	自注意力机制的计算原理与工作流程；Transformer 与 RNN 在处理长序列数据时的性能差异；多头注意力机制中 “头” 的作用及与单头注意力的区别。	⭐⭐⭐
GPT 系列发展	2018 年 OpenAI 发布基于 Transformer 的 GPT-1，验证预训练 + 微调模式在 NLP 领域的有效性；2022 年基于 GPT-3.5 的 ChatGPT 问世，通过对话式交互降低 AI 使用门槛，引发全球 AI 应用热潮，推动 AI 从实验室走向消费端。	各版本 GPT 发布时间及技术迭代差异；ChatGPT 与 GPT-3.5 的关系；GPT 系列与其他大语言模型（如 BERT）的技术路线对比。	⭐⭐
DeepSeek 模型	国产开源大模型，以低成本、高性能著称，推理效率较同类模型提升 3 倍，显存占用降低至 1/5，“满血版” 具备 671B 参数。已在金融、教育、政务、电力等多行业落地，助力中小企业降低 AI 应用门槛。	DeepSeek 与 GPT-4 在性能指标（如推理速度、参数量、任务准确率）上的对比；开源特性对技术生态发展的意义；不同行业应用场景中的优化策略。	⭐⭐⭐⭐
Spring AI 框架	基于 Spring 生态设计，采用 “约定优于配置” 理念，模块化集成大模型开发组件（如 LLM 调用、向量数据库适配），提供标准化开发范式，降低 Java 应用 AI 化门槛，可与 DeepSeek 等模型形成技术闭环，解决传统 Java 开发与 AI 融合的技术难题。	Spring AI 与 Spring Boot/Spring Cloud 的兼容性；如何解决国内大模型平台（如百度文心一言、阿里云通义千问）的适配问题；框架中各模块的功能划分与使用场景。	⭐⭐⭐⭐
大模型应用开发技术	涵盖多模态交互（文本、图像、语音融合）、会话记忆管理（上下文理解与历史对话衔接）、Function Calling（模型调用外部函数）、向量数据库（高效存储与检索嵌入向量）等技术，其中 Prompt Engineering（提示工程）是优化模型输出的关键实践。	Function Calling 的调用机制与安全风险；向量数据库的选型与数据向量化处理；Prompt 设计的核心原则（如清晰指令、示例引导、角色设定）；多模态数据融合的技术难点。	⭐⭐⭐⭐
实战案例	包括多模态对话机器人（支持图文问答、语音交互）、智能客服系统（自动应答、工单生成）、ChatPDF（文档内容理解与问答）等场景开发，涉及大模型与数据库、微服务的协同，需解决数据处理、模型部署、实时响应等技术难点。	数据库与大模型的数据交互流程（如 RAG 架构设计）；高并发场景下的模型调用优化；多模态机器人中不同模态数据的预处理与融合策略；智能客服系统的意图识别与对话逻辑设计。	⭐⭐⭐⭐⭐
学习门槛	需具备 Java Web 开发经验，熟练使用 Spring Boot 框架，掌握 MyBatis/Plus 数据持久化操作；开发环境需配置 JDK 17+，推荐使用 IntelliJ IDEA 等工具。学习过程中常遇环境配置冲突、依赖版本不兼容等问题。	JDK 17 新特性与旧版本的差异；Spring Boot 与 Spring AI 的依赖冲突解决方案；MyBatis/Plus 在大模型项目中的数据查询优化；不同 IDE 环境配置的注意事项（如 Maven/Gradle 配置）。	⭐⭐⭐