AI大模型技术社

AI大模型技术社

AI大模型技术社

让更多人拥抱AI，成就自我

等 8 人订阅共17篇文章创建于2025-06-10

🚀重构LLM开发生态：无状态Reducer+小型Agent架构实战指南

为构建可靠、可维护且可扩展的 LLM 应用，避免一些非确定性 AI 组件带来的一些意图理解的偏差、上下文管理的混乱、人机协作的断层等问题，我将通过12-Factor Agents框架，提炼出了12项原

3月前
61
点赞
评论

🚀重构LLM开发生态：无状态Reducer+小型Agent架构实战指南

⚡深入解析 ReAct 代理模式：从原理到原生实现

一、ReAct 模式：AI 代理的“思考-行动”循环 ReAct（Reasoning + Action）是一种让大语言模型（LLM）自主完成任务的核心架构。与传统直接生成答案的模式不同，ReAct 要

4月前
150
点赞
评论

⚡深入解析 ReAct 代理模式：从原理到原生实现

🔥【2025高频面试题】AI大模型岗位面试题之 Prompt 提示词工程

1. 什么是Prompt（提示词）？在AI大模型语境下，它的核心作用是什么？答案： Prompt是用户提供给大语言模型（LLM）的输入文本或指令，用于引导和激发模型生成符合期望的输出。它的核心作用

4月前
211
1
评论

🔥【2025高频面试题】AI大模型岗位面试题之 Prompt 提示词工程

⚡上下文工程：优化智能体性能的关键策略

智能体在执行长期任务时，上下文窗口（类似计算机的RAM）的容量有限，易导致性能下降、成本飙升或幻觉问题。上下文工程正是为解决这些问题而生。它通过精心筛选、存储和优化上下文信息，确保智能体高效运行。本文

4月前
95
点赞
评论

⚡上下文工程：优化智能体性能的关键策略

🚀解锁RAG精度：200-800 Token分块大小的黄金法则，别再犯这些错！

引言：分块——RAG系统的命脉在RAG架构中，分块是连接原始文档和语义检索的桥梁。它决定了嵌入模型能否精准捕捉文本语义，以及LLM能否生成高质量回答。许多开发者误以为“越大越好”，直接将整篇文档喂给

5月前
446
4
评论

🚀解锁RAG精度：200-800 Token分块大小的黄金法则，别再犯这些错！

✅2025全网最具权威深度解析并手写RAG Pipeline

为了帮助大家从底层更好地理解 RAG 的工作原理，带你撕开技术黑箱，仅用numpy等Python基础库构建RAG系统，从零手撕RAG内核！从文本划分、向量化、相似度检索到生成优化，逐行代码解剖检索增强

5月前
1.8k
5
1

✅2025全网最具权威深度解析并手写RAG Pipeline

🔥企业级必读：筛选高可用MCP服务的黄金标准

一、MCP vs Function Call：本质差异与协议优势核心能力对比协议层创新：关键突破：通过context字段实现跨工具会话状态保持，解决复杂任务中的信息孤岛问题。二、环境配置：跨平

5月前
9.2k
8
1

🔥企业级必读：筛选高可用MCP服务的黄金标准

RAG三阶段避坑指南：解决召回不全/上下文冗余/事实错误

从理论到实践，全面解析RAG性能瓶颈与高阶优化方案。一、RAG核心架构全景图 RAG性能瓶颈分析二、检索阶段深度优化 1. 多路召回架构实现 2. 重排序优化（Cross-Encoder）优化效

6月前
375
1
评论

RAG三阶段避坑指南：解决召回不全/上下文冗余/事实错误

工业级Transformer优化手册：混合精度训练+量化部署实战解析

一、Transformer训练过程深度剖析 1.1 训练流程全景图 1.2 关键训练技术 1.2.1 教师强制（Teacher Forcing） 1.3 损失函数与优化策略损失函数选择：分类任务：

6月前
2.6k
3
评论

工业级Transformer优化手册：混合精度训练+量化部署实战解析

💻 工业级代码实战：TransformerEncoderLayer六层堆叠完整实现（附调试技巧）

一、Transformer编码器整体结构 Transformer编码器由N个相同层堆叠而成，单层结构包含：二、核心技术解析与实现 1. 位置编码（Positional Encoding）为什么需要

6月前
2.7k
1
评论

💻 工业级代码实战：TransformerEncoderLayer六层堆叠完整实现（附调试技巧）

⚙️企业级Transformer优化：混合精度×梯度裁剪×权重初始化最佳实践

一、自注意力机制：Transformer的核心突破核心思想：让每个位置都能关注序列中所有位置的信息 1.1 Query-Key-Value 抽象模型 QKV角色解析： Query（查询）：当前关注的

6月前
1.4k
1
评论

⚙️企业级Transformer优化：混合精度×梯度裁剪×权重初始化最佳实践

🔧 PyTorch高阶开发工具箱：自定义模块+损失函数+部署流水线完整实现

一、自定义神经网络层：释放模型设计潜能核心原理：继承nn.Module并实现forward方法 1.1 实现带权重归一化的全连接层 1.2 实现可学习参数激活函数自定义层设计原则：始终继承nn.

6月前
1.5k
点赞
评论

🔧 PyTorch高阶开发工具箱：自定义模块+损失函数+部署流水线完整实现

循环神经网络全景图：从基础RNN到注意力增强的演进之路

一、RNN：序列建模的基石核心思想：引入时间维度的循环连接数学表达： h_t = f(W_{xh}x_t + W_{hh}h_{t-1} + b_h) y_t = g(W_{hy}h_t + b_

6月前
1.0k
1
1

循环神经网络全景图：从基础RNN到注意力增强的演进之路

PyTorch手撕CNN：可视化卷积过程+ResNet18训练代码详解

本文系统解构卷积神经网络（CNN）核心技术，涵盖三大核心板块。 1.基础原理深度解析 2.四大经典架构复现 3.工业级实战指南提供16个可运行代码块+6张原理图示，涵盖从基础操作到生产部署全链路

6月前
1.1k
点赞
评论

PyTorch手撕CNN：可视化卷积过程+ResNet18训练代码详解

神经网络学习路线图：从感知机到Transformer的认知跃迁

本文是神经网络核心原理的深度技术解析，通过数学推导与完整代码实现相结合的方式，系统拆解从感知机到反向传播的完整知识体系。

6月前
1.9k
1
1

神经网络学习路线图：从感知机到Transformer的认知跃迁

线性代数：AI大模型开发的数学基石（附核心代码与图解）

一、向量：高维空间的数据载体物理意义：带方向的量，AI中表示特征/词嵌入核心操作：二、矩阵：神经网络的基础结构核心作用：全连接层权重：W ∈ ℝ^(m×n) 图像数据：[height, wi

6月前
1.7k
4
评论

线性代数：AI大模型开发的数学基石（附核心代码与图解）

机器学习10大必懂概念全解析：5大技术破解过拟合/欠拟合困局

一、机器学习基础：监督vs无监督学习监督学习通过带标签数据训练预测模型，核心是学习输入到输出的映射关系：无监督学习发现数据内在结构，无需标签指导：二、过拟合与欠拟合：模型泛化诊断模型复杂度与泛

6月前
58
点赞
评论

机器学习10大必懂概念全解析：5大技术破解过拟合/欠拟合困局