大语言模型

大语言模型

大语言模型

大语言模型相关的算法、工程实现及优秀项目

等 16 人订阅共59篇文章创建于2023-11-21

RAG Chunking 2.0:提升文档分块效果的一些经验

在基于大语言模型的RAG系统里，文本分块是非常关键的一步。分块做得好，后续的向量检索、结果召回和生成质量都会更稳更准。

3月前
171
1
评论

RAG Chunking 2.0:提升文档分块效果的一些经验

RAG的另一种思路，基于文档树结构的推理型检索

在过去两年中，RAG已经成为几乎所有AI应用的标配。无论是智能客服、企业知识库、财务分析还是法律文件问答，它们都遵循相同的逻辑流程：文档分割、向量化、向量相似度匹配、大模型生成答案。

3月前
247
点赞
评论

AI Agent上下文工程设计指南｜附实用工具推荐

上下文工程需要不断地迭代调试和总结经验，简单的方法论无法覆盖其设计的方方面面。本文仅对上下文工程的开发和设计模式进行了阐述，并列举出了一些常见的Agent开发工具，希望对于开发Agent的读者有些启发

4月前
611
9
1

AI Agent上下文工程设计指南｜附实用工具推荐

解密vLLM：基于nano-vllm源码剖析其推理加速之道

vLLM对于部署过大模型的人来说应该都不算陌生, 它能极大提升LLM的服务吞吐量，显著降低推理成本。vLLM成功的核心秘诀在于一项名为 PagedAttention 的技术及其配套的调度策略。

4月前
393
点赞
评论

解密vLLM：基于nano-vllm源码剖析其推理加速之道

VLM做文档OCR效果如何？我拿了几个常见模型进行对比

国内已经有不少专门针对OCR任务进行训练的开源VLM了。成绩打榜是一方面，实际用起来效果如何、好不好用可能又是另一方面。因此，本文将对比几款最近比较流行的VLM模型

4月前
256
点赞
评论

VLM做文档OCR效果如何？我拿了几个常见模型进行对比

Embedding Gemma，谷歌发布的小而精向量模型，仅需0.3B｜附RAG实战代码

EmbeddingGemma是Google发布的开源小规模多语言文本嵌入模型，旨在常见设备上高效运行，同时在 MTEB / MMTEB 等评测任务中保持与同类模型相当的性能

5月前
544
3
评论

Embedding Gemma，谷歌发布的小而精向量模型，仅需0.3B｜附RAG实战代码

UltraRAG：一个基于MCP协议，完全模块化的RAG框架

UltraRAG作为一个RAG框架，比较适合RAG科研人员使用，可以快速实验各种复杂的 RAG 策略，而无需重写大量代码，只需修改 YAML 文件。

5月前
224
点赞
评论

UltraRAG：一个基于MCP协议，完全模块化的RAG框架

aisuite：统一的大模型SDK，简化LLM开发流程

aisuite作为一个开源的Python库，通过提供统一的接口和灵活的模型切换机制，简化了跨多个LLM提供商的集成过程。对于经常使用不同LLM的开发者来说，可以显著降低开发门槛，提高开发效率.

5月前
279
2
评论

aisuite：统一的大模型SDK，简化LLM开发流程

Deep Research的架构演进：从Multi Agent到Supervisor-Researcher模式的技术实践

随着LLM的能力越来越强，Agent设计中更多决策权会交给模型，但是在Deep Research这种场景下，好像还是以工作流作为基本实现思路会更加合适一些，用于确保生成研究内容的质量下限。

6月前
421
1
评论

Gemini CLI源码解析：深入工具系统的实现细节

之前的文章介绍过主控Agent以及上下文实现的细节，除了主控Agent和上下文管理外，工具实现也是Agentic的一个重要环节。

6月前
242
点赞
评论

Gemini CLI源码解析：深入工具系统的实现细节

GLM-4.5系列模型导读，综合能力更强的高性价比模型

在沉寂了半年之后，智谱推出了新一代开源模型GLM-4.5系列，采用MOE架构并使用混合推理模式。模型统一提升了在推理、代码与智能体等多方面的能力，专为复杂智能体应用打造。

6月前
653
点赞
评论

Gemini CLI源码解析：Agent与上下文管理实现细节

gemini-cli 从开源至今仅一个多月，已经收获接近65K Star，作为第一个开源的通用命令行智能体工具，现如今功能已经非常完善。本文将对源码进行解析，学习其中优秀Agent设计思路

6月前
823
2
评论

Gemini CLI源码解析：Agent与上下文管理实现细节

构建AI智能体的“上下文工程”方法论：Manus团队的实战经验

上下文工程已成为现代AI Agent系统不可或缺的一部分。无论模型本身如何进化，对上下文的建模、维护、裁剪与反馈机制的设计，将决定一个智能体是否稳健、高效、可扩展。

6月前
132
点赞
评论

构建AI智能体的“上下文工程”方法论：Manus团队的实战经验

Kimi k2：最大开源Agentic LLM，Claude开源平替

月之暗面发布的Kimi K2，具有目前开源模型中最大的参数量，具备非常强的coding能力。该模型从一开始就清晰地把Agentic作为该模型的核心能力，包括模型训练的整个过程都蕴含对该能力的重视

7月前
541
1
评论

OCRFlux-3B：开源 OCR + LLM 模型的新标杆，支持跨页表格合并

OCRFlux-3B 是目前业内首个开源支持跨页结构智能合并的模型，不仅精度高，而且支持关键的结构化能力，并且能够在消费级硬件上运行，实用性极高。

7月前
394
点赞
评论

OCRFlux-3B：开源 OCR + LLM 模型的新标杆，支持跨页表格合并

Prompt Engineering vs Context Engineering：我们与LLM交互方式的演变

Prompt Engineering 是我们与 LLM 交互的原始技巧，但随着智能体的开发，我们需要的不再是简单的文本生成器，而是一个智能助手。

7月前
379
点赞
评论

Nanonets-OCR：Qwen2.5VL-3B的微调模型更强大的文档解析能力|附效果实测

Nanonets-OCR不再满足于单纯提取文本，它能智能解析图像中的公式、表格、水印、签名、图表、复选框等复杂结构，并输出格式清晰的 Markdown。

7月前
285
点赞
评论

MonkeyOCR：用三元组范式重构文档解析与识别

MonkeyOCR提出一种新的SRR三元组架构，结合传统两种文档解析方式的优化，在精度和效率上都有不错的表现。

7月前
239
点赞
评论

Mem0：新一代AI Agent的持久化记忆体系

Mem0 是一个轻量级、可扩展的长期记忆框架，支持本地部署和云端使用。其设计初衷是为 LLM 提供结构化的记忆支持，帮助智能体记住用户偏好、背景信息等，从而提供更个性化、更连贯的回答

8月前
4.6k
1
4

AI Agent的记忆体系与架构设计

LLM本质上是无状态的模型，每次调用都像一次“短暂失忆”。为了让 AI Agent真正理解上下文、具备个性化交互和任务持续性，引入记忆系统至关重要。

8月前
371
点赞
评论

AI Agent的记忆体系与架构设计