深度学习机器

前大厂算法工程师，现小厂全栈开发。写写代码，记录开发之路。公众号：深度学习机器个人网站：https://dlmachine.top Github: https://github.com/zishengwu

赞

20

|

搜索文章

A2UI协议：一个Agent与UI界面之间的翻译器

在笔者看来，A2UI的意义不只是多了一种UI方案，而是在于它补齐了Agent从思考到执行的最后一环。对于Agent的开发者来说，可能不再需要去写各种业务相关的界面，而是可以专注于设计Agent能力边界

1月前
188
点赞
1

深度智能体框架DeepAgent剖析

当我们谈论 AI Agent 时，大多数开发者想到的是一个简单的工具调用循环：LLM 生成工具调用，执行工具，将结果返回给 LLM，继续下一轮。

3月前
258
点赞
评论

RAG Chunking 2.0:提升文档分块效果的一些经验

在基于大语言模型的RAG系统里，文本分块是非常关键的一步。分块做得好，后续的向量检索、结果召回和生成质量都会更稳更准。

3月前
185
1
评论

RAG Chunking 2.0:提升文档分块效果的一些经验

RAG的另一种思路，基于文档树结构的推理型检索

在过去两年中，RAG已经成为几乎所有AI应用的标配。无论是智能客服、企业知识库、财务分析还是法律文件问答，它们都遵循相同的逻辑流程：文档分割、向量化、向量相似度匹配、大模型生成答案。

3月前
264
点赞
评论

Agent架构新方向？Claude Skills工作原理解析

Claude Skills为模型提供了一种全新的插件式增强能力：通过封装说明、示例和代码，让 Claude 具备特定领域的专业知识，并在需要时动态加载。

3月前
714
3
2

如何选择合适的 AI Agent框架？OpenAI vs Claude vs LangGraph功能特点汇总

OpenAI Agents SDK代表速度与协作 Claude Agent SDK追求稳定与深度 LangGraph强在灵活与控制 MCP则是连接一切的桥梁

4月前
635
2
评论

如何选择合适的 AI Agent框架？OpenAI vs Claude vs LangGraph功能特点汇总

AI Agent上下文工程设计指南｜附实用工具推荐

上下文工程需要不断地迭代调试和总结经验，简单的方法论无法覆盖其设计的方方面面。本文仅对上下文工程的开发和设计模式进行了阐述，并列举出了一些常见的Agent开发工具，希望对于开发Agent的读者有些启发

4月前
640
9
1

AI Agent上下文工程设计指南｜附实用工具推荐

解密vLLM：基于nano-vllm源码剖析其推理加速之道

vLLM对于部署过大模型的人来说应该都不算陌生, 它能极大提升LLM的服务吞吐量，显著降低推理成本。vLLM成功的核心秘诀在于一项名为 PagedAttention 的技术及其配套的调度策略。

5月前
422
点赞
评论

解密vLLM：基于nano-vllm源码剖析其推理加速之道

VLM做文档OCR效果如何？我拿了几个常见模型进行对比

国内已经有不少专门针对OCR任务进行训练的开源VLM了。成绩打榜是一方面，实际用起来效果如何、好不好用可能又是另一方面。因此，本文将对比几款最近比较流行的VLM模型

5月前
270
点赞
评论

VLM做文档OCR效果如何？我拿了几个常见模型进行对比

Embedding Gemma，谷歌发布的小而精向量模型，仅需0.3B｜附RAG实战代码

EmbeddingGemma是Google发布的开源小规模多语言文本嵌入模型，旨在常见设备上高效运行，同时在 MTEB / MMTEB 等评测任务中保持与同类模型相当的性能

5月前
556
3
评论

Embedding Gemma，谷歌发布的小而精向量模型，仅需0.3B｜附RAG实战代码

个人成就

文章被点赞 107

文章被阅读 60,916

掘力值 2,201

加入于

2023-11-21