首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
深度学习机器
掘友等级
前大厂算法工程师,现小厂全栈开发。写写代码,记录开发之路。 公众号:深度学习机器 个人网站:https://dlmachine.top Github: https://github.com/zishengwu
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
20
文章 20
沸点 0
赞
20
返回
|
搜索文章
深度学习机器
4天前
关注
RAG的另一种思路,基于文档树结构的推理型检索
在过去两年中,RAG已经成为几乎所有AI应用的标配。无论是智能客服、企业知识库、财务分析还是法律文件问答,它们都遵循相同的逻辑流程:文档分割、向量化、向量相似度匹配、大模型...
0
评论
分享
深度学习机器
4天前
关注
Agent架构新方向?Claude Skills工作原理解析
Claude Skills为模型提供了一种全新的插件式增强能力:通过封装说明、示例和代码,让 Claude 具备特定领域的专业知识,并在需要时动态加载。...
3
2
分享
深度学习机器
25天前
关注
如何选择合适的 AI Agent框架?OpenAI vs Claude vs LangGraph功能特点汇总
OpenAI Agents SDK代表速度与协作 Claude Agent SDK追求稳定与深度 LangGraph强在灵活与控制 MCP则是连接一切的桥梁...
1
评论
分享
深度学习机器
28天前
关注
AI Agent上下文工程设计指南|附实用工具推荐
上下文工程需要不断地迭代调试和总结经验,简单的方法论无法覆盖其设计的方方面面。本文仅对上下文工程的开发和设计模式进行了阐述,并列举出了一些常见的Agent开发工具,希望对于...
9
1
分享
深度学习机器
1月前
关注
解密vLLM:基于nano-vllm源码剖析其推理加速之道
vLLM对于部署过大模型的人来说应该都不算陌生, 它能极大提升LLM的服务吞吐量,显著降低推理成本。vLLM成功的核心秘诀在于一项名为 PagedAttention 的技术...
0
评论
分享
深度学习机器
1月前
关注
VLM做文档OCR效果如何?我拿了几个常见模型进行对比
国内已经有不少专门针对OCR任务进行训练的开源VLM了。成绩打榜是一方面,实际用起来效果如何、好不好用可能又是另一方面。因此,本文将对比几款最近比较流行的VLM模型...
0
评论
分享
深度学习机器
1月前
关注
Embedding Gemma,谷歌发布的小而精向量模型,仅需0.3B|附RAG实战代码
EmbeddingGemma是Google发布的开源小规模多语言文本嵌入模型,旨在常见设备上高效运行,同时在 MTEB / MMTEB 等评测任务中保持与同类模型相当的性能...
3
评论
分享
深度学习机器
2月前
关注
UltraRAG:一个基于MCP协议,完全模块化的RAG框架
UltraRAG作为一个RAG框架,比较适合RAG科研人员使用,可以快速实验各种复杂的 RAG 策略,而无需重写大量代码,只需修改 YAML 文件。...
0
评论
分享
深度学习机器
2月前
关注
AI IDE如何构建高效代码索引?以一个MCP Server的开发过程进行阐述
本项目采用了经典的RAG架构进行开发,基于向量数据库并结合语义检索,搭配IDE内置的命令行工具,可以减少代码库索引时可能存在的token过度消耗和长时间等待,兼容常见的AI...
0
评论
分享
深度学习机器
2月前
关注
aisuite:统一的大模型SDK,简化LLM开发流程
aisuite作为一个开源的Python库,通过提供统一的接口和灵活的模型切换机制,简化了跨多个LLM提供商的集成过程。对于经常使用不同LLM的开发者来说,可以显著降低开发...
2
评论
分享
深度学习机器
2月前
关注
LangExtract:基于LLM的信息抽取框架|附项目解析与实战代码
LangExtract正是基于这一背景诞生的一个Python框架。它并非仅仅是对 API 的简单封装,而是围绕 “Schema 驱动抽取”思想构建的,具备高度可扩展性和生产...
2
评论
分享
深度学习机器
2月前
关注
从Chat Completions到Responses,OpenAI Agent接口设计的演变
OpenAI现如今主推Responses API,并不仅仅是命名更新,而是为Agent、多模态、检索增强等应用场景进行的架构升级,以期成为另一个Chat Completio...
0
评论
分享
深度学习机器
3月前
关注
Deep Research的架构演进:从Multi Agent到Supervisor-Researcher模式的技术实践
随着LLM的能力越来越强,Agent设计中更多决策权会交给模型,但是在Deep Research这种场景下,好像还是以工作流作为基本实现思路会更加合适一些,用于确保生成研究...
1
评论
分享
深度学习机器
3月前
关注
Gemini CLI源码解析:深入工具系统的实现细节
之前的文章介绍过主控Agent以及上下文实现的细节,除了主控Agent和上下文管理外,工具实现也是Agentic的一个重要环节。...
0
评论
分享
深度学习机器
3月前
关注
GLM-4.5系列模型导读,综合能力更强的高性价比模型
在沉寂了半年之后,智谱推出了新一代开源模型GLM-4.5系列,采用MOE架构并使用混合推理模式。模型统一提升了在推理、代码与智能体等多方面的能力,专为复杂智能体应用打造。...
0
评论
分享
深度学习机器
3月前
关注
Gemini CLI源码解析:Agent与上下文管理实现细节
gemini-cli 从开源至今仅一个多月,已经收获接近65K Star,作为第一个开源的通用命令行智能体工具,现如今功能已经非常完善。本文将对源码进行解析,学习其中优秀A...
1
评论
分享
深度学习机器
3月前
关注
构建AI智能体的“上下文工程”方法论:Manus团队的实战经验
上下文工程已成为现代AI Agent系统不可或缺的一部分。无论模型本身如何进化,对上下文的建模、维护、裁剪与反馈机制的设计,将决定一个智能体是否稳健、高效、可扩展。...
0
评论
分享
深度学习机器
3月前
关注
Kimi k2:最大开源Agentic LLM,Claude开源平替
月之暗面发布的Kimi K2,具有目前开源模型中最大的参数量,具备非常强的coding能力。该模型从一开始就清晰地把Agentic作为该模型的核心能力,包括模型训练的整个过...
0
评论
分享
深度学习机器
4月前
关注
OCRFlux-3B:开源 OCR + LLM 模型的新标杆,支持跨页表格合并
OCRFlux-3B 是目前业内首个开源支持跨页结构智能合并的模型,不仅精度高,而且支持关键的结构化能力,并且能够在消费级硬件上运行,实用性极高。...
0
评论
分享
深度学习机器
4月前
关注
Prompt Engineering vs Context Engineering:我们与LLM交互方式的演变
Prompt Engineering 是我们与 LLM 交互的原始技巧,但随着智能体的开发,我们需要的不再是简单的文本生成器,而是一个智能助手。...
0
评论
分享
下一页
个人成就
文章被点赞
101
文章被阅读
47,317
掘力值
2,080
关注了
2
关注者
43
收藏集
0
关注标签
11
加入于
2023-11-21