首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
深度学习机器
掘友等级
前大厂算法工程师,现小厂全栈开发。写写代码,记录开发之路。 公众号:深度学习机器 个人网站:https://dlmachine.top Github: https://github.com/zishengwu
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
20
文章 20
沸点 0
赞
20
返回
|
搜索文章
深度学习机器
5小时前
关注
VLM做文档OCR效果如何?我拿了几个常见模型进行对比
国内已经有不少专门针对OCR任务进行训练的开源VLM了。成绩打榜是一方面,实际用起来效果如何、好不好用可能又是另一方面。因此,本文将对比几款最近比较流行的VLM模型...
0
评论
分享
深度学习机器
12天前
关注
Embedding Gemma,谷歌发布的小而精向量模型,仅需0.3B|附RAG实战代码
EmbeddingGemma是Google发布的开源小规模多语言文本嵌入模型,旨在常见设备上高效运行,同时在 MTEB / MMTEB 等评测任务中保持与同类模型相当的性能...
3
评论
分享
深度学习机器
19天前
关注
UltraRAG:一个基于MCP协议,完全模块化的RAG框架
UltraRAG作为一个RAG框架,比较适合RAG科研人员使用,可以快速实验各种复杂的 RAG 策略,而无需重写大量代码,只需修改 YAML 文件。...
0
评论
分享
深度学习机器
22天前
关注
AI IDE如何构建高效代码索引?以一个MCP Server的开发过程进行阐述
本项目采用了经典的RAG架构进行开发,基于向量数据库并结合语义检索,搭配IDE内置的命令行工具,可以减少代码库索引时可能存在的token过度消耗和长时间等待,兼容常见的AI...
0
评论
分享
深度学习机器
29天前
关注
aisuite:统一的大模型SDK,简化LLM开发流程
aisuite作为一个开源的Python库,通过提供统一的接口和灵活的模型切换机制,简化了跨多个LLM提供商的集成过程。对于经常使用不同LLM的开发者来说,可以显著降低开发...
2
评论
分享
深度学习机器
1月前
关注
LangExtract:基于LLM的信息抽取框架|附项目解析与实战代码
LangExtract正是基于这一背景诞生的一个Python框架。它并非仅仅是对 API 的简单封装,而是围绕 “Schema 驱动抽取”思想构建的,具备高度可扩展性和生产...
2
评论
分享
深度学习机器
1月前
关注
从Chat Completions到Responses,OpenAI Agent接口设计的演变
OpenAI现如今主推Responses API,并不仅仅是命名更新,而是为Agent、多模态、检索增强等应用场景进行的架构升级,以期成为另一个Chat Completio...
0
评论
分享
深度学习机器
1月前
关注
Deep Research的架构演进:从Multi Agent到Supervisor-Researcher模式的技术实践
随着LLM的能力越来越强,Agent设计中更多决策权会交给模型,但是在Deep Research这种场景下,好像还是以工作流作为基本实现思路会更加合适一些,用于确保生成研究...
0
评论
分享
深度学习机器
1月前
关注
Gemini CLI源码解析:深入工具系统的实现细节
之前的文章介绍过主控Agent以及上下文实现的细节,除了主控Agent和上下文管理外,工具实现也是Agentic的一个重要环节。...
0
评论
分享
深度学习机器
1月前
关注
GLM-4.5系列模型导读,综合能力更强的高性价比模型
在沉寂了半年之后,智谱推出了新一代开源模型GLM-4.5系列,采用MOE架构并使用混合推理模式。模型统一提升了在推理、代码与智能体等多方面的能力,专为复杂智能体应用打造。...
0
评论
分享
深度学习机器
1月前
关注
Gemini CLI源码解析:Agent与上下文管理实现细节
gemini-cli 从开源至今仅一个多月,已经收获接近65K Star,作为第一个开源的通用命令行智能体工具,现如今功能已经非常完善。本文将对源码进行解析,学习其中优秀A...
1
评论
分享
深度学习机器
2月前
关注
构建AI智能体的“上下文工程”方法论:Manus团队的实战经验
上下文工程已成为现代AI Agent系统不可或缺的一部分。无论模型本身如何进化,对上下文的建模、维护、裁剪与反馈机制的设计,将决定一个智能体是否稳健、高效、可扩展。...
0
评论
分享
深度学习机器
2月前
关注
Kimi k2:最大开源Agentic LLM,Claude开源平替
月之暗面发布的Kimi K2,具有目前开源模型中最大的参数量,具备非常强的coding能力。该模型从一开始就清晰地把Agentic作为该模型的核心能力,包括模型训练的整个过...
0
评论
分享
深度学习机器
2月前
关注
OCRFlux-3B:开源 OCR + LLM 模型的新标杆,支持跨页表格合并
OCRFlux-3B 是目前业内首个开源支持跨页结构智能合并的模型,不仅精度高,而且支持关键的结构化能力,并且能够在消费级硬件上运行,实用性极高。...
0
评论
分享
深度学习机器
2月前
关注
Prompt Engineering vs Context Engineering:我们与LLM交互方式的演变
Prompt Engineering 是我们与 LLM 交互的原始技巧,但随着智能体的开发,我们需要的不再是简单的文本生成器,而是一个智能助手。...
0
评论
分享
深度学习机器
3月前
关注
Nanonets-OCR:Qwen2.5VL-3B的微调模型 更强大的文档解析能力|附效果实测
Nanonets-OCR不再满足于单纯提取文本,它能智能解析图像中的公式、表格、水印、签名、图表、复选框等复杂结构,并输出格式清晰的 Markdown。...
0
评论
分享
深度学习机器
3月前
关注
MonkeyOCR:用三元组范式重构文档解析与识别
MonkeyOCR提出一种新的SRR三元组架构,结合传统两种文档解析方式的优化,在精度和效率上都有不错的表现。...
0
评论
分享
深度学习机器
3月前
关注
Mem0:新一代AI Agent的持久化记忆体系
Mem0 是一个轻量级、可扩展的长期记忆框架,支持本地部署和云端使用。其设计初衷是为 LLM 提供结构化的记忆支持,帮助智能体记住用户偏好、背景信息等,从而提供更个性化、更...
1
4
分享
深度学习机器
3月前
关注
AI Agent的记忆体系与架构设计
LLM本质上是无状态的模型,每次调用都像一次“短暂失忆”。为了让 AI Agent真正理解上下文、具备个性化交互和任务持续性,引入记忆系统至关重要。...
0
评论
分享
深度学习机器
3月前
关注
告别RAG上下文丢失:Late Chunking 与 Contextual Retrieval 深度对比解析
在传统RAG流程中,必不可少的一个步骤是把长文档进行分块,然后把这些文本块进行向量化处理,并且存放在向量数据库中,当查询的时候,则从数据库中检索出相似的文本块传递给大模型,...
0
评论
分享
下一页
个人成就
文章被点赞
87
文章被阅读
40,760
掘力值
1,872
关注了
2
关注者
40
收藏集
0
关注标签
11
加入于
2023-11-21