首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
深度学习机器
掘友等级
前大厂算法工程师,现小厂全栈开发。写写代码,记录开发之路。 公众号:深度学习机器 个人网站:https://dlmachine.top Github: https://github.com/zishengwu
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
20
文章 20
沸点 0
赞
20
返回
|
搜索文章
最新
热门
A2UI协议:一个Agent与UI界面之间的翻译器
在笔者看来,A2UI的意义不只是多了一种UI方案,而是在于它补齐了Agent从思考到执行的最后一环。对于Agent的开发者来说,可能不再需要去写各种业务相关的界面,而是可以专注于设计Agent能力边界
深度智能体框架DeepAgent剖析
当我们谈论 AI Agent 时,大多数开发者想到的是一个简单的工具调用循环:LLM 生成工具调用,执行工具,将结果返回给 LLM,继续下一轮。
RAG Chunking 2.0:提升文档分块效果的一些经验
在基于大语言模型的RAG系统里,文本分块是非常关键的一步。分块做得好,后续的向量检索、结果召回和生成质量都会更稳更准。
RAG的另一种思路,基于文档树结构的推理型检索
在过去两年中,RAG已经成为几乎所有AI应用的标配。无论是智能客服、企业知识库、财务分析还是法律文件问答,它们都遵循相同的逻辑流程:文档分割、向量化、向量相似度匹配、大模型生成答案。
Agent架构新方向?Claude Skills工作原理解析
Claude Skills为模型提供了一种全新的插件式增强能力:通过封装说明、示例和代码,让 Claude 具备特定领域的专业知识,并在需要时动态加载。
如何选择合适的 AI Agent框架?OpenAI vs Claude vs LangGraph功能特点汇总
OpenAI Agents SDK代表速度与协作 Claude Agent SDK追求稳定与深度 LangGraph强在灵活与控制 MCP则是连接一切的桥梁
AI Agent上下文工程设计指南|附实用工具推荐
上下文工程需要不断地迭代调试和总结经验,简单的方法论无法覆盖其设计的方方面面。本文仅对上下文工程的开发和设计模式进行了阐述,并列举出了一些常见的Agent开发工具,希望对于开发Agent的读者有些启发
解密vLLM:基于nano-vllm源码剖析其推理加速之道
vLLM对于部署过大模型的人来说应该都不算陌生, 它能极大提升LLM的服务吞吐量,显著降低推理成本。vLLM成功的核心秘诀在于一项名为 PagedAttention 的技术及其配套的调度策略。
VLM做文档OCR效果如何?我拿了几个常见模型进行对比
国内已经有不少专门针对OCR任务进行训练的开源VLM了。成绩打榜是一方面,实际用起来效果如何、好不好用可能又是另一方面。因此,本文将对比几款最近比较流行的VLM模型
Embedding Gemma,谷歌发布的小而精向量模型,仅需0.3B|附RAG实战代码
EmbeddingGemma是Google发布的开源小规模多语言文本嵌入模型,旨在常见设备上高效运行,同时在 MTEB / MMTEB 等评测任务中保持与同类模型相当的性能
下一页
个人成就
文章被点赞
105
文章被阅读
56,207
掘力值
2,175
关注了
2
关注者
46
收藏集
0
关注标签
11
加入于
2023-11-21