首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
LLM
AIGC
Agent
AI编程
OpenAI
后端
程序员
算法
展开
全部
人工智能
LLM
AIGC
Agent
AI编程
OpenAI
后端
程序员
算法
前端
Python
深度学习
计算机视觉
MCP
面试
暂无数据
推荐
最新
OCR战场再起风云:LightOnOCR-1B凭什么比DeepSeekOCR快1.7倍?(附演示开源地址)
就在前不久DeepSeekOCR开源发布,大家在感叹其体积和速度的时候,LightOnOCR又给我们带来全新的效果,这款全新的视觉语言模型正在重新定义机器阅读和理解商业信息的方式。 LightOnOC
RAG的另一种思路,基于文档树结构的推理型检索
在过去两年中,RAG已经成为几乎所有AI应用的标配。无论是智能客服、企业知识库、财务分析还是法律文件问答,它们都遵循相同的逻辑流程:文档分割、向量化、向量相似度匹配、大模型生成答案。
Agent架构新方向?Claude Skills工作原理解析
Claude Skills为模型提供了一种全新的插件式增强能力:通过封装说明、示例和代码,让 Claude 具备特定领域的专业知识,并在需要时动态加载。
告别碎片化!Dinomaly2:一个极简框架统一所有异常检测任务
简单,是终极的复杂。——列奥纳多·达·芬奇 在工业质检、医疗诊断、安防监控等领域,异常检测一直扮演着至关重要的角色。然而,这个领域长期以来面临着一个核心痛点:方法碎片化。 想象一下,你的工厂需要检测2
[Agent] ACE(Agentic Context Engineering)源码阅读笔记---(1)基础模块
[Agent] ACE(Agentic Context Engineering)源码阅读笔记---(1)基础模块 0x00 概要 0x01 示例 1.1 建立简单Agent 1.2 后续操作 0x02
大模型如何革新搜索相关性?智能升级让搜索更“懂你”|得物技术
你是否曾在社区搜索时遇到这样的困扰:想找一双“平价学生党球鞋”,结果出现的多是限量联名款?或者输入“初冬轻薄通勤羽绒服”,却看到厚重登山款?这类“搜不准”的情况,正是搜索相关性技术要解决的
遗传算法与属性约简:原理、代码与参数配置
遗传算法(Genetic Algorithm, GA)是一类借鉴达尔文生物进化论思想的智能优化算法,其核心在于模拟自然界中 “物竞天择、适者生存” 的遗传与进化机制。在算法中,待求解问题的每个潜在解被
MPK(Mirage Persistent Kernel)源码笔记(5)--- 执行引擎
MPK(Mirage Persistent Kernel)源码笔记(5)--- 执行引擎 0x00 概述 0x01 SM不同角色 1.1 Scheduler SM 1.2 Worker SM 0x02
估值百亿独角兽创始人硕士论文曝光!宇树科技王兴兴的“性价比”思维10年前就已注定
“人火了是连毕业论文都要被翻出来的。”这条互联网定律再次应验——宇树科技CEO王兴兴的硕士毕业论文近日被网友们掘地三尺找了出来。 令人惊讶的是,这篇近十年前的论文不仅预示了如今机器人行业的技术路线转变
RAG—Chunking策略实战|得物技术
在 RAG 系统中,即便采用性能卓越的 LLM 并反复打磨 Prompt,问答仍可能出现上下文缺失、事实性错误或拼接不连贯等问题。多数团队会频繁更换检索算法与 Embedding模型,但收
视觉语言模型(VLM)深度解析:如何用它来处理文档?
视觉语言模型是一类强大的机器学习模型,能够同时处理视觉(图像)和文本信息。随着最近 Qwen 3 VL 模型的发布,我想带大家深入探讨一下,如何利用这些强大的 VLM 来处理文档。 为什么你需要使用
『译』迄今为止最强的 RAG 技术?Anthropic 的上下文检索与混合搜索
RAG(检索增强生成)似乎是当下最热门的话题,这也不难理解。它通过让大语言模型(例如 Claude 3.5)访问外部知识源,为用户查询提供额外的上下文,从而减少幻觉现象。此外,它还被设计用来克服语言模
搞定边缘AI部署:开源神器RamaLama,让视觉语言模型无处不在
人工智能的前沿不再只是数据中心;它在于工厂车间、零售店、公共基础设施以及我们周围的智能设备。推动这一转变的是视觉语言模型(VLM),这是一个革命性的人工智能,可以解释和推理图像和视频。潜力巨大,但任何
一致性模型:单步生成高质量图像,破解扩散模型速度瓶颈
这篇名为《一致性模型》的论文提出了一类新的生成模型,能够一步到位地生成高质量图像,解决了扩散模型的主要瓶颈——采样过程慢、需要多次迭代。它的核心贡献在于证明了:在保持扩散模型强大表达能力和训练稳定性的
MPK(Mirage Persistent Kernel)源码笔记(4)--- 转译系统
MPK(Mirage Persistent Kernel)源码笔记(4)--- 转译系统 0x00 概要 0x01 Task和Event 1.1 可执行任务 1.2 事件 0x02 生成CUDA代码
大模型音频水印技术:用AI守护音频数据的“身份指纹”
本文介绍了生成式AI时代音频内容安全面临的挑战,以及音频水印技术的实现方案,并深入分析了SynthID与AudioSeal两大前沿方案的实现路径。通过对比实验结果,验证AI水印技术在保持音频质量的同时
端到端短视频多目标排序机制框架 EMER 详解
近日,快手正式发布全新推出的端到端多目标融合排序框架——EMER。该框架以其“会比较、自进化”的核心能力,重构了传统依赖人工经验公式的推荐模式。
征程 6 | 多任务 不同帧率 部署方案
推理多任务模型时,可能会有不同任务分支 部署不同帧率的需求,例如 BEV 动态任务 20 帧,静态任务 10 帧这种情况
告别 “盲买”!京东 AI 试穿 Oxygen Tryon:让服饰购物从“想象”到“所见即所得”
1 前言 传统线上购物,消费者常因无法直观感受服装上身效果,面临样式不合、款式不搭等困扰,导致退货率居高不下。925 JDD 大会发布的京东 AI 试穿 Oxygen Tryon,借助先进的 AI 技
【从零开始】17. 中文摘要提取工具
书接上回,做完模型量化后试了几次实时推理,结果都强差人意(推理结果没有深度,这个还需要后面再调整)。至于幻觉嘛,是不可避免的。为此,在真正上线前还需要转换为 RAG 应用并增加“输出前校验”来抑制幻觉