首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Baihai_IDP
掘友等级
白海科技
Baihai IDP:AI训推云平台。一站式提供多样的算力资源、MLOPs/LMOPs工具、MaaS服务。 Github:https://github.com/BaihaiAI/IDP Gitee: https://gitee.com/baihai-idp/IDP
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
163
文章 158
沸点 5
赞
163
返回
|
搜索文章
Baihai_IDP
@白海科技
·
3天前
关注
为什么大模型在 OCR 任务上表现不佳?
作者 | Sid and Ritvik (Pulse Founders) 编译 | 岳扬 我们启动 Pulse 项目的目标,是为那些在数以百万计电子表格和 PDF 中处理关...
2
评论
分享
Baihai_IDP
@白海科技
·
5天前
关注
图解「模型上下文协议(MCP)」:从与传统 API 的比较入手
作者 | Avi Chawla 编译 | 岳扬 最近,关于模型上下文协议(MCP)的讨论非常热烈。你一定听说过它。 今天,让我们一起来了解一下模型上下文协议(MCP)。 直...
1
评论
分享
Baihai_IDP
@白海科技
·
10天前
关注
DeepSeek-V3 技术解析:DeepSeek 如何优化 MoE?
作者 | Shirley Li 编译 | 岳扬 这是 DeepSeek-V3 系列的第二篇文章,本文将解析 DeepSeek[1,2,3] 模型的另一个关键架构创新:Dee...
1
评论
分享
Baihai_IDP
@白海科技
·
12天前
关注
「DeepSeek-V3 技术解析」:多头潜在注意力机制(MLA)
作者 | Shirley Li 编译 | 岳扬 本文是「DeepSeek-V3 技术解析」系列文章的第一篇,我们将深入解读深度求索公司最新开源的 DeepSeek-V3 模...
1
评论
分享
Baihai_IDP
@白海科技
·
17天前
关注
如何高效地为「推理模型」编写最佳提示词?万字长文介绍
作者 | Agustinmantaras 编译 | 岳扬 OpenAI 的 O1 和 O3-mini 是两款先进的推理模型,与基础版 GPT-4(通常称为 GPT-4o)在...
2
评论
分享
Baihai_IDP
@白海科技
·
19天前
关注
为什么说JSON不一定是LLM结构化输出的最佳选择?
作者 | David Gilbertson 编译 | 岳扬 当要求大语言模型(LLM)输出结构化数据时,所采用的格式会对结果产生比较大的影响。本文对比了六种不同的格式,评估...
2
评论
分享
Baihai_IDP
@白海科技
·
21天前
关注
7B 开源模型性能超越 LLaVA,DeepSeek Janus Pro 论文详解
作者 | AI Papers Academy 编译 | 岳扬 01 导言 业界仍在消化 DeepSeek 最近发布的震撼 AI 界的 DeepSeek-R1,但 R1 发布...
3
评论
分享
Baihai_IDP
@白海科技
·
26天前
关注
后 DeepSeek R1 时代:从资本壁垒到技术普惠
作者 | Akash Bajwa 编译 | 岳扬 我们倾向于将人工智能的发展划分为两个截然不同的时代:2022 年 11 月 ChatGPT 发布前的"前 ChatGPT ...
2
评论
分享
Baihai_IDP
@白海科技
·
1月前
关注
绕过 RAG 实时检索瓶颈,缓存增强生成(CAG)如何助力性能突破?
作者 | Vishal Rajput 编译 | 岳扬 检索增强生成(RAG)作为一种通过整合外部知识源来增强语言模型的强大方法而备受瞩目。不过,这种方法也带来了一些挑战,比...
2
评论
分享
Baihai_IDP
@白海科技
·
1月前
关注
从PPO到GRPO:算力减半的大模型推理能力训练革命
作者 | Greg Schoeninger 编译 | 岳扬 不久前,我们深入研究了 DeepSeek-R1 背后的技术原理(图解系列|DeepSeek-R1的出众推理能力因...
3
评论
分享
Baihai_IDP
@白海科技
·
1月前
关注
如何正确看待 AI 的推理能力?走出人类中心主义
作者 | Rafe Brena, Ph.D. 编译 | 岳扬 Image by the author using ChatGPT 近期,关于人工智能是否具备推理能力的讨论愈...
2
评论
分享
Baihai_IDP
@白海科技
·
1月前
关注
LLM Agent 协作评估难?这 3 款评估监控工具来帮忙
在构建基于大语言模型的应用时,你是否遇到过这样的困扰:多个 AI Agent 协同工作时,如何确保它们的表现符合预期?如何有效监控它们之间的互动质量?这些问题不仅影响着产品...
1
评论
分享
Baihai_IDP
@白海科技
·
1月前
关注
初创公司使用 AI “码农” Devin 一个月的体验
本文系原作者观点,Baihai IDP 仅编译转载。 作者 | Vikram Sreekanti and Joseph E. Gonzalez 编译 | 岳扬 我们总是对新...
1
评论
分享
Baihai_IDP
@白海科技
·
1月前
关注
图解系列|DeepSeek-R1的出众推理能力因何而来?
作者 | Jay Alammar 编译 | 岳扬 DeepSeek-R1 代表了人工智能发展的又一重要里程碑。对于机器学习领域的研究人员与开发者群体而言,这次发布之所以备受...
1
评论
分享
Baihai_IDP
@白海科技
·
1月前
关注
为什么大语言模型难以处理长上下文?从 Transformer 到 Mamba
作者 | Timothy B. Lee 编译 | 岳扬 OpenAI 在两年前推出 ChatGPT 时,其能够处理的上下文信息仅有 8,192 个 tokens1。换言之,...
1
评论
分享
Baihai_IDP
@白海科技
·
2月前
关注
AI 发展是否正在放缓?AI 发展将驶向何方?
作者 | Lan Chu 编译 | 岳扬 无论人工智能是否能穿越炒作的迷雾,我都感到生活在人类历史上这个有趣的时代是如此幸运。回想五年前我开始接触神经网络时,AI 连识别猫...
1
评论
分享
Baihai_IDP
@白海科技
·
2月前
关注
你的LLM评估方法过时了吗?这三个范式转变不容错过
作者 | 姜砺砺 编译 | 岳扬 在我的职业生涯中,我一直致力于为机器学习系统打造评估体系。在担任 Quora 数据科学部门负责人时,我们为新闻源排序、广告投放、内容审查等...
1
评论
分享
Baihai_IDP
@白海科技
·
2月前
关注
文档解析技术指南:从传统Pipeline到端到端大模型
作者 | Florian June 编译 | 岳扬 众多文档,如技术手册、历史档案、学术论文和法律文件,往往以扫描件或图片形式存在。这对检索增强生成(Retrieval-A...
1
评论
分享
Baihai_IDP
@白海科技
·
2月前
关注
向量数据库真的能满足所有 AI Agent 的记忆需求吗?
作者 | Debmalya Biswas 编译 | 岳扬 图:Agentic AI 记忆管理(图片由作者提供) 01 Agentic AI 系统简介 AI Agent 是当...
1
评论
分享
Baihai_IDP
@白海科技
·
2月前
关注
RAG的技术困境:为何单纯依赖向量嵌入不可靠?
本文系原作者观点,Baihai IDP 仅编译转载。 作者 | Michael Wood 编译 | 岳扬 在 RAG 系统中,其核心任务是找出那些与查询内容相似度最高的存储...
7
1
分享
下一页
个人成就
优秀创作者
文章被点赞
543
文章被阅读
144,456
掘力值
6,281
关注了
4
关注者
143
收藏集
0
关注标签
0
加入于
2021-12-04