首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Baihai_IDP
掘友等级
白海科技
Baihai IDP:AI训推云平台。一站式提供多样的算力资源、MLOPs/LMOPs工具、MaaS服务。 Github:https://github.com/BaihaiAI/IDP Gitee: https://gitee.com/baihai-idp/IDP
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
168
文章 163
沸点 5
赞
168
返回
|
搜索文章
最新
热门
驳“RAG 已死”论:上下文窗口扩展≠RAG 终结
本文系原作者观点,Baihai IDP 仅进行编译分享 作者 | Skylar Payne 编译 | 岳扬 每次新的大语言模型问世,标题党总遵循着固定套路:“百万 tokens 级别上下文窗口的新模型
Google 的 A2A 与 MCP 该如何选择?还是两种都用?
作者 | Zachary Huang 编译 | 岳扬 01 引言:协作式人工智能的曙光 想想你是如何与同事合作完成那些复杂项目的 —— 你们互相分享信息、提出问题,并整合彼此的专业知识。现在,请想象这
面对开源大模型浪潮,基础模型公司如何持续盈利?
本文系原作者观点,Baihai IDP 仅进行编译分享。 作者 | Devansh 编译 | 岳扬 生成式 AI 已在诸多领域带来了较大的生产力提升,但显然其潜力尚未被完全释放。这项技术蕴含着巨大的商
GenAI 时代,数据唾手可得,但真正的挑战已经转变...
作者 | Vikram Sreekanti and Joseph E. Gonzalez 编译 | 岳扬 回到 2010 年代,大数据曾风靡一时。正如那句名言(部分引用——此处不展示全文)所说:"ev
「DeepSeek-V3 技术解析」:DeepSeek-V3-Base 预训练阶段解析
作者 | Shirley Li 编译 | 岳扬 这是 DeepSeek 系列文章的第五篇,也是首篇聚焦 DeepSeek-V3 [1, 2] 训练流程的文章。 如下图所示,DeepSeek-V3 的训
能否将扩散模型思想应用于 LLMs 领域?大型语言扩散模型(LLDM)详解
作者 | AI Papers Academy 编译 | 岳扬 在这篇文章,我们将对《Large Language Diffusion Models》这篇论文进行解析,介绍首个基于扩散模型的 LLM,该
LLMs.txt:让大模型更懂你的 Web 文档
作者 | Derick Ruiz 编译 | 岳扬 您可能已经留意到,近期不少开发工具都在其文档中新增了对 LLMs.txt 的支持。这个拟议中的 Web 标准正快速获得业界的认可,但它究竟是什么,又为
「DeepSeek-V3 技术解析」:多词元预测技术(Multi-Token Prediction, MTP)
作者 | Shirley Li 编译 | 岳扬 这是 DeepSeek-V3 系列的第四篇文章,将解释 DeepSeek [1,2]模型的最后一个重要架构创新:多词元预测(multi-token pr
基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战
作者 | Greg Schoeninger 编译 | 岳扬 群组相对策略优化(Group Relative Policy Optimization,GRPO)已被证明是一种有效的算法,可用于训练大语言
「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡
作者 | Shirley Li 编译 | 岳扬 这是 DeepSeek-V3 系列文章的第三篇,我们将探讨 DeepSeek 模型[1, 2, 3]中与混合专家模型(MoE)相关的另一项关键架构突破:
下一页
个人成就
优秀创作者
文章被点赞
585
文章被阅读
150,796
掘力值
6,654
关注了
4
关注者
151
收藏集
0
关注标签
0
加入于
2021-12-04