首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Baihai_IDP
掘友等级
白海科技
Baihai IDP:AI训推云平台。一站式提供多样的算力资源、MLOPs/LMOPs工具、MaaS服务。 Github:https://github.com/BaihaiAI/IDP Gitee: https://gitee.com/baihai-idp/IDP
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
192
文章 187
沸点 5
赞
192
返回
|
搜索文章
最新
热门
AI 推理服务是否真的无利可图?从第一性原理看 AI 推理成本
作者 | Martin Alderson 编译 | 岳扬 我总听人说 AI(尤其是推理环节)是台烧钱机器[1-3]。表面上看这种说法似乎有道理,但我一直对这类论断持保留态度,因此决定深入探究一番。 目
驳“AI 泡沫论”:一场被误读的、正在进行中的产业结构性调整
作者 | Dave Friedman 编译 | 岳扬 目前流传着一种看似合理的说法:GPT-5 表现未达预期,因此 AI 泡沫正在破裂。这个观点看似顺理成章,实则是错误的。这个说法将四个不同维度的事情
GPU 网络通信基础,Part 3(LLM 训练过程的网络通信;InfiniBand 真的是“封闭”技术吗?)
作者 | Austin Lyons 编译 | 岳扬 本文将解析低延迟与低抖动如何主导分布式训练的迭代效率,指出现有传统以太网技术的局限性,并阐释 InfiniBand 为何能成为高性能计算锁步工作负载
GPU 网络基础,Part 2(MoE 训练中的网络挑战;什么是前、后端网络;什么是东西向、南北向流量)
作者 | Austin Lyons 编译 | 岳扬 01 前端网络 vs 后端网络 上次我们探讨了大语言模型预训练中的 GPU 间通信,重点分析了与邻近 GPU 的高速高带宽连接(如通过 NVLink
GPU 网络通信基础,Part 1(横向与纵向扩展;训练中的通信环节...)
作者 | Austin Lyons 编译 | 岳扬 本系列文章将用轻松的方式聊聊网络与 GPU。这个话题很重要,但可能显得有些枯燥或深奥。请耐心听我道来! 01 训练动机 训练大语言模型需要海量的浮点
上下文工程实施过程中会遇到什么挑战?有哪些优化策略?
作者 | Paul Iusztin 编译 | 岳扬 开门见山地说:如果你现在还在只谈论“提示词工程”,那你就已经落后了。 在大语言模型(LLM)的发展初期,精心设计提示词确实是核心任务。 对于 202
分享一些“氛围编程”的工程化技巧
作者 | Amazon Web Services - Labs 编译 | 岳扬 01 “氛围编程” 根据 wikipedia 介绍[1],氛围编程(vibe coding)是一种现代软件开发方式,用户
AI Agents 能自己开发工具自己使用吗?一项智能体自迭代能力研究
作者 | Alessio Fanelli 编译 | 岳扬 在 AI 安全领域,“自我改进(Self-Improving)”是个令人不安的术语,它暗含着“机器将以人类无法理解的方式超越人类智慧”的意思。
2025 年大语言模型架构演进:DeepSeek V3、OLMo 2、Gemma 3 与 Mistral 3.1 核心技术剖析
作者 | Devansh and Sebastian Raschka, PhD 编译 | 岳扬 目录 01 DeepSeek V3/R1 1.1 多头潜在注意力机制(MLA) 1.2 混合专家模型(M
MCP 是为开发者设计的工具,而非为 LLM 而设
作者 | Roy Derks 编译 | 岳扬 Model Context Protocol (MCP) 已成为构建智能体时使用工具调用(tool calling)的标准,但恰恰相反,你的 LLM 并不
下一页
个人成就
优秀创作者
文章被点赞
649
文章被阅读
176,217
掘力值
7,891
关注了
4
关注者
167
收藏集
0
关注标签
0
加入于
2021-12-04