首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Baihai_IDP
掘友等级
白海科技
Baihai IDP:AI训推云平台。一站式提供多样的算力资源、MLOPs/LMOPs工具、MaaS服务。 Github:https://github.com/BaihaiAI/IDP Gitee: https://gitee.com/baihai-idp/IDP
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
171
文章 166
沸点 5
赞
171
返回
|
搜索文章
赞
文章( 166 )
沸点( 5 )
DeepSeek-V3 技术解析:DeepSeek 如何优化 MoE?
作者 | Shirley Li 编译 | 岳扬 这是 DeepSeek-V3 系列的第二篇文章,本文将解析 DeepSeek[1,2,3] 模型的另一个关键架构创新:DeepSeekMoE[4]。 「
图解「模型上下文协议(MCP)」:从与传统 API 的比较入手
作者 | Avi Chawla 编译 | 岳扬 最近,关于模型上下文协议(MCP)的讨论非常热烈。你一定听说过它。 今天,让我们一起来了解一下模型上下文协议(MCP)。 直观地说,MCP 就像 AI
如何高效地为「推理模型」编写最佳提示词?万字长文介绍
作者 | Agustinmantaras 编译 | 岳扬 OpenAI 的 O1 和 O3-mini 是两款先进的推理模型,与基础版 GPT-4(通常称为 GPT-4o)在提示词处理和答案生成方式上存
为什么说JSON不一定是LLM结构化输出的最佳选择?
作者 | David Gilbertson 编译 | 岳扬 当要求大语言模型(LLM)输出结构化数据时,所采用的格式会对结果产生比较大的影响。本文对比了六种不同的格式,评估考察了它们的处理速度、tok
7B 开源模型性能超越 LLaVA,DeepSeek Janus Pro 论文详解
作者 | AI Papers Academy 编译 | 岳扬 01 导言 业界仍在消化 DeepSeek 最近发布的震撼 AI 界的 DeepSeek-R1,但 R1 发布短短数日后,这家公司又祭出了
50亿美元亏损背后:解析生成式 AI 的商业模式之争
作者 | Stephanie Kirmer 编译 | 岳扬 Photo by Ibrahim Rifath[1] on Unsplash[2] OpenAl 是史上增长最为迅猛的企业之一,但同时也可能
Llama 3.2 Vision & Molmo:多模态开源生态系统基础
作者 | Nathan Lambert 编译 | 岳扬 多模态语言模型领域相比纯语言模型,显得定义更为不明确、未解决的问题更多,同时也有更多空间让人们发挥创意。在语言模型领域,存在一系列明确的任务和行
Agent 智能体开发框架选型指南
作者 | Aparna Dhinakaran 编译 | 岳扬 Image by author 智能体(Agents)正迎来辉煌时刻。伴随着众多新框架的涌现和对该领域的持续投资[1],现代 AI 智能体
「混合专家模型」可视化指南:A Visual Guide to MoE
作者 | Maarten Grootendorst 编译 | 岳扬 在查看最新推出的大语言模型(LLMs)时,你可能会注意到标题中频繁出现的“MoE”字样。这个“MoE”究竟是什么,它为何会成为众多
AI像人一样操控电脑:多模态AI Agents和屏幕交互新范式
作者 | Tula Masterman 编译 | 岳扬 01 引言:AI Agent 领域的持续变革 Anthropic、微软和苹果的最新动态正在重塑我们对 AI Agents 的认知。目前,“AI
下一页
个人成就
优秀创作者
文章被点赞
601
文章被阅读
157,692
掘力值
7,065
关注了
4
关注者
155
收藏集
0
关注标签
0
加入于
2021-12-04