首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
302.AI | 基准实验室
302AI
创建于2025-06-05
订阅专栏
最新模型实测专区
等 3 人订阅
共55篇文章
创建于2025-06-05
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
凭什么干翻 3.1 Pro?Gemini 3.5 Flash 实测:终结“轻量模型必定逊色”的铁律
Google I/O 2026开发者大会上,DeepMind 发布 Gemini 3.5 家族首款模型——主打速度、成本与长任务能力的 Gemini 3.5 Flash。
Grok 4.3 实测:放弃“最强模型”叙事,从聊天机器人到数字员工的务实转身
当 AI 大模型的竞争从单纯的参数比拼转向实战落地,xAI 的动作终于迈出了重要一步 —— Grok 4.3 正式发布
AI 时代如何高效制作 PPT?实测HTML-PPT 专项 Skill vs Manus
以前做 PPT 汇报,是一场脑力体力兼备的任务。一大痛点便是满世界找模板,结果找到的不是土得掉渣的红头文件风,就是付费才能解锁使用的套路
GPT-5.5 实测:牺牲了惊艳,换来了不出错,这笔翻倍溢价值不值得掏?
在 GPT-5.4 推出一个多月后,OpenAI 再次推出更新:GPT-5.5 和 GPT-5.5 Pro 于 4 月 24 日同时发布。
开源最强还是工程最强?Kimi K2.6 实测:长程执行与 Agent 能力的分水岭
4月21日,在时隔近3个月后, Moonshot AI 带来了 Kimi K2.6。作为 K2 系列的最新迭代,
能力跻身第一梯队?DeepSeek-V4-Pro 实测:从参数竞赛回归场景适配
千呼万唤始出来,DeepSeek-V4 于 4 月 24 日正式发布,以 1M 超长上下文全系标配宣布迈入百万上下文普惠时代。
实测 GPT Image 2:AI 绘图界真皇问世,从文字渲染到电商排版,它把竞品甩开两条街
OpenAI 发布最新图像模型 GPT Image 2.0,在 Arena.AI 榜单上以 1512 分断层霸榜第一,与竞品拉开显著代际差距。
开源界的“Claude Opus”?实测 GLM-5.1:能否在工程交付上实现反超?
4 月 8 日,智谱正式开源了 GLM 最新的 5.1 版本。GLM-5.1 是一次方向极其明确的版本更新——将模型的能力重心推向了一个具体问题:能否在长时间任务中持续工作,并且持续产生有效结果。
告别代码片段拼接!GLM-5V-Turbo 评测:如何把“看图写代码”变成“自动化闭环”?
4 月 2 日,智谱发布多模态 Coding 基座模型 GLM-5V-Turbo。相比此前以文本为核心的编程模型。
性能平替还是效率降级?GPT-5.4 mini/nano实测:5.4家族模型选型指南
如果说 GPT-5.4 是前沿能力的集大成者,那么3月18日发布的 GPT-5.4 mini 和 GPT-5.4 nano,则是 OpenAI 为Agent 时代量身打造的极致效能工具。
Qwen3.5-397B-A17B 实测:397B 参数只激活 5%,开源旗舰到底有多强?
阿里千问于今年除夕开始推出的 Qwen3.5 系列,包含大中小三个参数系列,而最让人难以忽视的恐怕就是这款旗舰级的 Qwen3.5-397B-A17B
性能价格同时起飞,GPT-5.4 实测:目前数字员工的最佳形态?
OpenAI 这次属实是不按套路出牌,3月4日刚发布 GPT-5.3 系列两款模型,才过两天便直接发布了 GPT-5.4
实测GPT-5.3 Codex & Instant :找准定位,别让你的 AI 跨界干活
时隔3个月,OpenAI 于3月4日更新模型,推出GPT-5.3 系列模型——包括深耕工程领域的 GPT-5.3-Codex 和主打日常高频交互的 GPT-5.3-Instant
Claude Sonnet 4.6 实测:旗舰级体验,中端级成本,能否掀翻旗舰 Opus?
2 月 18 日深夜,Claude Sonnet 4.6 便悄然登场。这款官方宣称“史上最强 Sonnet”的模型,以接近 Opus 旗舰的性能、60%的定价,深夜炸场。
Claude Opus 4.6 实测:百万上下文注入,依旧是顶级的编程脑
2026年开年,国产大模型圈热闹非凡。GLM、Kimi、Qwen等模型接连进行版本迭代,眼看着国内模型卷得飞起,大洋彼岸也终于开启更新节奏。 2月6日凌晨,Claude甩出了自己的新年王牌
开源最强 Kimi K2.5 实测:跻身最强多模态梯队,视觉编程兑现创意构想
1 月 27 日,月之暗面(Moonshot)正式发布并开源新一代模型 Kimi K2.5。作为一次瞄准技术前沿的全力进击,其官方定位直指 “开源最强模型”,展现出充分的技术自信。
实测1300万曝光的爆款Remotion Skill:让视频制作从专业技能变日常工具
进入2026年,虽然各家模型的迭代速度稍有放缓,但AI领域的热度丝毫未减。几乎每周都会冒出一个新的"当红炸子鸡",尤其是在Skills这个圈子里。
实测爆火Skill:Superpowers+任务板,重新定义AI编程协作
最近,有一款更像是完整工作流的Skill大放异彩,成为诸多Claude Code用户口中"改变游戏规则"的存在——它就是Superpowers。
下一页