首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
MansFlower
掘友等级
软件开发工程师
什么都想做的小开发。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
AI Agent 领域的“DeepSeek”时刻:通义DeepResearch深度解析与洞察
通义DeepResearch不是又一个简单的聊天模型,而是一个专门为自主研究任务设计的AI Agent,其发布甚至被Reddit上的开发者们誉为AI Agent领域的“DeepSeek”时刻。
AI语音合成新纪元:B站开源的 IndexTTS2 是下一个巨头杀手吗?
在这个由微软、谷歌等商业巨头主导,同时有ElevenLabs等新贵崛起,以及大量研究机构和开源项目百花齐放的“战国时代”,来自Bilibili(B站)的一款开源新作——IndexTTS2横空出世。
Hunyuan-MT:腾讯开源翻译大模型
腾讯混元大模型团队其自研的Hunyuan-MT翻译大模型在Hugging Face上正式开源。这不只是一个简单的技术发布,更像是一次对传统AI翻译格局的强力冲击。
Intern-S1:不仅是MoE,更是开源科学AI的“登顶之作”
在大家都在卷通用大模型能力,纷纷对标 GPT、Gemini 的时候,Intern-S1 却另辟蹊径,在某个特定领域默默拿下了“世界冠军”。今天,我就来跟大家一起拆解一下,这个模型到底凭什么这么“拽”?
深入解析OmniHuman-1.5:一场从“模仿动作”到“模拟思维”的范式革命
OmniHuman-1.5最核心的创新,便是将卡尼曼的“系统1”和“系统2”认知理论引入了视频生成领域。它不仅仅满足于“系统1”的快速反应,更试图模拟“系统2”的慢速、深思熟虑的逻辑规划。
Gemini 2.5 Flash Image Preview:nano banana
Gemini 2.5 Flash Image Preview的核心定位,正是为了满足高频任务对速度和成本的苛刻要求。它并非一个孤立的作图工具,而是专为集成到应用和工作流而生的视觉引擎。
静默发布:DeepSeek-V3.1
上周,DeepSeek-V3.1静静地躺在模型库里,短短几小时内便在开发者社区引发了爆炸式讨论。这不仅仅是一次常规版本迭代,更像是一次面向未来、充满战略考量的架构革新。
智谱AutoGLM 2.0:这片云上的“分身”能否定义下一代工作流?
智谱AI的一款新产品——AutoGLM 2.0,在圈子里激起了不小的波澜。一个最核心的问题:这个号称能24小时替你工作的“通用Agent”,究竟是营销噱头还是技术变革?
当AI不再画图,而是开始“写代码”:LL3M,一场3D创作的新范式革命
LL3M让AI学会了写代码来生成3D模型。这不仅仅是又一个生成模型,而是一场从根本上改变3D内容生产流程的新范式探索。
字节跳动 M3-Agent 的多模态长时记忆与智能体新范式
目前大多数AI模型都有一个普遍的痛点,那就是“金鱼记忆”。它们能够出色地完成眼前的任务,比如回答一个问题、生成一段代码,但一旦对话上下文窗口满了,它们就会毫不留情地“忘记”之前的互动。
下一页
个人成就
文章被点赞
7
文章被阅读
6,136
掘力值
296
关注了
0
关注者
0
收藏集
0
关注标签
12
加入于
2025-07-21