首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
小白狮ww
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 0
沸点 2
赞
2
返回
|
搜索文章
最新
热门
不只是更大的模型:Qwen3.6-35B-A3B 实现「低功耗高性能」
AI 模型 Qwen3.6-35B-A3B 发布,以 3B 激活参数超越前代及 Gemma4-31B 模型,在编程榜单表现优异。新版本优化了前端开发和代码推理能力,新增「思考过程留存」功能。
告别只会对话的 Agent:OpenClaw 把「执行力」补上了
普通 Agent 无法独立完成任务,OpenClaw 则集成多能力的运行环境,可自主连贯执行任务、补齐流程步骤,无需人工干预拆解任务。
当大模型开始「处理长上下文与多模态任务」:Gemma 4 31B it 的统一建模思路
Google DeepMind 推出的 Gemma-4-31B-it 模型在技术资料整理中展现出显著优势,其基于Gemini3 技术体系,强化了长上下文建模与推理能力。
3 秒出全纹理!TRELLIS.2 实现单图生成高分辨率 3D 资产
微软开源TRELLIS.2模型突破单图3D生成瓶颈,采用创新O-Voxel稀疏体素表示和16倍空间压缩技术,实现高质量3D资产快速生成。
Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled 蒸馏模型,27B 参数也能做强推理
Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled是一款高性能对话模型,通过知识蒸馏融合多模型优势,在保持27B参数轻量化的同时显著提升推理能力。
Phi-4 Reasoning Vision 15B 让多模态图文推理进入「可落地、轻量、专业」新时代
微软发布的 Phi-4 Reasoning Vision 15B 模型,基于 150 亿参数,支持图文联合推理,能够处理复杂文档分析、数学推理、图像理解以及 GUI 定位等任务。
160亿的参数,GLM-Image让AI绘图听懂人话
如果说 DeepSeek 让 AI 学会了说人话,那 GLM-Image 就是专治 AI 画图「听不懂人话」的老毛病——毕竟,谁还没被那些鬼画符文字气笑过呢?
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
如何形容现在市面上普遍的 OCR 呢?可能你已经习惯了它的「固执」——无论文档布局多复杂,它总是老老实实从左到右、从上到下扫一遍。
Ovis-Image:卓越的图像生成模型
你是否还在为无法得到自己心中想要的画面发愁?现在由 AIDC-AI 团队发布了 Ovis-Image 模型解决了大部分问题。
当 OCR 模型开始「理解整页文档」:HunyuanOCR 的端到端之路
如果你用过 OCR,可能会发现它在单行文本上已经相当成熟,但一旦遇到多栏排版、表格或公式,效果就会明显下降。这并不是简单的识别精度问题,而是传统 OCR 更关注字符本身,却很少真正理解文档结构。 随着
下一页
个人成就
文章被点赞
14
文章被阅读
42,860
掘力值
1,807
关注了
0
关注者
13
收藏集
0
关注标签
11
加入于
2024-04-02