首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CVHub
掘友等级
算法研究员
|
北京字节跳动有限公司
技能:图像分类、语义/实例/全景分割、目标/显著性检测、模型剪枝/蒸馏/量化/NAS、Transformer/LLM、超分/复原/去噪/去雨/去雾、弱监督/半监督/无监督/增量学习、GNN、3D视觉; 兴趣:游山玩水、写文章、分享故事。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 7
沸点 0
赞
7
返回
|
搜索文章
最新
热门
NeurIPS 2024 | TextHarmony: 基于统一架构的视觉文本理解与生成模型
在人工智能领域,赋予机器类人的图像文字感知、理解、编辑和生成能力一直是研究热点。目前,视觉文字领域的大模型研究主要聚焦于单模态生成任务。
上海AI实验室推出DocLayout-YOLO: 速度精度绝佳的文档布局分析模型
ocLayout-YOLO 不仅在速度上与单模态方法YOLOv10相匹配,而且在准确性上超越了所有现有方法,包括单模态和多模态方法。
深度探讨视觉表征学习中骨干网络与优化器的耦合偏好
本文探讨了计算机视觉中骨干网络设计和优化器选择之间的相互作用。我们揭示了骨干-优化器耦合偏差(BOCB)现象及其对视觉骨干网络潜在的限制,例如在下游任务中额外的微调时间和努力。
微信团队发布全新多模态大模型 POINTS: 简单高效又不失性能
POINTS 是微信团队开发的先进视觉语言模型,融合了多项创新技术。它采用保持纵横比的高分辨率动态显示(CATTY)、CapFusion 技术整合图像描述、双视觉编码器架构。
仅需一行代码!上交大联合腾讯优图提出 SaRA: 让'懒惰'参数重获新生的微调魔法
本文提出了 SaRA,一种新颖的参数高效微调方法,该方法充分利用了预训练模型中绝对值最小的无效参数。
Ultrylytics 官宣: YOLO11 全新发布!
YOLO(You Only Look Once)是一个著名的物体检测和图像分割模型,由Joseph Redmon和Ali Farhadi在华盛顿大学开发。
Segment Anything 2 (SAM2) in X-AnyLabeling: 构建快速精准的图像和视频标注对象分割工具
Segment Anything 的初次发布受到了广泛赞誉,在 ICCV 2023 上获得了荣誉提名,并吸引了行业领袖和学术界的关注。
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
X-AnyLabeling 是一款基于AI推理引擎和丰富功能特性于一体的强大辅助标注工具,其专注于实际应用,致力于为图像数据工程师提供工业级的一站式解决方案,可自动快速进行数据标定。
无关技术细节,聊聊这两年从事大语言模型的工作感悟
本文作者深刻反思了自己在这两年来从事大语言模型(LLM)工作中的感悟,由衷地分享了技术由于变革带来的冲击,同时也充分肯定了 LLM 在提升个人生产力和改变工作方式方面的巨大潜力。
大连理工卢湖川团队新作 | Spider: 开启图像统一分割新范式
作者被ICML 2024收录的Spider模型,首次提出对于CD概念的统一(训练、结构、参数)分割架构。文章分析了面向多CD概念统一理解时存在的多种挑战问题。
下一页
个人成就
优秀创作者
文章被点赞
241
文章被阅读
197,333
掘力值
8,896
关注了
5
关注者
292
收藏集
0
关注标签
0
加入于
2023-01-13