首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CVHub
掘友等级
算法研究员
|
北京字节跳动有限公司
技能:图像分类、语义/实例/全景分割、目标/显著性检测、模型剪枝/蒸馏/量化/NAS、Transformer/LLM、超分/复原/去噪/去雨/去雾、弱监督/半监督/无监督/增量学习、GNN、3D视觉; 兴趣:游山玩水、写文章、分享故事。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
6
文章 6
沸点 0
赞
6
返回
|
搜索文章
CVHub
算法研究员 @北京字节跳动有限公司
·
2月前
关注
AI标注神器 X-AnyLabeling-v2.3.0 发布!支持YOLOv8旋转目标检测、EdgeSAM、RTMO等热门模型!
今天主要为大家详细介绍 X-AnyLabeling v2.3.0 版本近期更新的一些功能和新特性,同时也借此机会分享下这半年多下来的开源心路历程。...
赞
2
分享
CVHub
赞了这篇文章
databook
软件工程师 @南京亚原软件有限公司
·
4月前
关注
写代码不用"if"行不行,曾经的反 "if" 运动
如果在IT行业的时间够长的话,可能还记得大约10几年前,设计模式风靡一时的时候,有过一段反 "if" 的运动。 所谓的反"if"运动,其实是夸大了"if"语句带来的问题,比...
78
78
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
超越 GLIP! | RegionSpot: 识别一切区域,多模态融合的开放世界物体识别新方法
本文的主题是多模态融合和图文理解,文中提出了一种名为RegionSpot的新颖区域识别架构,旨在解决计算机视觉中的一个关键问题:理解无约束图像中的各个区域或patch的语义...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
CNN 与 ViT 的完美结合 | TransXNet: 结合局部和全局注意力提供强大的归纳偏差和高效感受野
导读本文依旧从经典的 ViTs 说起,即基于 MHSA 构建远距离建模实现全局感受野的覆盖,但缺乏像 CNNs 般的归纳偏差能力。...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
WACV 2024 | SBCFormer: 面向端CPU设备的高效神经网络设计典范
本文的核心问题设计一个轻量化的深度神经网络在单板计算机(SBCs)上实现高准确度和快速计算的视觉任务。...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
微软 Azure AI 团队新作 | Florence-2: 解锁视觉新境界,万能感知引领未来!
今天为大家介绍由微软Azure AI团队最新提出的新颖视觉基础模型:Florence-2,该模型采用了一种基于prompt的统一表示方法,广泛适用于各种 CV 和 NLP。...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
All in One | X-AnyLabeling v2.0.0 全自动标注工具强势登场,全新功能亮相,欢迎体验升级!
大家好!今天,很荣幸地为各位小伙伴介绍全新的 X-AnyLabeling v2.0.0 版本。本次更新带来了许多实用好玩的新功能,让我们一同了解下吧!...
1
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
ICCV 2023 | 克服域差异:基于事件相机的自监督预训练策略
事件相机(Event Camera)是一种新型传感器。不同于传统的RGB相机记录的是场景的像素亮度,输出稠密、低频的图像帧,事件相机记录的是像素亮度的变化,输出稀疏、高频的...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
ICCV 2023 | 字节跳动 PICO 智能创作团队最新XR/VR研究工作分享
在不断发展的人工智能(AI)领域中,数据一直被视为最宝贵的资源之一。数据驱动的AI正以前所未有的方式塑造着未来,尤其在XR(扩展现实)领域,其中硬件和算法快速迭代。...
4
1
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
TPAMI 2023 | 生成式AI与图像合成综述
生成式AI作为当前人工智能领域的前沿技术,已被广泛的应用于各类视觉合成任务。随着DALL-E2,Stable Diffusion和DreamFusion的发布,AI 作画和...
2
1
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
IJCAL 2023 | 基于美学策略引导的低光照图像增强方法
由于光学器件固有的局限性和外部成像条件的限制,低光图像是一类常见的低质量图像。下图中我们列出了两种低光图像,分别是在光照不均匀的环境下和逆光下拍摄的。...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
基于语义对比学习的低光照图像增强网络
由于单个 RGB 图像存在低对比度和低能见度问题,低光图像增强(LLE)仍然具有挑战性。在本文中,我们回答了一个有趣的与学习相关的问题—利用可获得的非配对的/曝光不足的图像...
1
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
ICCV 2023 | EfficientViT: 面向边缘设备应用的SOTA语义分割模型,助力SAM高效推理
本文旨在解决在边缘设备上部署最先进的语义分割模型所面临的计算成本过高的问题。作者指出,先前的语义分割模型通常依赖于自注意力机制、计算密集型的大卷积核或复杂的拓扑结构,以获得...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
CLIP 数据分析
CLIP 得以成功的关键在于来源于网络所收集的高质量数据集(WIT400M),但关于 CLIP 数据集策划过程的细节一直是个谜。 CLIP的数据策划具有明显的优势。...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
ICLR 2023 | 神经规范场: 渲染引导空间规范变换
近期,神经场(Neural Fields)领域的巨大进展,已经显著推动了神经场景表示和神经渲染的发展。为了提高3D场景的计算效率和渲染质量,一个常见的范式是将3D坐标系统映...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
基于 YOLOR 的统一多任务学习范式
多任务学习旨在使用一个单一模型来学习多个任务,并同时提高所有这些任务的性能,这个概念类似于人类能够同时学习多个任务并将所学的知识应用到其他任务上。...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
S3IM:随机结构相似性及其对神经场的不合理有效性
今天为大家介绍的 S3IM 这个工作背后的想法实际上很简洁,作者从这个 idea 在脑海里形成到最后提交到 ICCV-2023 不过2个月时间。...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
高效涨点神器 | 台湾国立中央大学最新提出即插即用 SFPN: 显著提升卷积神经网络精度
FPN(Feature Pyramid Network)已经成为大多数单阶段目标检测器的基本组件。以前的研究多次证明,FPN 可以更精确地捕获不同尺寸的对象的多尺度特征图,...
赞
评论
分享
CVHub
算法研究员 @北京字节跳动有限公司
·
4月前
关注
打破遮挡和数据稀缺难题:MMSports 2023 分割竞赛冠军方案分享!
本文集中讨论了在 CV 领域中的一个长期存在的问题,即遮挡问题,尤其是在实例分割任务中。相信不少小伙伴都或多或少会碰到这个“棘手”的问题,今天我们一起根据文章的脉络来观摩学...
赞
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
181
文章被阅读
151,331
掘力值
7,784
关注了
4
关注者
239
收藏集
0
关注标签
0
加入于
2023-01-13