首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CVHub
掘友等级
算法研究员
|
北京字节跳动有限公司
技能:图像分类、语义/实例/全景分割、目标/显著性检测、模型剪枝/蒸馏/量化/NAS、Transformer/LLM、超分/复原/去噪/去雨/去雾、弱监督/半监督/无监督/增量学习、GNN、3D视觉; 兴趣:游山玩水、写文章、分享故事。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
8
文章 8
沸点 0
赞
8
返回
|
搜索文章
最新
热门
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
X-AnyLabeling 是一款基于AI推理引擎和丰富功能特性于一体的强大辅助标注工具,其专注于实际应用,致力于为图像数据工程师提供工业级的一站式解决方案,可自动快速进行数据标定。
无关技术细节,聊聊这两年从事大语言模型的工作感悟
本文作者深刻反思了自己在这两年来从事大语言模型(LLM)工作中的感悟,由衷地分享了技术由于变革带来的冲击,同时也充分肯定了 LLM 在提升个人生产力和改变工作方式方面的巨大潜力。
大连理工卢湖川团队新作 | Spider: 开启图像统一分割新范式
作者被ICML 2024收录的Spider模型,首次提出对于CD概念的统一(训练、结构、参数)分割架构。文章分析了面向多CD概念统一理解时存在的多种挑战问题。
深度剖析现阶段的多模态大模型做不了医疗
今天的文章将为大家揭示多模态大模型在辅助诊断、异常检测等方面的潜力与局限,不仅分享了对当前技术的深刻见解,还提出了关于数据质量和模型训练的重要思考。
YOLOv10 正式发布!原理、部署、应用一站式齐全
YOLOv10 作为一款实时端到端目标检测模型,其通过创新的双标签分配策略和架构改进,在保持高速检测的同时显著提升了准确性和效率,提供了多个模型规模以适应不同应用场景。
TextCoT:多模态思维链提升文字密集图像理解
TextCoT 是一种零样本思维链方法,无需精心设计提示样例,并且可以在参数量较小的7B模型上也展现出对多模态理解能力的提升,展现了广泛的适用性和强大的性能提升效果。
CVPR 24-UG2 无人机多模态检测与追踪挑战赛正式开启!
我们希望通过这个比赛,群策群力,一起解决这个困难的问题,名列前茅的队伍不但能获得荣誉,在比赛结束后我们会和参与者们一起总结各种solution的优劣,一起发表一篇该领域milestone的文章。
具身智能之RT-H
RT-H模型不仅可以响应人类的纠正,还可以从这些纠正中学习,以改进其未来的行为。当人类提供纠正时,这些纠正被视为额外的训练数据。
具身智能之RT2
RT-2将预训练的视觉-语言模型(VLMs)进一步训练,使其能够直接控制机器人的动作。这个过程的目标是让模型学会将视觉输入和语言指令映射到具体的机器人动作上,从而实现对机器人的闭环控制。
具身智能之RT1
机器人学习领域的泛化问题是指机器人模型能够将在特定任务、环境或条件下学到的知识和技能应用到新的、未见过的任务、环境或条件的能力。
下一页
个人成就
优秀创作者
文章被点赞
264
文章被阅读
279,734
掘力值
9,220
关注了
5
关注者
311
收藏集
0
关注标签
0
加入于
2023-01-13