首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
CVHub
掘友等级
算法研究员
|
北京字节跳动有限公司
技能:图像分类、语义/实例/全景分割、目标/显著性检测、模型剪枝/蒸馏/量化/NAS、Transformer/LLM、超分/复原/去噪/去雨/去雾、弱监督/半监督/无监督/增量学习、GNN、3D视觉; 兴趣:游山玩水、写文章、分享故事。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
8
文章 8
沸点 0
赞
8
返回
|
搜索文章
最新
热门
CVHub 精选文章年中汇总
欢迎来到CVHub技术文章年中总结专区!本篇文章将为您呈现CVHub平台上的一系列优质技术文章,这些文章包含了各种计算机视觉相关的主题,从科普软文、算法原理到工程实战等。
南洋理工开源海外中文大语言模型Panda LLM | 探索数据因素和训练策略如何影响大模型性能表现
本项目以LLaMA为基础模型,采用两阶段训练方法,首先在五大中文语料进行训练微调,其次在少量但多样数据上进行指令微调,开发了中文大语言模型Panda LLM。
两万字长文带你全面解读生成式人工智能
随着ChatGPT的病毒式传播,生成式人工智能(AIGC, a.k.a AI-generated content)因其分析和创造文本、图像、视频以及其他方面的出众能力而俨然成为当下最火热的投资赛道。
上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务
本文介绍了一种名为LLaMA-Adapter的轻量级适配方法,仅引入1.2M可学习参数,微调一小时即可将LLaMA调整为一个支持下游任务的良好模型,同时支持多模态(文本与图像)输入。
百度开源超强目标检测器 RT-DETR | Python/C++ 保姆级部署教程,从入门到精通
一个高效的混合编码器,通过解耦内部尺度交互和跨尺度融合来高效地处理多尺度特征,并提出了 IoU 感知的查询选择来改进目标查询的初始化。此外,RT-DETR 支持使用不同的解码器层来灵活调整推断速度。
顶刊TIP 2023 | CFP:即插即用的多尺度融合模块,助力检测分割任务有效涨点!
导读 特征金字塔网络现代识别系统中的一种基础网络结构,可有效地用于检测不同尺度的物体。PANet 提出了一种额外的自下而上路径,使高级特征图也可以从低级特征图中获得足够的细节信息。
一招入魂!| CLIPPO:利用Transformer建立多模态模型新范式!
这篇论文讨论了一种称为 CLIP-Pixels Only(CLIPPO)的多模式模型,它是一个纯基于像素的模型,可以用来执行图像、文本和多模式任务。
NeuraIPS 2022 | 最新类别感知对抗Transformer分割网络CASTformer
在这项工作中,作者结合 CNN+Transformer 设计了一种简单而有效的混合网络结构 CASTformer 并用于 2D 的医学图像分割。
FlexiViT: 谷歌手把手教你如何灵活切片
ViT 是一种通过将图像切割成一个个小方块(patch)将图像转换为序列从而输入到Transformer网络进行训练和推理的一种神经网络架构。
EfficientFormerV2: Transformer家族中的MobileNet
随着 ViT 的出现,Transformer 模型在计算机视觉领域遍地开花,一层激起一层浪。虽然精度很高,但被人广为诟病的依旧是它的效率问题,说人话就是这东西压根不好部署在移动端。
下一页
个人成就
优秀创作者
文章被点赞
264
文章被阅读
279,761
掘力值
9,220
关注了
5
关注者
311
收藏集
0
关注标签
0
加入于
2023-01-13