Facebookresearch / ConvNeXt

681 阅读2分钟

A ConvNet for the 2020s

ConvNeXt的官方PyTorch实现,来自以下论文。

A ConvNet for the 2020s. arXiv 2022.
Liu Zhuang,Hanzi Mao,Chao-Yuan Wu,Christoph Feichtenhofer,Trevor DarrellandSaining Xie
Facebook AI Research, UC Berkeley


我们提出ConvNeXt,一个完全由标准ConvNet模块构建的纯ConvNet模型。ConvNeXt准确、高效、可扩展且设计非常简单。

目录

  • ImageNet-1K 训练代码
  • ImageNet-22K预训练代码
  • ImageNet-1K微调代码
  • 下游传输(检测、分割)代码

结果和预训练模型

ImageNet-1K的训练模型

名称分辨率acc@1#paramsFLOPs模型
ConvNeXt-T224x22482.128M4.5G模型
ConvNeXt-S224x22483.150M8.7G模型
ConvNeXt-B224x22483.889M15.4G模型
ConvNeXt-B384x38485.189M45.0G模型
ConvNeXt-L224x22484.3198M34.4G模型
ConvNeXt-L384x38485.5198M101.0G模型

ImageNet-22K的训练模型

名称分辨率acc@1#paramsFLOPs22k模型1k模型
ConvNeXt-B224x22485.889M15.4G模型模型
ConvNeXt-B384x38486.889M47.0G-模型
ConvNeXt-L224x22486.6198M34.4G模型模型
ConvNeXt-L384x38487.5198M101.0G-模型
ConvNeXt-XL224x22487.0350M60.9G模型模型
ConvNeXt-XL384x38487.8350M179.0G-模型

ImageNet-1K的训练模型(各向同性)。

名称分辨率acc@1#paramsFLOPs模型
ConvNeXt-S224x22478.722M4.3G模式
ConvNeXt-B224x22482.087M16.9G模型
ConvNeXt-L224x22482.6306M59.7G模型

安装

请查看INSTALL.md的安装说明。

评估

我们给出了一个ImageNet-22K预训练,然后ImageNet-1K微调的ConvNeXt-B的评估命令示例。

单GPU

python main.py --model convnext_base --eval true \
--resume https://dl.fbaipublicfiles.com/convnext/convnext_base_22k_1k_224.pth \
--input_size 224 --drop_path 0.2 \
--data_path /path/to/imagenet-1k

多GPU

python -m torch.distributed.launch --nproc_per_node=8 main.py \
--model convnext_base --eval true \
--resume https://dl.fbaipublicfiles.com/convnext/convnext_base_22k_1k_224.pth \
--input_size 224 --drop_path 0.2 \
--data_path /path/to/imagenet-1k

这应该可以得到

* Acc@1 85.820 Acc@5 97.868 loss 0.563
  • 对于评估其他模型的变体,请相应地改变--model,--resume,--input_size 。你可以从上面的表格中获得预训练模型的网址。
  • 设置特定于模型的--drop_path 在评估中不是严格要求的,因为 timm 中的DropPath 模块在评估中的行为是一样的;但在训练中是需要的。参见TRAINING.md或我们的论文,以了解不同模型使用的值。

训练

参见TRAINING.md以了解训练和微调说明。

鸣谢

这个资源库是使用timm库、DeiTBEiT资源库建立的。

许可

本项目是在MIT许可下发布的。请参阅LICENSE文件以了解更多信息。

引用

如果你觉得这个资源库有帮助,请考虑引用。

@Article{liu2021convnet,
  author  = {Zhuang Liu and Hanzi Mao and Chao-Yuan Wu and Christoph Feichtenhofer and Trevor Darrell and Saining Xie},
  title   = {A ConvNet for the 2020s},
  journal = {arXiv preprint arXiv:2201.03545},
  year    = {2022},
}