Title: Lightweight Real-time Semantic Segmentation Network with Efficient Transformer and CNN
Paper: arxiv.org/pdf/2302.10… (Accepted by IEEE TITS)
导读
太长不看篇,本文从局部-全局上下文语义入手,结合 CNN 和 Transformer 设计了一种轻量级实时语义分割网络——LETNet,其包含两个主要的组件:
- 轻量化的空洞瓶颈层模块 (
Lightweight Dilated Bottleneck,LDB) - 特征增强模块 (
Feature Enhancement)
所提方法仅包含 0.95M 参数和 13.6G FLOP,但能在单张 RTX 3090 显卡上获得了如下结果:
Cityscapes测试集以 120 FPS 获得了 72.8% mIoU 的精度CamVid测试集上以 250 FPS 产生 70.5% mIoU 的精度
充分验证了其能够在准确性和效率平衡方面取得了卓越的性能。