[分享][每日更新][2024.01.21][CV_arxiv_papers]

2024-01-23 143 阅读5分钟

[UPDATED!] 2024-01-21 (Publish Time)

分类/检测/识别/分割

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	A Survey on African Computer Vision Datasets, Topics and Researchers	非洲计算机视觉数据集、主题和研究人员调查	Abdul-Hakeem Omotayo, Ashery Mbilinyi, Lukman Ismaila, Houcemeddine Turki, Mahmoud Abdien, Karim Gamal, Idriss Tondji, Yvan Pimi, Naome A. Etori, Marwa M. Matar, et.al.	arxiv.org/pdf/2401.11…	null
2024-01-21	TetraLoss: Improving the Robustness of Face Recognition against Morphing Attacks	TetraLoss：提高人脸识别抵御变形攻击的鲁棒性	Mathias Ibsen, Lázaro J. González-Soler, Christian Rathgeb, Christoph Busch	arxiv.org/pdf/2401.11…	null
2024-01-21	Thermal Image Calibration and Correction using Unpaired Cycle-Consistent Adversarial Networks	使用不成对的循环一致对抗网络进行热图像校准和校正	Hossein Rajoli, Pouya Afshin, Fatemeh Afghah	arxiv.org/pdf/2401.11…	null
2024-01-21	CaBuAr: California Burned Areas dataset for delineation	CaBuAr：用于描绘的加州燃烧区域数据集	Daniele Rege Cambrin, Luca Colomba, Paolo Garza	arxiv.org/pdf/2401.11…	null
2024-01-21	Edge-Enabled Real-time Railway Track Segmentation	边缘支持的实时铁路轨道分割	Chen Chenglin, Wang Fei, Yang Min, Qin Yong, Bai Yun	arxiv.org/pdf/2401.11…	null
2024-01-21	MapChange: Enhancing Semantic Change Detection with Temporal-Invariant Historical Maps Based on Deep Triplet Network	MapChange：基于深度三元组网络的时间不变历史地图增强语义变化检测	Yinhe Liu, Sunan Shi, Zhuo Zheng, Jue Wang, Shiqi Tian, Yanfei Zhong	arxiv.org/pdf/2401.11…	null
2024-01-21	Exploring Missing Modality in Multimodal Egocentric Datasets	探索多模态自我中心数据集中缺失的模态	Merey Ramazanova, Alejandro Pardo, Humam Alwassel, Bernard Ghanem	arxiv.org/pdf/2401.11…	null
2024-01-21	Task-specific regularization loss towards model calibration for reliable lung cancer detection	针对可靠肺癌检测的模型校准的特定任务正则化损失	Mehar Prateek Kalra, Mansi Singhal, Rohan Raju Dhanakashirur	arxiv.org/pdf/2401.11…	null
2024-01-21	Inter-Domain Mixup for Semi-Supervised Domain Adaptation	用于半监督域适应的域间混合	Jichang Li, Guanbin Li, Yizhou Yu	arxiv.org/pdf/2401.11…	null
2024-01-21	Adaptive Betweenness Clustering for Semi-Supervised Domain Adaptation	用于半监督域适应的自适应介数聚类	Jichang Li, Guanbin Li, Yizhou Yu	arxiv.org/pdf/2401.11…	null
2024-01-21	Geometric Prior Guided Feature Representation Learning for Long-Tailed Classification	用于长尾分类的几何先验引导特征表示学习	Yanbiao Ma, Licheng Jiao, Fang Liu, Shuyuan Yang, Xu Liu, Puhua Chen	arxiv.org/pdf/2401.11…	null
2024-01-21	Exploring Diffusion Time-steps for Unsupervised Representation Learning	探索无监督表示学习的扩散时间步长	Zhongqi Yue, Jiankun Wang, Qianru Sun, Lei Ji, Eric I-Chao Chang, Hanwang Zhang	arxiv.org/pdf/2401.11…	null
2024-01-21	Enhancing the vision-language foundation model with key semantic knowledge-emphasized report refinement	通过关键语义知识强调报告细化来增强视觉语言基础模型	Cheng Li, Weijian Huang, Hao Yang, Jiarun Liu, Shanshan Wang	arxiv.org/pdf/2401.11…	null
2024-01-21	Embedded Hyperspectral Band Selection with Adaptive Optimization for Image Semantic Segmentation	具有图像语义分割自适应优化的嵌入式高光谱波段选择	Yaniv Zimmer, Oren Glickman	arxiv.org/pdf/2401.11…	null
2024-01-21	S![^3]()M-Net: Joint Learning of Semantic Segmentation and Stereo Matching for Autonomous Driving	S![^3]()M-Net：自动驾驶语义分割和立体匹配的联合学习	Zhiyuan Wu, Yi Feng, Chuang-Wei Liu, Fisher Yu, Qijun Chen, Rui Fan	arxiv.org/pdf/2401.11…	null
2024-01-21	Adversarial Augmentation Training Makes Action Recognition Models More Robust to Realistic Video Distribution Shifts	对抗性增强训练使动作识别模型对现实视频分发变化更加鲁棒	Kiyoon Kim, Shreyank N Gowda, Panagiotis Eustratiadis, Antreas Antoniou, Robert B Fisher	arxiv.org/pdf/2401.11…	null
2024-01-21	UniM-OV3D: Uni-Modality Open-Vocabulary 3D Scene Understanding with Fine-Grained Feature Representation	UniM-OV3D：具有细粒度特征表示的单模态开放词汇 3D 场景理解	Qingdong He, Jinlong Peng, Zhengkai Jiang, Kai Wu, Xiaozhong Ji, Jiangning Zhang, Yabiao Wang, Chengjie Wang, Mingang Chen, Yunsheng Wu	arxiv.org/pdf/2401.11…	null
2024-01-21	ANNA: A Deep Learning Based Dataset in Heterogeneous Traffic for Autonomous Vehicles	ANNA：基于深度学习的自动驾驶汽车异构交通数据集	Mahedi Kamal, Tasnim Fariha, Afrina Kabir Zinia, Md. Abu Syed, Fahim Hasan Khan, Md. Mahbubur Rahman	arxiv.org/pdf/2401.11…	null

OCR

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	Multi-View Neural 3D Reconstruction of Micro-/Nanostructures with Atomic Force Microscopy	利用原子力显微镜对微/纳米结构进行多视角神经 3D 重建	Shuo Chen, Mao Peng, Yijin Li, Bing-Feng Ju, Hujun Bao, Yuan-Liu Chen, Guofeng Zhang	arxiv.org/pdf/2401.11…	null

生成模型

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	Scalable High-Resolution Pixel-Space Image Synthesis with Hourglass Diffusion Transformers	使用沙漏扩散变压器进行可扩展高分辨率像素空间图像合成	Katherine Crowson, Stefan Andreas Baumann, Alex Birch, Tanishq Mathew Abraham, Daniel Z. Kaplan, Enrico Shippole	arxiv.org/pdf/2401.11…	null
2024-01-21	Grayscale Image Colorization with GAN and CycleGAN in Different Image Domain	在不同图像域中使用 GAN 和 CycleGAN 进行灰度图像着色	Chen Liang, Yunchen Sheng, Yichen Mo	arxiv.org/pdf/2401.11…	null

多模态

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	Self-Supervised Bird's Eye View Motion Prediction with Cross-Modality Signals	使用跨模态信号的自监督鸟瞰运动预测	Shaoheng Fang, Zuhong Liu, Mingyu Wang, Chenxin Xu, Yiqi Zhong, Siheng Chen	arxiv.org/pdf/2401.11…	null
2024-01-21	LLMRA: Multi-modal Large Language Model based Restoration Assistant	LLMRA：基于多模态大语言模型的恢复助手	Xiaoyu Jin, Yuan Shi, Bin Xia, Wenming Yang	arxiv.org/pdf/2401.11…	null

LLM

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	General Flow as Foundation Affordance for Scalable Robot Learning	一般流程作为可扩展机器人学习的基础功能	Chengbo Yuan, Chuan Wen, Tong Zhang, Yang Gao	arxiv.org/pdf/2401.11…	null

Transformer

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	How Robust Are Energy-Based Models Trained With Equilibrium Propagation?	通过平衡传播训练的基于能量的模型有多鲁棒？	Siddharth Mansingh, Michal Kucer, Garrett Kenyon, Juston Moore, Michael Teti	arxiv.org/pdf/2401.11…	null

3DGS

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	Deformable Endoscopic Tissues Reconstruction with Gaussian Splatting	高斯溅射可变形内窥镜组织重建	Lingting Zhu, Zhao Wang, Zhenchao Jin, Guying Lin, Lequan Yu	arxiv.org/pdf/2401.11…	null

各类学习方式

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	Hierarchical Prompts for Rehearsal-free Continual Learning	分层提示，无需排练持续学习	Yukun Zuo, Hantao Yao, Lu Yu, Liansheng Zhuang, Changsheng Xu	arxiv.org/pdf/2401.11…	null
2024-01-21	Visual Imitation Learning with Calibrated Contrastive Representation	具有校准对比表示的视觉模仿学习	Yunke Wang, Linwei Tao, Bo Du, Yutian Lin, Chang Xu	arxiv.org/pdf/2401.11…	null

其他

Publish Date	Title	Title_CN	Authors	PDF	Code
2024-01-21	Text-to-Image Cross-Modal Generation: A Systematic Review	文本到图像的跨模式生成：系统回顾	Maciej Żelaszczyk, Jacek Mańdziuk	arxiv.org/pdf/2401.11…	null
2024-01-21	MobileARLoc: On-device Robust Absolute Localisation for Pervasive Markerless Mobile AR	MobileARLoc：用于普及无标记移动 AR 的设备上鲁棒绝对定位	Changkun Liu, Yukun Zhao, Tristan Braud	arxiv.org/pdf/2401.11…	null
2024-01-21	ColorVideoVDP: A visual difference predictor for image, video and display distortions	ColorVideoVDP：图像、视频和显示失真的视觉差异预测器	Rafal K. Mantiuk, Param Hanji, Maliha Ashraf, Yuta Asano, Alexandre Chapiro	arxiv.org/pdf/2401.11…	null