工业粉尘检测数据集：从数据采集到模型训练（4000 张图片已划分、已标注）| 适用与目标检测随着工业智能化与安全生产要求

粉尘检测数据集（4000 张图片已划分、已标注）

一、背景

随着工业智能化与安全生产要求的不断提升，粉尘检测逐渐成为环境监测与安全防护领域的重要研究方向。在矿山、工厂、建筑工地等高粉尘场景中，粉尘浓度过高不仅影响生产效率，更会对人体健康和设备安全造成严重威胁。传统的粉尘检测方式通常依赖物理传感器，如激光粉尘仪、光散射式传感器等，但这些设备成本高、布设复杂、实时性不足。近年来，基于计算机视觉的粉尘识别与检测技术逐渐崛起，通过图像识别模型（如YOLO、EfficientNet、Vision Transformer等），可以实现对粉尘状态的实时检测与自动判断。

为推动粉尘检测的智能化研究，我们构建并公开了一个标准化、结构清晰、标注完备的 粉尘检测数据集（Dust Detection Dataset），为研究者与开发者提供高质量的训练与验证样本。

数据集下载

链接:pan.baidu.com/s/1LHce_fyo… 提取码:2nmk 复制这段内容后打开百度网盘手机App，操作更方便哦

数据集说明

样本分类输出（中文）：粉尘样本分类输出（英文）：dust 样本分类输出数量：1

训练集train： 2910个样本验证集valid： 923个样本

训练集和验证集样本比例：约3:1

二、数据集概述

该数据集包含 4000 张高质量粉尘图像样本，并按照 3:1 比例划分为训练集与验证集，适用于目标检测、图像分类及环境监测等多种计算机视觉任务。

数据集组成	数量（张）	占比
训练集（train）	2910	约 72.8%
验证集（valid）	923	约 23.1%
合计（total）	4000	100%

样本分类输出（中文）：粉尘
样本分类输出（英文）：dust
类别数量：1（单类别检测任务）

该数据集经过人工精确标注，标注格式兼容 YOLO 格式（.txt） 与 COCO 格式（.json），用户可根据自身训练框架（如Ultralytics YOLOv8、MMDetection、Detectron2）直接加载。

三、数据集详情

1. 图像来源与采集环境

数据样本主要采集自以下几类典型场景：

工业生产环境（机械加工、焊接车间）
矿区与隧道环境（煤尘、石粉）
建筑施工现场（扬尘、混凝土粉末）
实验室人工模拟场景（受控光照与粉尘浓度）

图像采集设备覆盖：

高清工业相机（1080p、60fps）
手机终端摄像头（多光照场景）
监控系统截帧（固定视角、低帧率）

所有图像经过去噪、尺寸统一（640×640）、曝光补偿与颜色标准化处理，确保模型训练的稳定性与通用性。

2. 标注规范

采用半自动标注 + 人工复核方式完成。标注工具使用 LabelImg 与 Roboflow Annotator，标注格式如下：

class_id  x_center  y_center  width  height

例如（YOLO 格式）：

0 0.531 0.478 0.612 0.532

其中 class_id = 0 对应 “dust” 类别。所有标注文件与图片文件同名，方便直接载入模型训练框架。

3. 文件结构示例

Dust_Dataset/
│
├── train/
│   ├── images/
│   │   ├── 0001.jpg
│   │   ├── 0002.jpg
│   │   └── ...
│   └── labels/
│       ├── 0001.txt
│       ├── 0002.txt
│       └── ...
│
├── valid/
│   ├── images/
│   └── labels/
│
└── data.yaml

其中 data.yaml 文件包含以下内容：

train: ./train/images
val: ./valid/images
nc: 1
names: ['dust']

四、适用场景

该数据集可广泛应用于以下研究与工程场景：

环境监测系统开发 可用于训练工业粉尘检测模型，实现实时监控与报警。
YOLO 系列算法研究 可作为单类检测任务的标准测试集，用于验证模型在小目标、模糊目标下的检测能力。
图像增强与去雾算法评估 粉尘环境通常伴随模糊与光照不均，可用于验证图像去模糊或增强算法的有效性。
AIoT 智能终端应用 可结合边缘计算，实现嵌入式终端上的粉尘检测，如安全摄像头或无人巡检车。
模型轻量化与迁移学习实验 因类别单一且样本量充足，适合作为迁移学习微调实验集。

五、结语

粉尘检测不仅关乎工业安全，更代表着AI 环境智能感知的重要方向。通过本数据集，研究者可以快速开展从数据预处理、模型训练到实际部署的全流程实验，推动智能监测系统的发展。未来，我们计划在此基础上扩展更多类别（如烟雾、蒸汽、雾气等），构建多环境融合感知数据集，为智能视觉检测提供更全面的支持。

✅ 推荐使用框架：

YOLO
MMDetection
PaddleDetection

📦 数据格式兼容：YOLO、COCO、VOC

📘 关键词：粉尘检测 / 目标检测 / YOLO / 计算机视觉 / 数据集构建

在本文中，我们详细介绍了一个粉尘检测数据集，该数据集包含4000张图像，已按3:1比例划分为训练集与验证集，专门用于粉尘识别与检测任务。数据集具有以下几个特点：

数据集概述：包括训练集和验证集，训练集有2910张图片，验证集有923张图片，标注格式兼容YOLO和COCO，适合用于目标检测、图像分类等任务。
数据集详情：样本采集自多种工业、矿区及施工现场，图像经过去噪、标准化处理，确保高质量的数据输入。标注通过半自动方式完成，精度高。
适用场景：该数据集适用于环境监测系统开发、YOLO系列算法研究、图像增强评估、AIoT智能终端应用等领域，可以助力各种粉尘检测应用。
结语：粉尘检测数据集为工业智能化和环境安全提供了强有力的数据支持，为推动AI环境感知技术的发展提供了有价值的实验素材。未来，数据集将进一步扩展类别，构建更多元的智能感知系统。

通过该数据集，研究者可以在粉尘检测领域进行更为深入的探索，不仅提高了粉尘监测的效率，还促进了相关领域算法的不断优化与突破。