
水性涂饰木制品在环保制造中日益重要,但涂装过程易受木材异质性和环境因素影响,导致表面缺陷频发,如气泡、裂纹等。这些缺陷不仅提升了生产成本,还制约了产品质量稳定。传统人工检测效率低下、主观性强,无法满足智能制造需求,而深度学习技术虽潜力巨大,却因缺乏高质量公共数据集而难以应用。
本研究通过构建一个包含13400张高分辨率图像的公共数据集,涵盖四种典型缺陷类型,解决了数据稀缺问题。该数据集基于真实工业生产线采集,并经专业标注和数据增强处理,支持多类别缺陷检测模型的开发与部署,从而推动自动化质量控制,提升家具制造业效率。相关研究成果于近日发表于Scientific Data期刊(IF=6.9)。
【文献速览】
水性木器涂料作为环保型涂饰体系,以水为主要溶剂,具有低挥发性有机化合物(VOC)排放、低毒性和不易燃爆的特点,符合可持续发展的全球标准。其理化性能优异,包括高透明度、柔韧性和耐久性,广泛应用于家具、建筑和汽车领域。近年来,在政策推动下,如中国家具制造集群的产业升级,水性涂料已大规模取代传统溶剂型涂料,并通过纳米改性等创新提升功能性。然而,木材基材的复杂纹理、孔隙率和吸湿性差异,使涂装过程易产生缺陷。缺陷率达3%至8%,成为高端木制品生产的瓶颈。当前依赖人工目视检查的方法,不仅劳动密集且易受疲劳和光线影响,导致误报漏报率高。计算机视觉和深度学习(如CNN、YOLO)在其他材料缺陷检测中已证明有效,但木材表面的异质性及公开数据集的缺失,阻碍了其在木制品领域的应用。这凸显了构建专用数据集的迫切性,以支持算法训练和工业部署。主要研究内容如下:本研究聚焦于水性涂饰木制品表面缺陷检测,开发了一个公共图像数据集。数据集采集自中国江山百家旺门业有限公司的实际生产线,涵盖六种常见木材基材(如橡胶木指接板、MDF)和七种涂层颜色(如绿色、红色)。样本制备遵循标准涂装流程,包括水分平衡、机械加工、喷涂底漆和面漆,并根据基材差异调整涂装次数,以模拟真实缺陷形成。图像采集采用工业级相机(分辨率2448×2048像素)和CIE D65标准光源,确保均匀照明和一致性。从原始335张图像中裁剪ROI并调整为600×600像素。针对工业干扰,如光照波动和噪声,实施数据增强策略:亮度调整(±30%)、噪声注入(高斯和椒盐)和几何变换(旋转、镜像),扩展至13400张图像。此外,引入马赛克增强聚合微小缺陷,提高样本平衡性和模型训练效率。标注使用LabelImg软件,提供边界框信息,覆盖四种缺陷:气泡(3645个)、划痕(3498个)、裂纹(3256个)和孔洞(3001个)。统计分析显示缺陷分布均衡、多尺度且形态多样,支持多类别检测。技术验证采用7:2:1数据集划分,在统一硬件(AMD Ryzen 9 CPU、NVIDIA RTX 4060 GPU)和参数下基准测试YOLO和RT-DETR模型。结果显示YOLOv13的mAP50达89.7%,证明数据集质量高,但RT-DETR计算复杂度更高,提示优化潜力。评估指标包括精确率、mAP、GFLOPs和模型大小,确保可重现性。【数据速览】
图 1:木制品完整生产工艺流程示意图。
图 2:图像采集流程示意图。
图3:数据增强处理流程示意图。
图 4:数据集注释页面。
图 5:不同缺陷类别的示意图。
图6: 该数据集评估参数的统计图表。(a) 数据集中四种类型缺陷的分布比例;(b) 缺陷位置的分布情况;(c) 缺陷的大小及其对应的标记框数量;(d) 缺陷中心点的空间分布;(e) 不同类型缺陷的尺寸统计信息;(f) 缺陷目标在高度和宽度方面的分布比例。
【总结与展望】
本数据集为水性涂饰木制品缺陷检测提供了关键资源,支持深度学习模型的训练和优化,推动智能制造转型。通过Zenodo平台(DOI: 10.5281/zenodo.15679291)免费开放,包含图像、标注和代码示例,便于全球研究者使用。未来,可扩展到更多缺陷类型、基材变体或实时在线检测系统,结合边缘计算提升工业应用。同时,该工作启发其他环保材料领域的类似数据集构建,促进跨学科合作,如AI与材料科学的融合,最终降低缺陷率、提高产品质量和可持续性。
原文链接:(或点击左下角阅读原文)
Jia, N., Chen, K., Liu, C. et al. A Public Image Dataset for Surface Defect Detection of Water-Based Coated Wood Products. Sci Data (2026). IF 6.9SCIEJCR Q1综合性期刊2区
https://doi.org/10.1038/s41597-025-06443-1
【声明】
如有表述不准确之处,欢迎留言或私信指正
机器学习相关电子书籍,后台私信【机器学习】
欢迎各位老师、同学们投稿


感谢大家的转发与关注

