近日,城市轨道交通学院余朝刚副教授指导2022级研究生靳胜洁、操振在计算机科学领域顶级期刊《Engineering Applications of Artificial Intelligence》(简称EAAI,中国科学院SCI期刊一区Top期刊,影响因子7.5)上发表了最新研究成果“Two-stage vision system:Application of multi-perspective object detection network and character recognition network in industrial product classification”。
论文针对工业产品高精度识别提出了一种两阶段视觉识别系统,其核心架构为创新性网络YOLO-DSF(You Only Look Once-DualSight Fusion),该系统通过“检测-识别”两阶段协同设计,针对工业场景中目标尺寸差异大、类别编码复杂等痛点提出突破性解决方案。第一阶段的YOLO-DSF模型引入“DualSight”主干,其中新提出的轻量化LSPDown模块增强细节信息提取,GhostNet分支聚焦全局语义;自研的FocusFusion模块高效融合双分支特征,并在检测头中增设低级特征层,显著强化小目标感知能力。第二阶段加入U形去噪网络(UDNet)作为字符识别前端预处理,有效减少复杂背景噪声,提高字符可见度,进一步保障了后续分类精度。该研究为智能视觉检测系统的高精度、轻量化发展提供了全新思路,具有重要的理论价值与工程推广潜力。