当前位置:主页 > 教育教学论文 >

基于深度学习的小目标检测方法研究

更新时间:2022-11-16
所需金币150 [1金币=1元] 资料包括 点击这里给我发消息 QQ在线咨询
文档格式:doc/docx 全文字数:17000 ↓↓立即下载全文 **温馨提示**
以下仅列出文章摘要、目录等部分内容,如需获取完整论文资料,或原创定制、长期合作,请随时联系。
微信QQ:312050216
点击这里给我发消息
扫一扫 扫一扫
基于深度学习的小目标检测方法研究

摘要

伴随着大数据的积累和算力的不断发展,深度学习从理论的平原向高坡迈 进,并对计算机视觉领域产生了深远影响。作为计算机视觉的基本课题之一,基 于深度学习的目标检测在速度和精度已经大幅度超过传统机器学习方法。但是 在应用到实际场景时,目前最先进的目标检测方法对于小目标的检测能力仍然 较差。考虑到自动驾驶,无人机巡航,机器人巡航等实际涉及安全的场景下,及 时准确的检测小目标是确保安全的关键,小目标检测已然成为目标检测技术在 诸多领域应用的关键难点。

针对小目标检测存在的特征衰减,类别失衡,定位偏差等难点,本文系统 性地从显式和隐式两个角度总结当前小目标检测研究现状,在此之上依次递进 式地提出相应的解决方案。从显式角度,本文提出使用级联自适应深度反馈结 构的两阶段小目标检测方法,称为级联自适应深度反馈网络 (Cascade Adaptive Deep Feedback Network,CADFNet)。在特征融合阶段,为了尽可能避免特征衰减, CADFNet 使用自适应深度反馈金字塔网络自适应反馈增强融合特征。在采样策 略上,使用基于 IoU 的平衡的采样策略筛选高质量的区域提议,提高检测精度。同时为了保证小目标的特征不会因为池化计算丢失,将 Cascade R-CNN 的 RoI 池化操作替换为 RoIAlign 操作,通过双线性插值优化了特征截取过程中的特征 计算损失。在级联训练阶段,使用级联反馈的方式进一步提升训练效率。在损失 函数的优化上,为了解决小目标对于定位偏差的敏感,本文将回归损失函数由原 来的 Smooth l1 函数替换为 CIoU 损失函数。同时为了解决分类和回归多任务训 练时训练速度不一致,造成性能下降的问题,使用数据驱动的方式,采用自适应 权重子网络自适应学习分类和回归损失函数的权重。最后在后处理优化上使用 基于 DIoU 的 Soft NMS 算法进一步较少了网络的漏检。

更进一步,为了解决基于显式角度的小目标检测方法在速度和精度无法得到 很好平衡的问题。从隐式角度,本文提出多向上下文融合的单阶段小目标检测方 法,称为多向上下文融合网络 (Multi-directional Context Fusion network, MCFN)。为了探索不同上下文信息对于网络的影响,MCFN 使用单阶段方法 YOLOv3 作 为基本架构。在此架构上,为了融合局部上下文信息。MCFN 提出了局部感受野 增强结构用于融合和解耦局部上下文信息; 同时为了挖掘目标之间的局部上下文 关联,提出上下文关系矩阵,融合目标先验知识。在融合全局上下文中,MFCN 使用了自适应扩张卷积结构,逐层自适应融合上下文信息。最后为了实现有效的

上下文交互表达,MFCN 基于 Transformer 构建了一个上下文交互结构,用于有 效增强视觉表征。

在 Tsinghua-Tencent-100k 和 MS COCO 两个基准数据集上的实验表明,本文 提出的两阶段网络 CADFNet 可以有效增强小目标特征,提升小目标检测能力, 与其它类似的目标检测方法具有较高的竞争力。从隐式角度,本文提出的 MFCN 不仅有效提升了 YOLOv3 的检测能力,并且相较于其它作为对比的检测方法,在 速度和精度上取得了更好的平衡,并且有更好的小目标检测能力。

关键词: 小目标检测,深度学习,特征增强,级联训练,自适应反馈,多向上下文