8.26
1.MarineYOLO: Innovative deep learning method for small target detection in underwater environments
Alexandria Engineering Journal 影响因子6.2
摘要:为了应对水下环境的挑战,提出了MarineYOLO network。首先,将传统的C2f模块转变为EC2f模块,同时将Efficient Multi-scale Attention(EMA)模块引入到yolov8。此外,Convolutional Block Attention Module(CBAM)被引入,进一步细化了Feature Pyramid Network(FPN),增强小目标的特征提取。Wise-IoU替换了传统的CIoU,提高目标定位的精度和稳定性。在RUOD数据集上,AP值达到78.5%,URPC为88.1%。
2.Underwater Small Target Detection Based on Improved YOLOv7 Model
Research Square 影响因子11 CODE
摘要:在yolov7的基础上,设计了G-ELAN模块,将低层次特征进行卷积,并将其元素与高级特征逐元素相乘,实现多层次特征融合,有效减少了水下浮游生物造成的目标遮挡干扰。其次,引入Residual-FasterNet,该算法整合了基于FasterNet T-shaped接受域的残差策略。
结论:本研究提出了一种创新的YOLOv7-GR网络模型,它集成了针对水下生物特征的G-ELAN模块和Res-FasterNet模块。通过整合多层特征信息,有效的解决了水下浮游生物造成的遮挡问题,通过利用T形接受域和残差学习,提高了小目标的检测效果。此模型为了更好的适应水下数据集,应用了MDPIoU损失函数。
3.An underwater target recognition algorithm incorporating improved attention mechanism and downsampling
The Visual Computer 影响因子3 CODE
摘要:主要通过注意力机制和下采样网络解决密集和模糊的问题。首先,为了解决dense targets的问题,引进了channel attention,增强了对空间维度信息的关注度,突出了不同通道特征图的显著性,提高了对密集目标的检测能力。其次,为了解决水下目标模糊的问题,引进down-sampling,结合同层连接和跨层跳跃。该模块减少了卷积降采样造成的信息损失,并更全面地集成了来自不同层的特性。最好,引入focus loss function,解决positive和negative样本的不均衡。该函数动态地降低了训练过程中易于区分的样本的权重,并对难以区分的样本进行了优先排序。
结论:与yolov5L算法相比,与YOLOv5L算法相比,该算法将分别提高了2.71%和6.25%,使计算量减少了9.1GFLOPs,参数量减少了5.44M,在损失值方面收敛得更好。
4.YOLOv7-SN: Underwater Target Detection Algorithm Based on Improved YOLOv7
symmetry 影响因子2
摘要:YOLOv7-SN。在网络的关键部分引入channel attention moduleSE,提高特征提取能力。在骨干网络后面引入了具有扩展卷积的RFE模块来捕获多尺度信息。此外,使用Wasserstein distance替换传统损失函数来应对小目标检测的挑战。最后,我们采用携带隐式知识的probe heads来进一步提高模型的精度。URPC2020,提高5.9%;RUIE,提高3.9%。
结论:这是通过改变检测头,使用一种称为NWD的新度量来代替传统的损失函数,并将SE注意力和RFE模块集成到YOLOv7模型中。
5.Underwater Target Detection Using Deep Learning: Methodologies, Challenges, Applications, and Future Evolution
综述类 3.4
摘要:本文研究了水下无线传感器网络(UWSNs)的最新目标(目标)检测算法。为了确保选择最新和最先进的算法,我们只考虑了过去七年开发的算法,而现有的调查并没有完全解决这些算法。这些算法根据其体系结构和操作方法进行分类,并描述了它们的应用程序,这有助于在不同的应用程序中选择它们。本文还讨论了该算法的优缺点,这有助于在今后的研究中提高其性能。此外,还对所描述的算法进行了比较分析,进一步了解了它们在各种应用中的选择和未来的增强。使用IEEE数据库给出了基于最近10年(2023-2013)的各种应用中解决的算法的描述,这有助于了解它们未来的应用趋势。最后,强调了与水下目标探测相关的挑战和未来的研究方向。
8.27
精读
1.MarineYOLO: Innovative deep learning method for small target detection in underwater environments
Alexandria Engineering Journal 影响因子6.2
摘要:为了应对水下环境的挑战,提出了MarineYOLO network。首先,将传统的C2f模块转变为EC2f模块,同时将Efficient Multi-scale Attention(EMA)模块引入到yolov8。此外,Convolutional Block Attention Module(CBAM)被引入,进一步细化了Feature Pyramid Network(FPN),增强小目标的特征提取。Wise-IoU替换了传统的CIoU,提高目标定位的精度和稳定性。在RUOD数据集上,AP值达到78.5%,URPC为88.1%。
一:引言
EC2f结构,增加接受域和捕捉更多细节信息;CBAM注意力机制,增强模型提取重要特征的能力;Wise-IoU,提高小目标的定位准确度并减少漏检和错误检测。
二:相关工作
Squeeze:轻量化的目标检测模型,利用轻量化特征提取网络,适用于嵌入资源约束设备的实时检测。由于轻量化的性质,检测精度有所降低。DetectNet,是一种基于深度学习的目标检测方法,它结合了卷积神经网络和基于卷积操作的目标检测技术。虽然检测网在速度和精度上表现良好,但它在低对比度和复杂背景的水下环境中可能受到限制。
三:方法
在yolov8的基础上,将C2f模块升级到EC2f模块,并嵌入了一个基于跨空间学习的Efficient Multi-scale Attention(EMA)。高校的捕捉多尺度特征信息并通过EMA模块实现跨不同空间尺度的特征加权。
将卷积块注意模块(FPN)机制引入特征金字塔网络(CBAM),并将其应用到网络的头部结构中进行分类和检测。这一改进使网络能够有效地从较浅的特征图中提取与小目标相关的特征信息,进一步提高了目标检测的性能。
最后,我们用Wise-IoU替换了原始YOLOv8网络中的完整IoU(CIoU)。
一:EC2f模块
这一部分没太理解
Yolov5改进---注意力机制:ICASSP2023 EMA基于跨空间学习的高效多尺度注意力、效果优于ECA、CBAM、CA | 小目标涨点明显
Efficient Multi-Scale Attention:以保留每个通道上的信息和降低计算开销为目标,将部分通道重塑为批量维度,并将通道维度分组为多个子特征,使空间语义特征在每个特征组中均匀分布
二:Convolutional block attention module
CBAM(卷积块注意模块)注意机制在提高网络的特征表示能力方面起着至关重要的作用,包括the Channel Attention Module(CAM) and the Spatial Attention Module(SAM)
8.29
Underwater Small Target Detection Based on Improved YOLOv7 Model
一:引言
G-ELAN:提出了Grouped Partitioned Convolution(GPConv),在Partial Convolution上引入grouped Convolution,增强层间互补性和模型对复杂环境的适应力,提高了上下文信息的获取能力,有效减轻遮挡干扰,提高处理效率。
Res-FasterNet:实现了局部信息和全局信息的有效融合,显著提高了对小目标的检测。剩余连接的加入进一步提高了网络的稳定性,保证了模型在水下目标检测任务中的综合性能。
(1)提出了一种新的卷积策略GPConv,它取代了YOLOv7网络中传统的E-ELAN模块的卷积,创建了一个新的G-ELAN模块。提高了在遮挡条件下的目标检测速度和精度。(2)首次设计了Res-FasterNet模块,取代了YOLOv7的特征提取模块。提高了小目标检测的精度,提高了网络的稳定性。
二:方法
GPConv的核心是输入特征映射的层次处理,它将输入划分为低级特征和高级特征。低级特征侧重于捕获基本的视觉细节,而高级特征则包含更丰富的语义信息。这种分层策略允许网络在精确处理图像细节的同时,分析场景和对象的高级语义。GPConv将高级特性进行卷积,并有效地将它们与原始的低级特性相融合。这种融合机制使模型能够集成细节和语义信息,提高了特征表示的能力。该策略在遮挡条件下特别有效,大大减轻了目标检测任务中的干扰。因此,为了提高模型的性能在处理遮挡目标,我们选择取代传统的3x3卷积与GPConv中间两个E-ELAN模块YOLOv7网络,因为中间模块更关注上下文信息的集成,提供更有效的性能处理。
由于微小目标的微小大小,它们在输入特征图上的表示需要关注精确地捕捉微妙的细节。YOLOv7的E-ELAN模块的接受域限制了在检测小目标时对这些详细特征的提取,从而影响了对小目标的准确识别。
基于此,我们的研究选择了Faster-net作为改进的基础设施,并提出了一个新的网络——Res-FasterNet。res-FasterNet的关键创新解决了快速网在小目标检测过程中遇到的网络梯度消失和爆炸问题,从而导致目标检测的训练不稳定和不准确。其中,我们合并的残余连接使输入信息通过身份映射机制跨越多个层次,从而促进了网络中信息的快速流动。该方法不仅提高了网络的稳定性和有效性,而且保证了网络在训练过程中能够更深入地学习其主要特征,并在正向和反向传播过程中保持稳定的梯度流。此外,去除紧固块有助于降低网络的复杂性,并在不显著影响模型性能的情况下减少训练和推理的计算负担。
在FasterNet中,我们保留了快速网的“T”型接受域,增强小目标与其周围环境的对比度,优化背景分离效果。这种结构设计通过纵向部分捕获边缘和纹理信息等细粒度特征,并通过水平部分扩展接受性5/13场,以获得更广泛的空间信息。通过将t型感受域的局部和全局信息整合到t型感受域,在不同特征层次上提供更丰富、更详细的信息,提高了模型判断小目标位置和形状的准确性,优化了小目标的检测和定位能力。
此外,在深度网络中,随着层次结构的增加,特征的大小也会缩小,这可能会导致小目标特征的丢失。通过在较浅的网络水平上整合t型接受域,可以最大限度地保留小目标的特征信息。基于这些考虑,我们使用Res-FasterNet来替换YOLOv7骨干网络两侧的E-ELAN模块。与E-ELAN相比,Res-FasterNet显著提高了模型的学习效率和训练过程的稳定性,在处理复杂场景和小目标方面有了显著的改进。
相比之下,本研究中引入的MPDIoU方法通过最小化预测盒和实际边界盒之间的点距离,提供了一种更精确的相似性度量。它还考虑了诸如重叠面积、中心点之间的距离以及宽度和高度的偏差等因素。该方法在水下环境中具有更强的适用性和稳定性,使MPDIoU成为比CIoU更全面的水下目标边界盒相似性评估器。结果表明,模型预测的边界框更准确地匹配了实际注释,有效地捕获了水下目标的位置和形状。
9.1
