yolo系列之yolov4(4)
文章目录
- 总结
- 改进
- 输入的改进
- BackBone创新
- Dropblock
- Sppnet
- CBAM conv block attation module
- PAN 双向特征传播(path aggregation network)
总结
前几篇文章总结了一些1,2,3的特征,基本上v3 也是当前应用最广泛的了。
接下来说说v4
改进
输入的改进
- 数据的增强: Mosaic数据增强
Mosaic:进行了数据随机缩放、随机裁剪、随机排布的方式进行拼接。
优点: 丰富数据集,减少GPU
Sat: 增加噪音点,如0.008 ,增加难度
** label smothing** : 增加拟合难度,不让网络拟合到100%
BackBone创新
改变了darknet-53 ,变成了CSP darknet53
引入5层Csp ,并且激活函数改为了mish,可以很好的降低计算量,减少内存,后面仍然采用Leaky_relu
- mish 和leaky_relu的差别
- mish 给一些特征一些发挥的机会, 越没用的特征越不可能
Dropblock
替代dropout的方案, 不再是随机某几个点,而是变成随机块。
Sppnet
- 引入多种特征提取方式,最后进行特征融合
CBAM conv block attation module
设置权重,关注于较重要的特征