当前位置: 首页 > news >正文

YOLO系列之yolov1解读(1)

文章目录

  • 说明
  • 原理
  • 解析
  • 损失函数的定义
  • 技巧
  • 总结
  • 参考

论文地址: https://arxiv.org/pdf/1506.02640.pdf
在这里插入图片描述

说明

  • 这个系列会总结关于yolo的解读,为本人理解,还望交流指正。

V1版本:

  • v1版本的结构为

img --》VGGNET–》4096-》7730
在这里插入图片描述

原理

  • 将图像分为7*7 的格子,每个格子预测两个先验框
  • 一开始会初始化GT的中心点,那些落在中心点的格子负责预测物体,并且一个格子只负责一个物体的预测,那些没落到中心点的格子,不负责预测物体。(简单说有中心点的格子负责预测物体,没有格子的不负责预测)
  • 通过训练进行预测框的更新

解析

7 * 7 * 30
7cell* cell * ((x,y, w,h ,confidence) * 2, 20类的概率)

损失函数的定义

位置 + 大小 + confidence + rnoobject Confidence + 类预测
在这里插入图片描述

coord 是object 为1 的 ,比较重要,所以coord 的概率要设置比较大, noobj的概率设置较小。
根号是为了避免小偏移对大图像的影响过小。

技巧

为了更好的收敛, 让(x,y)坐标变成偏移量,如坐标为(3.4, 4.5), 可以设置为(0.4, 0.5),在计算的时候再加上3和4, 能使得更快更好的收敛

  • 只对最大的预测框进行回归修正,实验证明,并不会降低map

  • 采用非极大值预测方法, 如果对于一些大物体,可能会有多个网格同时预测同一个物体。

  • 对置信度修改, 结合类别的概率* IOU,可过滤小概率物体大IOU的框
    在这里插入图片描述

总结

  • v1中每个格子只负责预测一个物体, 所以对于小物体和重叠的物体无法更好的预测出。
  • 运用全连接层,使得计算量大并且复杂。

参考

https://zhuanlan.zhihu.com/p/70387154?utm_medium=social&utm_oi=1160532055342977024

相关文章:

  • Softing IT Networks线上研讨会 | 9月 (下篇)
  • HBase原理深入
  • webpack5 之 基础构建打包
  • STM32使用寄存器点灯实验
  • 技术对接35
  • 金仓数据库 KingbaseES 插件参考手册 plsql_pldbgapi
  • 测试面试 | 某 BAT 大厂测试开发面试真题与重点解析
  • 2022鹏城杯
  • Kubernetes学习笔记-保障集群内节点和网络安全(3)限制pod使用安全相关的特性20220828
  • [免费专栏] Android安全之利用ADT获取内存中的敏感信息
  • 网络编程必读经典书籍
  • TDengine-解决集群搭建过程中启动失败问题
  • STM32 GPIO工作原理
  • ros入门(九)----ros navigation
  • 数学建模神经网络应用,构建神经网络模型方法
  • 时间复杂度分析经典问题——最大子序列和
  • 【162天】黑马程序员27天视频学习笔记【Day02-上】
  • 【399天】跃迁之路——程序员高效学习方法论探索系列(实验阶段156-2018.03.11)...
  • 30秒的PHP代码片段(1)数组 - Array
  • Eureka 2.0 开源流产,真的对你影响很大吗?
  • Java方法详解
  • mysql外键的使用
  • passportjs 源码分析
  • PHP变量
  • Python连接Oracle
  • react 代码优化(一) ——事件处理
  • Spring核心 Bean的高级装配
  • 关于使用markdown的方法(引自CSDN教程)
  • 利用DataURL技术在网页上显示图片
  • 如何使用 JavaScript 解析 URL
  • 手写双向链表LinkedList的几个常用功能
  • ​flutter 代码混淆
  • #我与Java虚拟机的故事#连载04:一本让自己没面子的书
  • (Python) SOAP Web Service (HTTP POST)
  • (二)换源+apt-get基础配置+搜狗拼音
  • (分享)自己整理的一些简单awk实用语句
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (七)MySQL是如何将LRU链表的使用性能优化到极致的?
  • (转)母版页和相对路径
  • (转载)从 Java 代码到 Java 堆
  • .NET Core Web APi类库如何内嵌运行?
  • .NET Core实战项目之CMS 第十二章 开发篇-Dapper封装CURD及仓储代码生成器实现
  • .NET I/O 学习笔记:对文件和目录进行解压缩操作
  • .net 无限分类
  • .NET/C# 判断某个类是否是泛型类型或泛型接口的子类型
  • .net2005怎么读string形的xml,不是xml文件。
  • .net6 webapi log4net完整配置使用流程
  • .NET委托:一个关于C#的睡前故事
  • .NET正则基础之——正则委托
  • .NET中两种OCR方式对比
  • .pop ----remove 删除
  • @Autowired多个相同类型bean装配问题
  • @RequestMapping处理请求异常
  • [ CTF ] WriteUp- 2022年第三届“网鼎杯”网络安全大赛(白虎组)
  • [ Linux ] Linux信号概述 信号的产生