当前位置: 首页 > news >正文

目标检测: Fast R-CNN原理

Fast R-CNN论文地址:  https://arxiv.org/pdf/1504.08083.pdf

1 概述:

考虑到R-CNN速度很慢, 作者提出了一个改善模型:Fast R-CNN.  相比R-CNN, Fast R-CNN的优点在于加快了selective search的步骤和同时训练分类和回归过程, 从整体上加快了速度. 

Fast R-CNN对R-CNN的改进部分:

  • 将R-CNN中三个模块(CNN, SVM, Regression)整合, 极大了减少了计算量和加快了速度
  • 不对原始图像进行selective search提取, 而是先经过一次CNN, 在feature map上使用selective search截取候选区域, 进行分类回归
  • 为了兼容不同图片尺度, 作者使用了ROI Pooling 算法, 将特征图池化到固定维度的特征向量.

 

2 ROI Pooling原理

ROI Pooling论文地址: https://arxiv.org/pdf/1406.4729.pdf

ROI Pooling也叫Spatial Pyramid Pooling(空间金字塔池化). 

由于图片尺寸各不相同, 需要经过缩放拉伸到统一尺寸, 再送入CNN, 这会间接导致识别精度下降, 通过ROI Pooling可以将不同尺度的特征图输出为固定维度的特征向量, 同时也获取到了图像的特征信息, 而且速度很快.

__________________________________________________________________

 

3 步骤

3.1 预训练一个分类CNN
3.2 修改CNN, 将最后一个flatten层以及后面的层删掉, 换成ROI Pooling层
3.3 将图像经过CNN, 得到特征图, 使用selectiv search选出2k个候选区域
3.4 在ROI Pooling层后跟几个FC, 最后输出2个分支:

  • 第一个分支是softmax层, 输出k+1个分类
  • 第二个分支是regression, 预测输出k个类别的box参数

 

4 损失理解

 

为什么要使用smooth L1?

因为2点: 

  • 0点可导
  • loss越来越小时, 梯度也适当减小, 有助于收敛

 

5 与R-CNN性能比较

转载于:https://www.cnblogs.com/dxscode/p/11443752.html

相关文章:

  • webserver SVN / Subversion
  • VS开发C++控制台应用程序(示例)
  • WPF调用C++生成的dll文件(示例)
  • ffmpeg命令参数详解
  • Spring 注入多列和单列
  • 网络书籍
  • Java 深Clone 和 浅Clone
  • .net core控制台应用程序初识
  • ANR日志分析
  • 使用trace文件分析ANR
  • javacv获取视频第一帧
  • Android ANR log trace日志文件分析
  • ffmpeg开发文档
  • js 特殊字符替换成换行
  • xampp for mac配置局域网访问
  • 【个人向】《HTTP图解》阅后小结
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • co模块的前端实现
  • Hibernate最全面试题
  • IIS 10 PHP CGI 设置 PHP_INI_SCAN_DIR
  • Linux快速配置 VIM 实现语法高亮 补全 缩进等功能
  • magento2项目上线注意事项
  • mysql中InnoDB引擎中页的概念
  • node 版本过低
  • php中curl和soap方式请求服务超时问题
  • python学习笔记 - ThreadLocal
  • webpack+react项目初体验——记录我的webpack环境配置
  • yii2权限控制rbac之rule详细讲解
  • 后端_MYSQL
  • 聚簇索引和非聚簇索引
  • 强力优化Rancher k8s中国区的使用体验
  • 使用SAX解析XML
  • 说说动画卡顿的解决方案
  • 用Visual Studio开发以太坊智能合约
  • HanLP分词命名实体提取详解
  • MPAndroidChart 教程:Y轴 YAxis
  • 阿里云重庆大学大数据训练营落地分享
  • "无招胜有招"nbsp;史上最全的互…
  • # 日期待t_最值得等的SUV奥迪Q9:空间比MPV还大,或搭4.0T,香
  • #1014 : Trie树
  • #android不同版本废弃api,新api。
  • #我与Java虚拟机的故事#连载13:有这本书就够了
  • (10)Linux冯诺依曼结构操作系统的再次理解
  • (10)STL算法之搜索(二) 二分查找
  • (Spark3.2.0)Spark SQL 初探: 使用大数据分析2000万KF数据
  • (SpringBoot)第七章:SpringBoot日志文件
  • (动手学习深度学习)第13章 计算机视觉---微调
  • (五)大数据实战——使用模板虚拟机实现hadoop集群虚拟机克隆及网络相关配置
  • (一)eclipse Dynamic web project 工程目录以及文件路径问题
  • (原創) 如何讓IE7按第二次Ctrl + Tab時,回到原來的索引標籤? (Web) (IE) (OS) (Windows)...
  • (转)Linq学习笔记
  • (转载)虚函数剖析
  • (轉貼) UML中文FAQ (OO) (UML)
  • ..回顾17,展望18
  • .net Application的目录