当前位置: 首页 > news >正文

(论文阅读11/100)Fast R-CNN

文献阅读笔记

简介

题目

Fast R-CNN

作者

Ross Girshick

原文链接

https://arxiv.org/pdf/1504.08083.pdf

目标检测系列——开山之作RCNN原理详解-CSDN博客

Fast R-CNN讲解_fast rcnn-CSDN博客

Rcnn、FastRcnn、FasterRcnn理论合集_rcnn fastrcnn fasterrcnn_沫念·的博客-CSDN博客

关键词

NUll

研究问题

目标检测任务背景:首先确定大量候选对象位置;其次对候选对象细化以确定目标位置。这些问题的解决往往折中了速度、精度或者简单性。

之前的方法:

RCNN提取2000个候选框冗余工作太多。

SPP算法也有缺点:仅使用log损失函数微调无法更新空间金字塔池化前的卷积层,限制了非常深的网络的准确性。

研究方法

Fast R - CNN:用全连接层分类。

ROI pooling:感兴趣区域池化。使用最大池化将任何有效感兴趣区域内的特征转换为具有固定空间范围H × W (例如, 7 × 7)的小特征映射,其中H和W是独立于任何特定RoI的层超参数。每个RoI由一个四元组特征(r,c,h,w)定义,该(r,c,h,w)指定其左上角(r,c)及其高度和宽度(h,w)。是SSp的特例,其中只有一个金字塔层。

从预训练的网络中初始化:将最后一个最大池化层替换为RoI池化层,通过设置H和W与网络的第一个全连接层(例如,对于VGG16 , H = W = 7)兼容来配置RoI池化层。其次,将网络的最后一个全连接层和softmax (分别训练用于1000 - way ImageNet分类)替换为前面描述的两个兄弟层( K + 1个类别上的全连接层和softmax以及类别特定的边界框回归)。第三,修改网络以获取两个数据输入:图像列表和这些图像中的RoIs列表。

Multi-task loss.

Mini-batch sampling.

研究结论

1.比R - CNN、SPPnet拥有更高的检测质量 2.训练是单阶段的,使用多任务损失3.训练可以更新所有的网络层4.特征缓存不需要磁盘存储

创新不足

候选区域的选择仍然不是很高效

额外知识

RCNN网络

相关文章:

  • Vue自定义组件学习笔记
  • ElasticSearch集群环境搭建
  • 为什么要停止在 SpringBoot 中使用字段注,改用构造器注入
  • 蓝桥杯每日一题2023.11.2
  • 计算机服务器中了locked勒索病毒怎么办,勒索病毒解密,数据恢复
  • 187. 重复的DNA序列-滑动窗口
  • Java使用pdfbox进行pdf和图片之间的转换
  • pix2tex - LaTeX OCR 安装使用记录
  • Rocky9 上安装 redis-dump 和redis-load 命令
  • uinapp微信小程序隐私政策授权
  • httpclient工具类(支持泛型转换)
  • Vue3.0 provide与inject依赖注入:VCA
  • 线程同步——互斥量解锁、解锁
  • Python教程---Python交互界面
  • idea 配置checkstyle全过程
  • ----------
  • [ 一起学React系列 -- 8 ] React中的文件上传
  • 【前端学习】-粗谈选择器
  • css属性的继承、初识值、计算值、当前值、应用值
  • hadoop集群管理系统搭建规划说明
  • JS学习笔记——闭包
  • leetcode386. Lexicographical Numbers
  • markdown编辑器简评
  • QQ浏览器x5内核的兼容性问题
  • 编写符合Python风格的对象
  • 大整数乘法-表格法
  • 多线程 start 和 run 方法到底有什么区别?
  • 聊聊springcloud的EurekaClientAutoConfiguration
  • 前端每日实战:70# 视频演示如何用纯 CSS 创作一只徘徊的果冻怪兽
  • 扫描识别控件Dynamic Web TWAIN v12.2发布,改进SSL证书
  • Salesforce和SAP Netweaver里数据库表的元数据设计
  • 积累各种好的链接
  • 容器镜像
  • ​Linux Ubuntu环境下使用docker构建spark运行环境(超级详细)
  • ###STL(标准模板库)
  • #Z2294. 打印树的直径
  • #宝哥教你#查看jquery绑定的事件函数
  • (论文阅读30/100)Convolutional Pose Machines
  • (没学懂,待填坑)【动态规划】数位动态规划
  • (四)库存超卖案例实战——优化redis分布式锁
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • ******之网络***——物理***
  • **CI中自动类加载的用法总结
  • **登录+JWT+异常处理+拦截器+ThreadLocal-开发思想与代码实现**
  • .cfg\.dat\.mak(持续补充)
  • .NET Core WebAPI中封装Swagger配置
  • .NET HttpWebRequest、WebClient、HttpClient
  • .NET 反射的使用
  • .NET/C# 中你可以在代码中写多个 Main 函数,然后按需要随时切换
  • .net反编译的九款神器
  • .NET牛人应该知道些什么(2):中级.NET开发人员
  • .Net通用分页类(存储过程分页版,可以选择页码的显示样式,且有中英选择)
  • @Pointcut 使用
  • [ 环境搭建篇 ] 安装 java 环境并配置环境变量(附 JDK1.8 安装包)
  • [C++数据结构](22)哈希表与unordered_set,unordered_map实现