当前位置: 首页 > news >正文

(论文阅读30/100)Convolutional Pose Machines

30.文献阅读笔记CPMs

简介

题目

Convolutional Pose Machines

作者

Shih-En Wei, Varun Ramakrishna, Takeo Kanade, and Yaser Sheikh, CVPR, 2016.

原文链接

https://arxiv.org/pdf/1602.00134.pdf

关键词

Convolutional Pose Machines(CPMs)、articulated pose estimation

研究问题

Pose Machines provide a sequential prediction framework for learning rich implicit spatial models.

Pose Machines为了学习丰富的隐式空间模型提供了序列预测框架。

将CNN应用于pose machine framework

梯度消失的问题:

反向传播梯度在网络的多个层中传播时强度会减弱。

增大感受野,一般有如下几种方式:

增大pool,但是这种做法对图片额外添加的信息过多,会牺牲精度;

增大卷积核,但这种方式会增加参数量;

增加卷积层,但卷积层过多会造成网络的负担,造成梯度消失等问题

研究方法

将CNN应用于pose machine framework

学习图像特征和图像相关的空间模型的task of pose estimation(姿态估计)

CNN直接对来自上阶段的belief maps进行操作,对零件位置做出越来越精确的估计,而无需明确的图形模型式推理。

提供了一个自然的学习目标函数,强制执行中间监督,补充反向传播梯度并调节学习过程,解决了梯度消失的难题。

图像特征和前一阶段生成的belief maps都被用作输入。belief maps为后续阶段提供了每个部件位置空间不确定性的非参数编码,使 CPM 能够学习丰富的、与图像相关的部件间关系空间模型。

不使用图形模型,对belief maps进行操作,所以整个架构完全可微分,可以端对端训练。

为了捕捉longrange interactions:需要较大的感受野

Pose machines 和cnn pose machines对比

输入:裁剪图像归一化为368 × 368

网络结构:五个卷积层和两个1 × 1卷积层组成的网络结构(全卷积结构)

2c:第一阶段仅从局部图像证据中预测部分信念。证据是局部的,因为网络第一阶段的感受野被约束在输出像素位置周围的一个小块上。以一个较小的感受野对图像进行局部检查。

如果人体有p个关节点,那么belief map有p+1层(还有背景层)

其实就是heatmaps,各通道表示各关键点在每个像素位置处的概率

2d:第二阶段网络的输出层获得足够大的感受野,以便学习各部分之间潜在的复杂和long-range correlations。还要输入一个center map。center map是高斯响应,构造响应图的真值。

增大感受野:

增大stride,确实stride越大感受野相应的也增大,并且论文中指出,在高精度区域,8stride和4stride表现一样好。

研究结论

由卷积网络组成的序列架构能够通过在阶段之间交流日益精炼的不确定性保持信念来隐式地学习姿态的空间模型。

在所有的主要基准上都达到了最先进的准确性。

创新不足

多人检测失败

额外知识

高斯响应

相关文章:

  • Angular 路由无缝导航的实现与应用(六)
  • centos 6.10 安装swig 4.0.2
  • python科研绘图:面积图
  • App分发的原理ipa分发系统需求
  • YOLO目标检测——谢韦尔钢材缺陷检测数据集下载分享【含对应voc、coco和yolo三种格式标签】
  • 钉钉统计部门个人请假次数go
  • Wpf 使用 Prism 实战开发Day05
  • PyCharm 【unsupported Python 3.1】
  • Vue3与Vue2:前端进化论,从性能到体验的全面革新
  • c语言-数据结构-栈和队列的实现和解析
  • 微信如何设置自动保存图片和视频
  • demo(二)eurekaribbon----服务注册、提供与消费
  • C语言初学3:变量和常量
  • 【数据结构】希尔排序(最小增量排序)
  • java 旋转方阵
  • [笔记] php常见简单功能及函数
  • Bytom交易说明(账户管理模式)
  • co.js - 让异步代码同步化
  • ECMAScript6(0):ES6简明参考手册
  • flask接收请求并推入栈
  • Java的Interrupt与线程中断
  • jquery cookie
  • nginx 负载服务器优化
  • Python利用正则抓取网页内容保存到本地
  • React Native移动开发实战-3-实现页面间的数据传递
  • Spring技术内幕笔记(2):Spring MVC 与 Web
  • Traffic-Sign Detection and Classification in the Wild 论文笔记
  • 给自己的博客网站加上酷炫的初音未来音乐游戏?
  • 目录与文件属性:编写ls
  • 区块链分支循环
  • 入手阿里云新服务器的部署NODE
  • 我的业余项目总结
  • nb
  • k8s使用glusterfs实现动态持久化存储
  • 移动端高清、多屏适配方案
  • 整理一些计算机基础知识!
  • # 手柄编程_北通阿修罗3动手评:一款兼具功能、操控性的电竞手柄
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • #Linux(Source Insight安装及工程建立)
  • $refs 、$nextTic、动态组件、name的使用
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (4)事件处理——(2)在页面加载的时候执行任务(Performing tasks on page load)...
  • (C语言)输入一个序列,判断是否为奇偶交叉数
  • (Mirage系列之二)VMware Horizon Mirage的经典用户用例及真实案例分析
  • (八十八)VFL语言初步 - 实现布局
  • (博弈 sg入门)kiki's game -- hdu -- 2147
  • (二)Pytorch快速搭建神经网络模型实现气温预测回归(代码+详细注解)
  • (二)windows配置JDK环境
  • (附源码)ssm高校社团管理系统 毕业设计 234162
  • (附源码)小程序 交通违法举报系统 毕业设计 242045
  • (原)Matlab的svmtrain和svmclassify
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • (转)Scala的“=”符号简介
  • (转)大型网站的系统架构
  • .net mvc部分视图