当前位置: 首页 > news >正文

(论文阅读32/100)Flowing convnets for human pose estimation in videos

32.文献阅读笔记

简介

题目

Flowing convnets for human pose estimation in videos

作者

Tomas Pfister, James Charles, and Andrew Zisserman, ICCV, 2015.

原文链接

https://arxiv.org/pdf/1506.02897.pdf

关键词

Human Pose Estimation in Videos

研究问题

视频中的人体姿态估计

研究方法

总体流程如下:

一、使用光流将多帧信息结合起来,从而从时间上下文中获益。

输入t以及其前后n帧rgb图片,相邻帧的热图可以使用光流进行扭曲和对齐,从而有效地在时间上传播位置信息。离t帧越远的帧权重越低。

邻近帧作为强有力的 "专家意见",通过端对端反向传播来学习专家池权重。

分别回归输入图像中每个关节的关节位置热图。该热图(最后一个卷积层 conv8 的输出)是一个固定大小的 i × j × k 维立方体(此处为 64 × 64 × 7,表示 k = 7 个上半身关节)。在训练时,通过在ground truth关节位置放置一个方差固定的高斯,为每个关节分别合成ground truth标签热图

l2 loss:对predicted heatmap and the synthesised(合成) ground truth heatmap.之间的像素平方差进行惩罚

回归热图而不是(x, y)坐标的好处:可以理解失败并直观地看到网络的 "思考过程";由于设计上允许网络的输出是多模态的,即允许在多个空间位置有置信度,因此学习变得更加容易:在训练的早期,一个给定的关节可能会在多个位置发生反应;随着训练的进行,错误的反应会慢慢被抑制。相反,如果输出只有手腕(x,y)坐标,那么网络只有在预测正确时才会有较低的损失(即使它对正确的位置 "越来越有信心")。

提高热图的空间分辨率:(i) 使用最小池化(只有两个 2 × 2 最大池化层);(ii) 所有步长都是统一的(这样分辨率就不会降低)。除 conv9(池化层)外,所有层后都有 ReLU。

卷积层代替全连接层

二、在初始热图之外增加卷积层,以学习人体布局的隐式空间模型。这些层能够学习人体各部位之间的依赖关系。这些 "空间融合 "层可以消除运动学上无法实现的姿势估计失败。

学习关节的空间依赖关系:Spatial fusion layers

(conv7)作为输入,学习人体位置之间的依赖关系,将 conv7 和 conv3(跳转层)的连接作为输入,并通过另外五个带有 ReLU 的卷积层进行反馈,大内核用于扩大网络的感受野。在该网络的末端附加了一个单独的损失层,并在整个网络中进行反向传播。

研究结论

在“野外数据集”上表现远优于目前技术水平。

创新不足

未涉及多人检测,只检测人物上半身

额外知识

光流:计算机视觉--光流法(optical flow)简介-CSDN博客

是空间运动物体在观察成像平面上的像素运动的瞬时速度。

光流计算使用FastDeepFlow

相关文章:

  • 常用免费网站总结(自用)
  • 如何在3DMax中使用超过16个材质ID通道?
  • 避免defer陷阱:拆解延迟语句,掌握正确使用方法
  • 微服务的注册发现和微服务架构下的负载均衡
  • cocos----1
  • 压力测试总共需要几个步骤?思路总结篇
  • 想买GPT4会员却只能排队?来看看背后的故事!
  • Linux安装Docker完整教程
  • 【C++11】线程库
  • 假如我是AI Agent专家,你会问什么来测试我的水平
  • 67基于matlab图像处理,包括颜色和亮度调整、翻转功能、空间滤波和去噪、频域滤波和去噪、噪声添加,形态学操作、边缘检测及示波器集成的GUI图像处理。
  • 【2016年数据结构真题】
  • DQL、DML、DDL、DCL的概念与区别
  • 家用小型洗衣机哪款性价比高?婴儿专用洗衣机推荐
  • 二百零三、Flume——Flume实时采集数据频率为1s的高频率Kafka数据直接写入ODS层表的HDFS文件路径下
  • 网络传输文件的问题
  • 【许晓笛】 EOS 智能合约案例解析(3)
  • 07.Android之多媒体问题
  • android 一些 utils
  • axios请求、和返回数据拦截,统一请求报错提示_012
  • Babel配置的不完全指南
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • EOS是什么
  • Java 9 被无情抛弃,Java 8 直接升级到 Java 10!!
  • JavaScript 奇技淫巧
  • JavaWeb(学习笔记二)
  • k8s如何管理Pod
  • MySQL主从复制读写分离及奇怪的问题
  • node入门
  • vuex 学习笔记 01
  • 理解在java “”i=i++;”所发生的事情
  • 力扣(LeetCode)56
  • 聊聊flink的BlobWriter
  • 使用SAX解析XML
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 用Visual Studio开发以太坊智能合约
  • ​ArcGIS Pro 如何批量删除字段
  • ​批处理文件中的errorlevel用法
  • ​直流电和交流电有什么区别为什么这个时候又要变成直流电呢?交流转换到直流(整流器)直流变交流(逆变器)​
  • #pragma data_seg 共享数据区(转)
  • (Repost) Getting Genode with TrustZone on the i.MX
  • (webRTC、RecordRTC):navigator.mediaDevices undefined
  • (二)换源+apt-get基础配置+搜狗拼音
  • (二)学习JVM —— 垃圾回收机制
  • (附源码)计算机毕业设计ssm高校《大学语文》课程作业在线管理系统
  • (九十四)函数和二维数组
  • (图)IntelliTrace Tools 跟踪云端程序
  • (转)清华学霸演讲稿:永远不要说你已经尽力了
  • .h头文件 .lib动态链接库文件 .dll 动态链接库
  • .NET 6 在已知拓扑路径的情况下使用 Dijkstra,A*算法搜索最短路径
  • .NET Framework .NET Core与 .NET 的区别
  • .net6使用Sejil可视化日志
  • .net连接oracle数据库
  • /etc/X11/xorg.conf 文件被误改后进不了图形化界面
  • [ 云计算 | AWS 实践 ] Java 如何重命名 Amazon S3 中的文件和文件夹