当前位置: 首页 > news >正文

论文笔记之:A CNN Cascade for Landmark Guided Semantic Part Segmentation

 

 

A CNN Cascade for Landmark Guided Semantic Part Segmentation 

ECCV 2016

 

  摘要本文提出了一种 CNN cascade (CNN 级联)结构,根据一系列的定位(landmarks or keypoints),得到特定的 pose 信息,进行 语义 part 分割。前人有许多单独的工作,但是,貌似没有将这两个工作结合到一起,相互作用的 multi-task 的工作。本文就弥补这个缺口,提出一种 CNN cascade 的 tasks,首先进行 landmark的定位,然后将这个信息作为输入,用于指导 semantic part segmentation。作者将这个结构用于 facial part segmentation,取得了显著的效果。代码将会很快放出,候选连接如下:http://www.cs.nott.ac.uk/~psxasj/ 

 

    引言:就像摘要里提到的差不多,就是这个意思。不废话了。看看效果图,然后看看别人怎么做的。。。

 

    本文的创新点写的很有特色,说解决了下面的两个问题:

  1. Is a CNN for facial part segmentation needed at all ?

  2. Can facial landmarks be used for guiding facial part segmentation, thus reversing the result metioned above ? 

 

   我们卖个关子(其实,我是想说,先装个逼,但是,。。。,忽略这句话吧,God),先不解释,希望看完后,读者能自己领悟到答案。 

 

  

 

 

 

 

 


    The Proposed Method

  本文提出的 CNN 级联网络结构,如上图 4 所示,是一个 landmark localisation 网络,紧跟着是一个 facial part segmentation 网络结构。这个级联网络是基于 VGG-FCN 的,基于 CAFFE ,主要由两个部分构成:

  1. 利用交叉熵损失函数(Sigmoid Cross Entropy Loss)进行 facial landmarks 的检测,这是一个 FCN 网络;

  2. 第二,是受到 human pose estimation method 【1】 的激发,检测到的 68 个定位点,编码成 68 个单独的 channels,这个 channels 在其对应的 landmark 位置有一个 2D Gaussian 。这 68 个channels 堆积在一起,和原始图像一起传送给 segmentation network。然后用标准的 Softmax loss 进行分割。

  这里的【1】是:Human pose estimation with iterative error feedback. CVPR 2016 

  接下来,详细的介绍这两个网络架构:

  

  Facial Landmark Detection

  对于 landmark detection 的训练过程类似于训练一个 FCN 用于 part segmentation。将 Landmarks 编码成位于提供的 landmarks' location 的 2D Gaussian。每一个 landmark 分配其单独的 channel 来阻止与其他 landmark 的重合,允许每一个 point 更加容易相互区分。与 part segmentation 主要的不同在于 其 loss function。Sigmoid Cross Entropy Loss 被用来回归一个像素点包含一个 point 的可能性。More concretely,给定我们的 gt Gaussians P 和 预测的 Gaussians p, 每一个相同维度是 N*W*H, 定义的损失函数为:

   Guided Facial Part Segmentation

   采用和 FCN 类似的配置方法进行分割,利用 softmax loss 作为最后的损失函数。如果 N 是输出的个数,$p_{i, j}$ 是像素点$(i, j)$的预测输出,n 是 gt label,那么 softmax loss l 就可以表达为:

    下面的表格展示了所用的 VGG-FCN 网络结构的具体参数设置:


 

  总结:  

  总体而言,本文是利用 landmark 的引导去做 face part 的分割。所以,网络的设计上就是由两个网络架构来实现的,首先是 landmark detection,然后将该网络的输出,输入到后面的 semantic part segmentation。看到摘要中,有这么一段话:this is the first time in literature that the interplay between pose estimation and semantic part segmentation is investigated. 为什么感觉将其用到 face 的part 分割,并不能充分的说明 pose estimation ? 因为就仅仅是一个人脸的 landmark 而已,哪有 pose 这一说??若是将其应用到 human parsing 上,结合 pose estimation 和 segmentation 还差不多。说实话,感觉有点挂羊头卖狗肉。。。

 

 

 

  Reference Paper:

  1. Human pose estimation with iterative error feedback. CVPR 2016 

  2. A CNN Cascade for Landmark Guided Semantic Part Segmentation 

  

 

 

 

 

 

相关文章:

  • C#文件相同性判断
  • Struts2日期类型转换
  • 新建一个文章
  • MySql(三): 覆盖索引( Covering Index )
  • Shell脚本编程30分钟入门
  • 【转】浅谈JavaScript、ES5、ES6
  • 股票操作指南
  • [译]声明式编程:它是一个真实的东西?
  • android 5.0 水波纹 实现
  • 多线程包:java.util.concurrent,
  • Openstack的vnc界面定制
  • android 6.0权限检测和请求
  • dirname ${BASH_SOURCE[0]}
  • ONVIF客户端搜索设备获取rtsp地址开发笔记(精华篇)
  • Git引用
  • C# 免费离线人脸识别 2.0 Demo
  • GDB 调试 Mysql 实战(三)优先队列排序算法中的行记录长度统计是怎么来的(上)...
  • iOS筛选菜单、分段选择器、导航栏、悬浮窗、转场动画、启动视频等源码
  • Java应用性能调优
  • js中的正则表达式入门
  • markdown编辑器简评
  • opencv python Meanshift 和 Camshift
  • React-flux杂记
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • 给初学者:JavaScript 中数组操作注意点
  • 基于游标的分页接口实现
  • 检测对象或数组
  • 开源中国专访:Chameleon原理首发,其它跨多端统一框架都是假的?
  • 前端学习笔记之观察者模式
  • 如何在GitHub上创建个人博客
  • 使用API自动生成工具优化前端工作流
  • 使用Maven插件构建SpringBoot项目,生成Docker镜像push到DockerHub上
  • 事件委托的小应用
  • 数据可视化之 Sankey 桑基图的实现
  • 微服务核心架构梳理
  • 微信小程序上拉加载:onReachBottom详解+设置触发距离
  • 应用生命周期终极 DevOps 工具包
  • 用Python写一份独特的元宵节祝福
  • Play Store发现SimBad恶意软件,1.5亿Android用户成受害者 ...
  • ​iOS安全加固方法及实现
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • #android不同版本废弃api,新api。
  • #QT(串口助手-界面)
  • $.proxy和$.extend
  • (12)Hive调优——count distinct去重优化
  • (C语言)球球大作战
  • (Java数据结构)ArrayList
  • (解决办法)ASP.NET导出Excel,打开时提示“您尝试打开文件'XXX.xls'的格式与文件扩展名指定文件不一致
  • (十一)手动添加用户和文件的特殊权限
  • (四)模仿学习-完成后台管理页面查询
  • (转) ns2/nam与nam实现相关的文件
  • ***检测工具之RKHunter AIDE
  • ***详解账号泄露:全球约1亿用户已泄露
  • .net core webapi Startup 注入ConfigurePrimaryHttpMessageHandler
  • .NET Core 中插件式开发实现