当前位置: 首页 > news >正文

Traffic-Sign Detection and Classification in the Wild 论文笔记

摘要

尽管在交通标志识别和分类领域已经取得了不错的成绩,但是很少有在real world images中同步处理两个tasks的研究。论文有两个特点。一是创建了一个100000张全景的Benchmark,有30000张包含了交通标志。这些图片覆盖了不同光线和天气状况。每个交通标志都被标注了一个label,边框和pixel mask.这个Benchmark是Tsinghua-Tencent 100k。二是论文阐述了一个可以识别和分类交通标志的端到端的CNN。大部分之前的针对物体的CNN图片处理方案在对像交通标志这种小物体的检测上表现并不好。实验结果显示了论文提出网络的鲁棒性和优越性。Benchamrk,源码和CNN模型都已经开源。

1.简介

Pascal voc和ImageNet是两个常用的Benchmark。在这些数据集中,目标识别都是针对较大的物体(边框占整个图片的20%左右)。然而,在一张2000X2000的图片中,一个交通标志只有80X80。因此,需要设计一个针对有意义的小物体的检测方案。
交通标志通过功能可以被分类多个类别。在每个类别中,可以被进一步分为很多有相似形状但细节不同的子类。这要求交通标志的识别需要两个步骤:识别后分类。识别就是将图片中的交通标志框出来,分类是对框出来的交通标志分类。
目前方法在识别和分类中都达到了接近完美的结果。但是德国提出的这个benchmark在世界世界中并不适用。在GTSDB识别任务中,算法需要识别出四个主类中的一类。在GTSDB分类benchmark中,大部分图片中都有交通标志,而算法只需决定标志属于哪个子类,而且没有错误情况的干扰。在现实世界中,识别交通标志主要问题是物体很小,通常小于图片大小的1%。因此,算法必须过滤掉许多干扰情况,保留真实的交通标志,因此,我们创建了一个新的实际的Benchmark,并用这个数据评估用于识别和分类交通标志的combined CNN approch。
本文的贡献主要有:

  • 创建了一个新的、更加实际的交通标志Benchmark

  • 我们训练了两个CNN用于识别交通标志,并且同步识别和分类交通标志。结果显示了两个网络的鲁棒性

2.数据收集

原始数据是由6个单目摄像机拍下来的,然后对图像进行处理。benchmark包括中国的5个城市,包括市中心和郊区。全图分辨率是2048X2048。一共100000张,30000张中包括交通标志。其中,交通标志多为小图。标注是人工标注。形状为多边形和椭圆形。

3.卷积网络

我们训练了两个网络。一个用于识别,一个同步识别和分类。这两个网络共享大部分结构除了最后一步的分支。

3.1 结构

clipboard.png

clipboard.png

该模型是对overfeat模型的改进,在第6层以后添加了分支。论文介绍了这样改进的原因。经过实验发现这样会网络收敛的更快。更深的网络表现更好,但是会消耗更多GPU和训练时间。因此在速度和准确率上寻取平衡。另一个改动使在最后的分支上添加了生成类别向量的分支。

3.2 训练

由于不同类别的数据量不同,在训练时使用了数据增大技术(data augmentation technique)。我们简单的忽略了实例小于100的类别。剩下45个类别可以用于分类。实例在100和1000之间的类别在训练中都增大到1000个。其余大于1000的不变。
为了增大这些数据,我们为每个类别使用标准模板,随机旋转(-20°,20°),在(20,200)的范围内随机比例化大小,同时添加合理随机的变形。然后挑选出没有交通标志的图片,混入模板,添加随机噪声。

4. 结果

对于10000张包含交通标志的图片,按2:1用于训练和测试。其余90000张均用于测试。按照coco的标准,根据大小将交通标志分为3类:小物体(area<32²),中(32²<area<96²),大(area>96²)。这个评估标准可以测出识别器对不同大小物体的识别效果。

clipboard.png

4.1 识别

识别交通标志:84% accuracy , 94% recall

4.2 同步识别分类

从图中可以看出,Fast R-CNN has a recall 0.56 and accuracy 0.50 而我们的方法 has a recall 0.91 and accuracy 0.88.

5. 结论

我们创建了一个新的交通标志的benchmark。与之前的交通标志benchmark相比,该数据集中的图片更多变,且标志大多非常小。数据集包含了更多的图片,且图片有更高的分辨率。而且,提供了像素级的分割。我们在该数据集上训练了两个网络,一个是交通标志识别器。另一个可以同时识别和分类。
In the future,我们计划寻找更多在该数据集中少有出现的交通标志。我们还计划加速process以在移动设备上能够实时运行。

相关文章:

  • Kafka集群磁盘使用率瞬超85%,幕后元凶竟是它?
  • 如何挑选服务器?哪个牌子的最好?(1万元以下的)
  • SNMP、ASN.1、MIB之间的关系
  • Oracle浅谈之逻辑体系第一回
  • 迁移TFS2008后,项目门户网站及Team Explorer的报表均无法正常显示的原因
  • Word编辑故障经典问答
  • java 是否输出是整数
  • 项目实践中Linux集群的总结和思考
  • Android开发之策略模式初探
  • android 2.3 StrictMode 使用
  • 前端之本http协议
  • 浙江省委组织部长蔡奇做客腾讯:我是微博控
  • SEO优化方案及SEO流程表
  • SpriteKit 技巧之添加背景图片
  • 实验九 三层交换机配置路由DHCP中继(二)
  • Android框架之Volley
  • Angular js 常用指令ng-if、ng-class、ng-option、ng-value、ng-click是如何使用的?
  • es6--symbol
  • JavaScript 奇技淫巧
  • Just for fun——迅速写完快速排序
  • Mac 鼠须管 Rime 输入法 安装五笔输入法 教程
  • MD5加密原理解析及OC版原理实现
  • Otto开发初探——微服务依赖管理新利器
  • Sass Day-01
  • TypeScript实现数据结构(一)栈,队列,链表
  • web标准化(下)
  • Zsh 开发指南(第十四篇 文件读写)
  • 从零开始的无人驾驶 1
  • 飞驰在Mesos的涡轮引擎上
  • 记录一下第一次使用npm
  • 那些被忽略的 JavaScript 数组方法细节
  • 批量截取pdf文件
  • 移动端 h5开发相关内容总结(三)
  • 《码出高效》学习笔记与书中错误记录
  • 从如何停掉 Promise 链说起
  • 交换综合实验一
  • #define,static,const,三种常量的区别
  • #调用传感器数据_Flink使用函数之监控传感器温度上升提醒
  • #预处理和函数的对比以及条件编译
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (一)spring cloud微服务分布式云架构 - Spring Cloud简介
  • (一)搭建springboot+vue前后端分离项目--前端vue搭建
  • (正则)提取页面里的img标签
  • .equal()和==的区别 怎样判断字符串为空问题: Illegal invoke-super to void nio.file.AccessDeniedException
  • .NET DataGridView数据绑定说明
  • .NET高级面试指南专题十一【 设计模式介绍,为什么要用设计模式】
  • .NET运行机制
  • :“Failed to access IIS metabase”解决方法
  • @软考考生,这份软考高分攻略你须知道
  • [1159]adb判断手机屏幕状态并点亮屏幕
  • [2016.7 Day.4] T1 游戏 [正解:二分图 偏解:奇葩贪心+模拟?(不知如何称呼不过居然比std还快)]
  • [3D基础]理解计算机3D图形学中的坐标系变换
  • [AUTOSAR][诊断管理][ECU][$37] 请求退出传输。终止数据传输的(上传/下载)
  • [CISCN 2023 初赛]go_session