当前位置: 首页 > news >正文

OpenCV第十四讲: Fast特征点与ORB特征点原理详解

一般特征说的意思是关键点+描述子;

一. Fast特征点检测

原理: FAST是一种角点, 主要检测局部像素灰度变换明显的地方。

核心思想: 如果一个像素与邻域的像素差别较大,那么它更可能是角点。

优势: 由于只需要比较像素的亮度大小,所以速度十分快捷。

  • 检测过程

    1.在图像中选取一点像素p,假设它的亮度为Ip;
    2.设置一个亮度阈值T;
    3.以像素p为中心,选取半径为3的圆上的上16个像素点;
    4.假如选取的圆上有连续的N个点的亮度大于 (Ip+T) 或 (Ip-T), 那么像素p就被人误是特征点;
    5.循环以上四步, 对每一个像素都进行相同的操作;

ps: 在这里,N一般取12, 即算法叫做Fast-12, 同理有Fast-9. Fast-11;

在Fast-12中有一项预测试操作,以快速排除绝大多数不是角点的像素。该操作为: 对于每一个像素,直接检测邻域上的第1,5,9,13个像素点的亮度,只有当这四个像素中有3个满足上述步骤4的条件时,才将当前像素点作为候选点进行之后的操作,否则,直接排除

  • 非极大值抑制

    需要对特征点计算FAST得分值s,计算方式如下:

    1.计算以某个特征点p为中心的邻域内(3x3或5x5等), 有多少个特征点;
    2.计算每个特征点的得分值s = 所有特征点与中心像素点的差值的绝对值总和,若q是邻域内所有特征点中响应值最大的,则保留; 否则,抑制。
    3.若邻域内只有一个特征点,则该特征点保留;

假设P,Q两个点相邻,分别计算两个点与其周围的16个像素点之间的差分和为V,去除V值较小的点,即把非最大的角点抑制掉。

  • Fast角点的缺陷

    1.它提取角点的数量大,且数目不确定;
    2.Fast角点不具有方向和尺度信息(取固定半径为3的圆)

  • OpenCV使用Fast检测

	#include <opencv2/opencv.hpp>
		cv::FAST(img, kpts, 75);
		cv::Mat imgKpts;

		cv::drawKeypoints(img, kpts, imgKpts, cv::Scalar::all(-1), cv::DrawMatchesFlags::DEFAULT);
		cv::imshow("kerpoints", imgKpts);
		cv::waitKey(2);

二、ORB特征点检测

ORB算法效率比sift高两个数量级, 在计算速度上, ORB是sift的100倍, ORB是surf的10倍。就目前来说,ORB算法是综合性能在各种测评离相较于其他特征提取算法是最好的!

ORB特征实质是一种改进的Fast角点, 改进的地方主要有以下两点,分别对关键点描述子进行了改进:

特征描述子应该具有特性:对光照不敏感(亮度), 具有尺度一致性(大小), 旋转一致性(角度)等

ps:ORB算法本身没有解决ORB的尺度一致性问题,而是我们在实现过程中,借助某些技术手段(如构建图像金字塔),来改善这方面的性能。

在ORB中的尺度不变性可由构建图像金字塔解决,旋转不变型可由灰度质心法来实现

  • 关键点: Fast角点改进

    ORB在原来的Fast角点的基础上改进,第一指定提取一定数量的角点, 第二分别对Fast角点计算Harris响应值, 然后选取前N个具有最大响应值的角点作为最终的角点集合。

  • 灰度质心法

    所谓的质心是指; 以图像块灰度值作为权重的中心,在这里每个像素的像素值就代表其质量的大小。

    1.定义一个小的图像块, 并定义图像块的矩为m;

    m p q = ∑ x , y x p y q I ( x , y ) m_{p q}=\sum_{x, y} x^{p} y^{q} I(x, y) mpq=x,yxpyqI(x,y)

    2.通过图像矩就可以计算图像的质心C;

    C = ( m 10 m 00 , m 01 m 00 ) C=\left(\frac{m_{10}}{m_{00}}, \frac{m_{01}}{m_{00}}\right) C=(m00m10,m00m01)

    3.可以得到特征点的方向: 质心与几何中心O的向量OC;

    θ = atan ⁡ 2 ( m 01 , m 10 ) \theta=\operatorname{atan} 2\left(m_{01}, m_{10}\right) θ=atan2(m01,m10)

    在这里稍微拓展一下,这个地方很多人都简单的略过去了,里面的原理可能还是懵懵懂懂,什么是图像的矩? 什么是质心?图像的质心为什么是这么算?

    • 质心的介绍
      在这里插入图片描述
      其中M为质点系的总质量.

    • 在这里 有关于矩的详细介绍,在这里我就简单说一下,矩针对不同的中心的,具有不同的表现形式,针对中心点为零(原点)的点,就叫做原点矩; 针对中心为均值的点,就叫做中心距;不同阶数,可称为不同阶矩(如k阶矩)

    实质:就是以中心点为核心与其他所有点的差值的k次方, 再求平均值;

    • "图像的矩"
      根据前两步的解释可知, m_{0,0}就代表图像块的总质量,其他同理可知;

质心相对于质点系中各质点的相对位置与坐标系的选择无关。质点系的质心仅与各质点的质量大小和分布的相对位置有关。

  • 描述子:BRIEF描述子改进

    原始的BRIEF描述子 :在一个特征点的邻域选择n对像素点(p,q),比较其灰度值大小,如果I§>I(q),则令其对应的值为1,否则为0,这样对n对像素比较之后,就形成一个长度为n的二进制向量。一般一般n取128、256或512。

    选择n对像素点的方法:随机选取或均匀采样等多种方式;

    **改进的BRIEF描述子—steered BRIEF:**加入了旋转不变性。在关键点的改进中,使得关键点有了方向,根据此方向,可以获取旋转后的描述子信息,即描述子具有了旋转不变性。

  • OpenCV使用ORB

#include <opencv2/opencv.hpp>
		cv::Ptr<cv::ORB> orb = cv::ORB::create();
		orb->detect ( img_1,keypoints_1 );
		orb->compute ( img_1, keypoints_1, descriptors_1 );

三.小结

到目前为止,OpenCV的基础学习已经更新到了十四讲, 这算是最后一讲了(机器学习部分不算在这里),后面的内容主要从以下几个方面开始:

  • 前面所讲内容中需要深入补充的

  • 项目使用过程中所涉及到的图像处理算法

  • 机器学习算法(可能不放在这里,也有可能放在这里)

相关文章:

  • DAVIS第一课: 事件相机的工作原理和相关核心功能简介
  • DAVIS第二课:基于事件相机的视觉里程计
  • Rtab-Map学习之rtabmap_ros源代码剖析
  • DAVIS前言:事件相机资料调研
  • DAVIS第三课: 基于事件相机的光流法计算
  • CUDA学习第一天: 基础概念扫盲
  • CUDA学习第二天: GPU核心与SM核心组件
  • DAVIS第四课:基于DAVIS的特征点检测和追踪
  • CUDA学习第三天:Kernel+grid+block关系
  • DAVIS第五课: 基于事件相机的一种几何实时3DSLAM算法
  • ubuntu学习技巧1:容易混淆但又重要的命令
  • RGB颜色空间对应的不同颜色列表
  • V-SLAM重读(1): SVO: Fast Semi-Direct Monocular Visual Odometry
  • C++11回顾学习(4): 语法解析之虚函数与继承
  • ROS回顾学习(10): 项目研究中遇到问题记录2
  • [译]如何构建服务器端web组件,为何要构建?
  • __proto__ 和 prototype的关系
  • Docker 笔记(2):Dockerfile
  • Druid 在有赞的实践
  • java8-模拟hadoop
  • javascript 总结(常用工具类的封装)
  • java取消线程实例
  • jquery ajax学习笔记
  • log4j2输出到kafka
  • python学习笔记 - ThreadLocal
  • thinkphp5.1 easywechat4 微信第三方开放平台
  • 给Prometheus造假数据的方法
  • 力扣(LeetCode)357
  • 每个JavaScript开发人员应阅读的书【1】 - JavaScript: The Good Parts
  • 山寨一个 Promise
  • 使用parted解决大于2T的磁盘分区
  • 数据可视化之 Sankey 桑基图的实现
  • 为物联网而生:高性能时间序列数据库HiTSDB商业化首发!
  • 学习JavaScript数据结构与算法 — 树
  • 一个SAP顾问在美国的这些年
  • 一文看透浏览器架构
  • 用 Swift 编写面向协议的视图
  • 在 Chrome DevTools 中调试 JavaScript 入门
  • Hibernate主键生成策略及选择
  • 容器镜像
  • ​中南建设2022年半年报“韧”字当头,经营性现金流持续为正​
  • $(document).ready(function(){}), $().ready(function(){})和$(function(){})三者区别
  • (20050108)又读《平凡的世界》
  • (delphi11最新学习资料) Object Pascal 学习笔记---第2章第五节(日期和时间)
  • (java)关于Thread的挂起和恢复
  • (LeetCode C++)盛最多水的容器
  • (排序详解之 堆排序)
  • (三分钟了解debug)SLAM研究方向-Debug总结
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • .net core 微服务_.NET Core 3.0中用 Code-First 方式创建 gRPC 服务与客户端
  • .NET Core引入性能分析引导优化
  • .NET MVC 验证码
  • .net websocket 获取http登录的用户_如何解密浏览器的登录密码?获取浏览器内用户信息?...
  • .netcore 6.0/7.0项目迁移至.netcore 8.0 注意事项
  • .NET企业级应用架构设计系列之应用服务器