当前位置: 首页 > news >正文

计算机视觉中的细节问题(二)

参考   计算机视觉中的细节问题(二) - 云+社区 - 腾讯云

目录

(1)photometric distortions的含义

(2)MSE、MAE的含义

(3)图像金字塔与特征金字塔

(4)RGBA的含义

(5)目标检测中样本的难度是如何区分的

(6)什么是机器学习模型的容量

(7)张量秩的含义

(8)目标检测中样本的难度是如何区分的

(9)全连接层的原理

(10)softmax的原理


(1)photometric distortions的含义

指的是在输入卷积神经网络之前对数据进行预处理的操作,比如改变亮度、饱和度等。

(2)MSE、MAE的含义

MSE(Mean Square Error)均方误差,MSE是真实值与预测值的差值的平方然后求和平均。通过平方的形式便于求导,所以常被用作线性回归的损失函数。MAE(Mean Absolute Error)平均绝对误差。是绝对误差的平均值。可以更好地反映预测值误差的实际情况。

(3)图像金字塔与特征金字塔

在目标检测或语义分割中图像金字塔指的是直接对图像进行上采样而形成的层级结构,由于计算量大的原因这种方法现在已经被抛弃了。特征金字塔主要是通过CNN的层来形成的特征,广泛的使用在目标检测中。

(4)RGBA的含义

  • R:红色值。正整数 | 百分数
  • G:绿色值。正整数 | 百分数
  • B:蓝色值。正整数 | 百分数
  • A:Alpha透明度。取值0~1之间。(颜色的透明度)

(5)目标检测中样本的难度是如何区分的

数量大的样本一般是简单样本,数量小的样本一般是难样本。

(6)什么是机器学习模型的容量

通俗地讲,模型的容量是指它拟合各种函数的能力。

(7)张量秩的含义

标量:秩为零的张量(只有大小,没有方向,由1(3^0)部分组成);
向量:秩为一的张量(有大小和一个方向,由3(3^1)部分组成);
Dyad:秩为2的张量(有大小和两个方向,由9(3^2)部分组成);
Triad:秩为3的张量(有大小和三个方向,由27(3^3)部分组成);
这样,张量和标量、向量……之间似乎有一一对应关系。但是,标量不是张量,虽然秩为0的张量是标量;同样的,向量不是张量,虽然秩为1的张量是向量;dyad不是张量,但秩为2的张量是dyad(矩阵)。

(8)目标检测中样本的难度是如何区分的

根据IoU来区分,一般小于0.3为负样本,0.3到0.5为难样本,大于0.5为正样本。

(9)全连接层的原理

如果输入的feature map是2X2,那么就需要把这个feature map 拉成4X1的列向量,如果你的feature map 的channels是3,也就是你的输入是3X2X2,也就是相当于有了12个像素点,你就需要把feature map 拉成12X1的列向量,这时候,再乘一个权重,这个权重要把12个像素点都包含进去,所以这个权重的矩阵形式应该是1X12,所以经过一个全连接层后的输出就是1X12X12X1=1X1,这时候需要看你的需要多少个1X1的神经元了,如果是3个的话,那么输出就是3X(1X12X12X1)=3X(1X1)。

(10)softmax的原理

softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内。假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值:

                                             \large S_i=\frac{e^i}{\sum_j e^j}

 

相关文章:

  • Javascript 代码规范
  • linux驱动开发(2)开发流程
  • 【云原生】设备云之前端可视化编程
  • 计算电磁学(二)分析方法
  • 【Django】开发日报_3.2_Day:模板继承
  • 探索原味BFF模式
  • unity初学 Mstudio教程
  • Complete Partition Of Array
  • 单节点k8s—自签名证书—四层负载均衡—helm安装rancher
  • 高频面试题:谈谈你对 Spring Boot 自动装配机制的理解
  • Apple Xcode 14 (14A309) 正式版发布(含下载)
  • mysql 执行计划 type详解
  • Java进阶篇之泛型
  • 发送post请求渲染el-table,并实现搜索和分页功能
  • [RK3568 Android11] 时间同步机制
  • [deviceone开发]-do_Webview的基本示例
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • 【附node操作实例】redis简明入门系列—字符串类型
  • 【剑指offer】让抽象问题具体化
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • 【知识碎片】第三方登录弹窗效果
  • Akka系列(七):Actor持久化之Akka persistence
  • Android 架构优化~MVP 架构改造
  • Angular6错误 Service: No provider for Renderer2
  • CentOS从零开始部署Nodejs项目
  • Create React App 使用
  • HTTP中GET与POST的区别 99%的错误认识
  • js写一个简单的选项卡
  • Python_网络编程
  • Python进阶细节
  • spring学习第二天
  • vue2.0开发聊天程序(四) 完整体验一次Vue开发(下)
  • 翻译--Thinking in React
  • 如何编写一个可升级的智能合约
  • 微服务入门【系列视频课程】
  • elasticsearch-head插件安装
  • 积累各种好的链接
  • 摩拜创始人胡玮炜也彻底离开了,共享单车行业还有未来吗? ...
  • ​云纳万物 · 数皆有言|2021 七牛云战略发布会启幕,邀您赴约
  • #1015 : KMP算法
  • #我与Java虚拟机的故事#连载01:人在JVM,身不由己
  • (BAT向)Java岗常问高频面试汇总:MyBatis 微服务 Spring 分布式 MySQL等(1)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第2节(共同的基类)
  • (Redis使用系列) Springboot 在redis中使用BloomFilter布隆过滤器机制 六
  • (八)五种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (附源码)springboot美食分享系统 毕业设计 612231
  • (每日持续更新)jdk api之FileReader基础、应用、实战
  • (十七)Flask之大型项目目录结构示例【二扣蓝图】
  • (十三)Java springcloud B2B2C o2o多用户商城 springcloud架构 - SSO单点登录之OAuth2.0 根据token获取用户信息(4)...
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (转)【Hibernate总结系列】使用举例
  • * CIL library *(* CIL module *) : error LNK2005: _DllMain@12 already defined in mfcs120u.lib(dllmodu
  • *** 2003
  • ./和../以及/和~之间的区别