当前位置: 首页 > news >正文

NVDLA专题11:具体模块介绍——CROSS Channel Data Processor

概述

交叉通道数据处理器(CDP)沿通道方向执行操作。在NVDLA 1.0 中,通道处理旨在处理局部响应归一化(LRN)层。LRN通过沿通道方向对局部输入区域进行归一化来执行一种横向抑制。归一化函数如下所示

局部区域形状总是1×1×n,数字n是可配置的,其范围是[3,5,7,9],用硬件门实现除法和分数指数等算术函数成本很高,上述等式可以分解为

注意到,可以通过对相应的寄存器进行编程来绕过,以便将CDP视为独立的查找表(LUT)函数,对于RESMO(往复指数和多重运算)f(x)采用查找表方法。

下图显示了通道数据处理子单元的内部模块以及与其他子单元的连接。该图仅用于捕捉想法,并不代表实际的RTL模块边界和层次结构。

通道处理子单元总是与其他处理子单元独立工作。它从PDMA接收输入数据,并向其发送输出数据。由于内存访问限制,输入数据序列是按特定顺序排列的。输入顺序如下图所示,输出顺序与输入顺序相同。

下表显示了当前已知一些网络中的LRN层参数。

stripe edge上的数据元素可被相邻stripe使用,这些数据需要被缓冲,缓冲entry数应为[Max(localregionsize)1]×8 = 7×8 = 56byte。

缓冲区大小估计

在跨通道数据处理子单元时有三个主要缓冲区:激活块中的LUT、读DMA缓冲区和写DMA缓冲区。LUT大小与SDP相同(644Bytes)。

对于读DMA缓冲区,确定其大小有两个限制。第一个是覆盖存储器系统访问延迟,假设是128个周期。另一个是接入带宽,峰值性能情况是每个周期8Bytes(int8中8个元素,int16/fp16中4个元素),因此读DMA缓冲区大小为128×8 = 1kBytes。

功耗考虑

通道数据处理子单元针对NVDLA 1.0中的LRN层。基于对当前网络的分析,通道处理使用率较低。

基于本地响应归一化层数百分比,通道数据处理子单元将在大部分时间空闲。因此,该设计支持单元的时钟门控。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 2024新型数字政府综合解决方案(六)
  • 【Qt】内置对话框
  • PTA求简单交错序列前N项和
  • CSS的:host伪类:精粹自定义Web组件选择艺术
  • 【1.0】vue3的创建
  • 检测到目标URL存在http host头攻击漏洞
  • 智能电梯标志新时代:墨水屏电子标签引领变革
  • 【网络安全】IDOR导致信息泄露
  • 易企秀场景秀源码系统全新升级,方便制作各种Html5应用的制作工具 带完整的安装代码包以及搭建部署教程
  • QT的基础数据类型(上)
  • DOM型xss靶场实验
  • 【基础算法总结】多源 BFS_多源最短路问题
  • 基于django的双选宠物托管服务平台/python宠物托管系统
  • 设计模式反模式:UML图示常见误用案例分析
  • 深度学习入门-01
  • ----------
  • 【comparator, comparable】小总结
  • 【vuex入门系列02】mutation接收单个参数和多个参数
  • 【翻译】Mashape是如何管理15000个API和微服务的(三)
  • android图片蒙层
  • extract-text-webpack-plugin用法
  • flutter的key在widget list的作用以及必要性
  • gitlab-ci配置详解(一)
  • Java方法详解
  • Java小白进阶笔记(3)-初级面向对象
  • MySQL主从复制读写分离及奇怪的问题
  • QQ浏览器x5内核的兼容性问题
  • Rancher如何对接Ceph-RBD块存储
  • React-flux杂记
  • Spring Boot MyBatis配置多种数据库
  • 诡异!React stopPropagation失灵
  • 回流、重绘及其优化
  • 浅谈web中前端模板引擎的使用
  • 数据结构java版之冒泡排序及优化
  • 算法-插入排序
  • 算法---两个栈实现一个队列
  • 在Docker Swarm上部署Apache Storm:第1部分
  • Semaphore
  • ​​​​​​​Installing ROS on the Raspberry Pi
  • ​LeetCode解法汇总1410. HTML 实体解析器
  • #设计模式#4.6 Flyweight(享元) 对象结构型模式
  • (附源码)springboot课程在线考试系统 毕业设计 655127
  • (官网安装) 基于CentOS 7安装MangoDB和MangoDB Shell
  • (机器学习-深度学习快速入门)第三章机器学习-第二节:机器学习模型之线性回归
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (转)iOS字体
  • (转)MVC3 类型“System.Web.Mvc.ModelClientValidationRule”同时存在
  • (转)母版页和相对路径
  • (转载)CentOS查看系统信息|CentOS查看命令
  • (转载)在C#用WM_COPYDATA消息来实现两个进程之间传递数据
  • .CSS-hover 的解释
  • .net mvc actionresult 返回字符串_.NET架构师知识普及
  • .net MVC中使用angularJs刷新页面数据列表
  • .Net 中的反射(动态创建类型实例) - Part.4(转自http://www.tracefact.net/CLR-and-Framework/Reflection-Part4.aspx)...
  • .net 逐行读取大文本文件_如何使用 Java 灵活读取 Excel 内容 ?