当前位置: 首页 > news >正文

[nsight compute使用指南] 查看存储体冲突

如何使用nsight compute查看

前言

作为cuda初学者,深知"工欲善其事必先利其器",奈何nsight compute如此庞杂,眼睛看花了的同时,心灵也受到了巨大的创伤。本期设计优化共享内存的至关重要的一个方面——存储体冲突(bank conflicts),即如何利用nsight compute查看,当前内存空间是否存在存储体冲突。

详细步骤

step1

nsight compute基于metrics给出相关分析结果,关于存储体冲突的主要在以下两个指标中l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_ld.sum和l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_st.sum,其中,前者是指从共享内存中load数据时的存储体冲突数量,后者是指向共享内存中store数据时的存储体冲突数量。

为了获得这两个指标,我们在profile时,需要在Metrics下勾选full。
在这里插入图片描述

step2

在Summary界面,双击函数名,进入Details界面

在这里插入图片描述
找到Memory Workload Analysis栏,点击左边的三角形
在这里插入图片描述
在Memory Chart的下拉框中,选中Memory Tables

在这里插入图片描述
在Shared Tables表下的Bank conflicts栏中,即可得到存储体冲突的数量。
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Halcon阈值处理的几种分割方法
  • 【MySQL】事务管理
  • Redis单线程模式
  • stm32入门学习14-电源控制
  • vue2中使用i18n配置elementUi切换语言
  • 数学基础 -- 卷积与矩阵乘法的区别
  • 基于R语言遥感随机森林建模与空间预测;遥感数据处理与特征提取;数据分析与可视化
  • 央企数据架构师徐智确认出席「第六届数据智能高峰论坛」
  • 容器化部署ES集群
  • 得到任务式 大模型应用开发学习方案
  • 【ARM CoreLink 系列 5.5 -- CI-700 Debug trace and PMU 】
  • Elasticsearch Nested类型详解与实战
  • 中小企业文档管理最佳方案:7个热门工具
  • 漏洞复现-K26-1开源-证书查询系统-任意文件读取
  • 【Linux】多线程7——线程池
  • 07.Android之多媒体问题
  • Android优雅地处理按钮重复点击
  • express.js的介绍及使用
  • PHP 程序员也能做的 Java 开发 30分钟使用 netty 轻松打造一个高性能 websocket 服务...
  • python 装饰器(一)
  • SpiderData 2019年2月16日 DApp数据排行榜
  • vue.js框架原理浅析
  • vue的全局变量和全局拦截请求器
  • Vue组件定义
  • Webpack 4 学习01(基础配置)
  • 翻译--Thinking in React
  • 基于webpack 的 vue 多页架构
  • 聊一聊前端的监控
  • 码农张的Bug人生 - 初来乍到
  • 判断客户端类型,Android,iOS,PC
  • 使用 QuickBI 搭建酷炫可视化分析
  • 微信支付JSAPI,实测!终极方案
  • 一道闭包题引发的思考
  • 正则表达式小结
  • 蚂蚁金服CTO程立:真正的技术革命才刚刚开始
  • (Bean工厂的后处理器入门)学习Spring的第七天
  • (web自动化测试+python)1
  • (不用互三)AI绘画工具应该如何选择
  • (转)http协议
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • ../depcomp: line 571: exec: g++: not found
  • .class文件转换.java_从一个class文件深入理解Java字节码结构
  • .gitignore文件_Git:.gitignore
  • .locked1、locked勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .net core Swagger 过滤部分Api
  • .Net面试题4
  • .NET中winform传递参数至Url并获得返回值或文件
  • .net中调用windows performance记录性能信息
  • .pyc文件还原.py文件_Python什么情况下会生成pyc文件?
  • @FeignClient注解,fallback和fallbackFactory
  • [ CTF ] WriteUp- 2022年第三届“网鼎杯”网络安全大赛(白虎组)
  • [20170705]diff比较执行结果的内容.txt
  • [Android]使用Android打包Unity工程
  • [CCIE历程]CCIE # 20604
  • [CF482B]Interesting Array