当前位置: 首页 > news >正文

基于华为atlas的皮带跑偏、空载、堆煤、启停探索

生乎吾前,其闻道也固先乎吾,吾从而师之;生乎吾后,其闻道也亦先乎吾,吾从而师之。吾师道也,夫庸知其年之先后生于吾乎?是故无贵无贱,无长无少,道之所存,师之所存也。

写在前面:

写这篇的时候,想起当年第一次接触atlas还是在京东的一次aicon的会议上,其实那时觉得这东西挺新的,还有自己的IDE,其实自己也没用过。后来的工作中在面试中,也见过1-2个用过atlas的面试者。直到几年前归梓,阴差阳错,华为atlas满足信创的需求,才于23年12月正式研究学习atlas。几个月过去了,整体感觉昇腾生态闭塞、最新的git很难支持、华为各种软件包下载也很坑。问题是很多的,至于其他国产显卡,像曙光、海光、摩尔线程、寒武纪等自己也没机会接触,不得不说华为在信创这条路的部署是强于其他厂商的,于是我便这条路走下去了。

回归主题:

在真正做这件事情的时候,其实也预研了几天,也了解了别的公司的大体思路,比如精英、壹合等。其实我这里想做一个不一样的,有别于别人的,视觉有冲击力的,真正的all in one模型。

整体模型我没有选择基于检测的思路,而是选择基于分割的思路,因为分割可以帮我获取更多的检测不具备的信息,这里后续可以看到。皮带跑偏、空载、堆煤基于unet实现,皮带启停基于unet+光流跟踪实现。

整体感觉模型这块不算复杂,唯一的麻烦的地方就是皮带、煤、煤块这几个的分割是属于多标签分割问题,就是说一个像素可以属于其中的一个也可以是属于其中的几个。这块需要在损失函数处下一些功夫修改代码,当然也有其他曲径通幽的方法。这个修改不能算复杂,复杂的是这个修改同时还得兼容atlas的模型转化,这块就需要真正下功夫了。

另外一个复杂的地方就是皮带中轴线的方法,探索这个中轴线大概耗费了1个月的时间把,中间尝试了很多方法,比如label_centerlines、PCA、旋转角度法、曲线拟合等,效果都不太满意。这里需要考虑皮带多种形状的自适应性,还得考虑效果、考虑速度。最终根据自己的思想实现了一个中轴线确定的方法,客观的说该方法不是完美的,但是已经可以解决90%以上的场景,具体后面我会有图片展示。

数据制作:

这里我一共标注了1056张图片,数据的标签包括,左托锟、右托锟、皮带、煤、煤堆、背景一共6个类别,标注工具选择labelme。

模型训练:

原型代码链接:https://github.com/milesial/Pytorch-UNet.git

训练过程采用累进训练的方式,我是一个一个目标递进训练的,这样可以获取更好的精度,具体的先训练出背景、皮带、左右托锟的模型,再在此基础上迭代煤的模型,最后迭代煤块的模型。整体感受随着类别数量的增加,训练过程会逐渐变得困难,尤其到最后一个目标得时候,如果采用一起训练得方法,精度会比我这种累进训练得方法至少低5个点。

最开始得时候我训练得模型,输入分辨率是572*572的,经过测试速度很慢,后来修改为384*384的,同时注意原始代码中的上采用部分要做适当的修改。这样才能保证上下采样都是2的整数倍。这里我直接简单粗暴的去掉了Up模块中的pad部分。

Atlas模型转化:

atc --model=./unet.onnx --framework=5 --output=unet --soc_version=Ascend310P3  --input_shape="input.1:1,3,384,384" --output_type="/outc/conv/Conv:0:FP32" --out_nodes="/outc/conv/Conv:0"

其中fusion_result.json内容,

[{"graph_fusion": {"ConstToAttrPass": {"effect_times": "4","match_times": "4"},"Conv2DbpInputDilationFusionPass": {"effect_times": "0","match_times": "4"},"ConvConcatFusionPass": {"effect_times": "0","match_times": "4"},"ConvFormatRefreshFusionPass": {"effect_times": "0","match_times": "19"},"ConvToFullyConnectionFusionPass": {"effect_times": "0","match_times": "19"},"ConvWeightCompressFusionPass": {"effect_times": "0","match_times": "19"},"CubeTransFixpipeFusionPass": {"effect_times": "0","match_times": "1"},"DeconvWeightTransFusionPass": {"effect_times": "0","match_times": "4"},"FIXPIPEAPREQUANTFUSIONPASS": {"effect_times": "0","match_times": "23"},"FIXPIPEFUSIONPASS": {"effect_times": "0","match_times": "23"},"RefreshInt64ToInt32FusionPass": {"effect_times": "1","match_times": "1"},"RemoveCastFusionPass": {"effect_times": "0","match_times": "48"},"SameInputConv2dPass": {"effect_times": "0","match_times": "10"},"SplitConvConcatFusionPass": {"effect_times": "0","match_times": "4"},"StrideHoistingPass": {"effect_times": "0","match_times": "18"},"TransdataCastFusionPass": {"effect_times": "0","match_times": "25"},"ZConcatDFusionPass": {"effect_times": "0","match_times": "4"}},"session_and_graph_id": "0_0","ub_fusion": {"TbeConvCommonRules0FusionPass": {"effect_times": "18","match_times": "18","repository_hit_times": "0"}}
}]

ge_check_op.json内容,

{"graph_id": 0,"op": [{"error_type": "infer_shape_error","input0": {"data_type": "DT_FLOAT","layout": "ND","shape": [1,128,80,80]},"input1": {"data_type": "DT_FLOAT","layout": "ND","shape": [1,128,81,81]},"name": "/up1/Concat_1","output0": {"data_type": "DT_FLOAT","layout": "ND","shape": [1,128,80,80]},"reason": "InferShapeFailed!","type": "ConcatD"}],"session_id": 0
}

图片效果:

皮带跑偏:

下面的几个图分别表示有左右托锟的效果图、无托锟的效果图、只有单侧托锟的效果图、一侧托锟只有1个的效果图。

                         原始视频帧图片                                              皮带分割效果图                               皮带直线方程图

皮带启停:

视频效果:

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • vue-cron-builder一个相对简易的cron表达式生成插件UI管理jsvascript
  • Stability AI发布了单目视频转4D模型的新AI模型:Stable Video 4D
  • 数据结构:二叉树的广度优先遍历与深度优先遍历(递归方法)。C++及其新特性分别实现
  • Apache Tomcat 信息泄露漏洞CVE-2024-21733、CVE-2024-24549和CVE-2024-34750排查处理
  • Matlab2021b通过CNN、CNN-LSTM模型实现对声音信号的二分类与四分类
  • HTML静态网页成品作业(HTML+CSS)——安徽宣笔设计制作(5个页面)
  • 使用 ESP32 和 TFT 屏幕显示实时天气信息 —— 基于 OpenWeatherMap API
  • 微服务架构设计中的常见的10种设计模式
  • vuex的原理和使用方法
  • UniFab 是一款由人工智慧驅動的視訊增強器+ crack
  • string字符串和json对象相互转换问题
  • 认知杂谈16
  • CompletableFuture 的使用和实际业务中的应用
  • 大话回合手游【精品西游之鸿鹄西游精修商业开服端】最新整理WIN系特色服务端+安卓苹果双端+GM后台
  • 一个手机到手机之间通话经过了哪些设备
  • CentOS 7 防火墙操作
  • IOS评论框不贴底(ios12新bug)
  • Java的Interrupt与线程中断
  • Java读取Properties文件的六种方法
  • JDK9: 集成 Jshell 和 Maven 项目.
  • Making An Indicator With Pure CSS
  • ng6--错误信息小结(持续更新)
  • Spring Cloud Alibaba迁移指南(一):一行代码从 Hystrix 迁移到 Sentinel
  • SQLServer之创建数据库快照
  • Web标准制定过程
  • 翻译:Hystrix - How To Use
  • 前嗅ForeSpider中数据浏览界面介绍
  • 浅析微信支付:申请退款、退款回调接口、查询退款
  • 少走弯路,给Java 1~5 年程序员的建议
  • 通信类
  • 由插件封装引出的一丢丢思考
  • d²y/dx²; 偏导数问题 请问f1 f2是什么意思
  • gunicorn工作原理
  • scrapy中间件源码分析及常用中间件大全
  • 数据库巡检项
  • 直播平台建设千万不要忘记流媒体服务器的存在 ...
  • 昨天1024程序员节,我故意写了个死循环~
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • # 数仓建模:如何构建主题宽表模型?
  • ### Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLTr
  • (1)常见O(n^2)排序算法解析
  • (10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
  • (12)目标检测_SSD基于pytorch搭建代码
  • (70min)字节暑假实习二面(已挂)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第2章第五节(日期和时间)
  • (Forward) Music Player: From UI Proposal to Code
  • (python)数据结构---字典
  • (SpringBoot)第二章:Spring创建和使用
  • (TipsTricks)用客户端模板精简JavaScript代码
  • (非本人原创)我们工作到底是为了什么?​——HP大中华区总裁孙振耀退休感言(r4笔记第60天)...
  • (过滤器)Filter和(监听器)listener
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • 、写入Shellcode到注册表上线
  • ./mysql.server: 没有那个文件或目录_Linux下安装MySQL出现“ls: /var/lib/mysql/*.pid: 没有那个文件或目录”...
  • .[hudsonL@cock.li].mkp勒索加密数据库完美恢复---惜分飞