基于华为atlas的皮带跑偏、空载、堆煤、启停探索

news2025/3/1 0:00:31

生乎吾前,其闻道也固先乎吾,吾从而师之;生乎吾后,其闻道也亦先乎吾,吾从而师之。吾师道也,夫庸知其年之先后生于吾乎?是故无贵无贱,无长无少,道之所存,师之所存也。

写在前面:

写这篇的时候,想起当年第一次接触atlas还是在京东的一次aicon的会议上,其实那时觉得这东西挺新的,还有自己的IDE,其实自己也没用过。后来的工作中在面试中,也见过1-2个用过atlas的面试者。直到几年前归梓,阴差阳错,华为atlas满足信创的需求,才于23年12月正式研究学习atlas。几个月过去了,整体感觉昇腾生态闭塞、最新的git很难支持、华为各种软件包下载也很坑。问题是很多的,至于其他国产显卡,像曙光、海光、摩尔线程、寒武纪等自己也没机会接触,不得不说华为在信创这条路的部署是强于其他厂商的,于是我便这条路走下去了。

回归主题:

在真正做这件事情的时候,其实也预研了几天,也了解了别的公司的大体思路,比如精英、壹合等。其实我这里想做一个不一样的,有别于别人的,视觉有冲击力的,真正的all in one模型。

整体模型我没有选择基于检测的思路,而是选择基于分割的思路,因为分割可以帮我获取更多的检测不具备的信息,这里后续可以看到。皮带跑偏、空载、堆煤基于unet实现,皮带启停基于unet+光流跟踪实现。

整体感觉模型这块不算复杂,唯一的麻烦的地方就是皮带、煤、煤块这几个的分割是属于多标签分割问题,就是说一个像素可以属于其中的一个也可以是属于其中的几个。这块需要在损失函数处下一些功夫修改代码,当然也有其他曲径通幽的方法。这个修改不能算复杂,复杂的是这个修改同时还得兼容atlas的模型转化,这块就需要真正下功夫了。

另外一个复杂的地方就是皮带中轴线的方法,探索这个中轴线大概耗费了1个月的时间把,中间尝试了很多方法,比如label_centerlines、PCA、旋转角度法、曲线拟合等,效果都不太满意。这里需要考虑皮带多种形状的自适应性,还得考虑效果、考虑速度。最终根据自己的思想实现了一个中轴线确定的方法,客观的说该方法不是完美的,但是已经可以解决90%以上的场景,具体后面我会有图片展示。

数据制作:

这里我一共标注了1056张图片,数据的标签包括,左托锟、右托锟、皮带、煤、煤堆、背景一共6个类别,标注工具选择labelme。

模型训练:

原型代码链接:https://github.com/milesial/Pytorch-UNet.git

训练过程采用累进训练的方式,我是一个一个目标递进训练的,这样可以获取更好的精度,具体的先训练出背景、皮带、左右托锟的模型,再在此基础上迭代煤的模型,最后迭代煤块的模型。整体感受随着类别数量的增加,训练过程会逐渐变得困难,尤其到最后一个目标得时候,如果采用一起训练得方法,精度会比我这种累进训练得方法至少低5个点。

最开始得时候我训练得模型,输入分辨率是572*572的,经过测试速度很慢,后来修改为384*384的,同时注意原始代码中的上采用部分要做适当的修改。这样才能保证上下采样都是2的整数倍。这里我直接简单粗暴的去掉了Up模块中的pad部分。

Atlas模型转化:

atc --model=./unet.onnx --framework=5 --output=unet --soc_version=Ascend310P3  --input_shape="input.1:1,3,384,384" --output_type="/outc/conv/Conv:0:FP32" --out_nodes="/outc/conv/Conv:0"

其中fusion_result.json内容,

[{
    "graph_fusion": {
        "ConstToAttrPass": {
            "effect_times": "4",
            "match_times": "4"
        },
        "Conv2DbpInputDilationFusionPass": {
            "effect_times": "0",
            "match_times": "4"
        },
        "ConvConcatFusionPass": {
            "effect_times": "0",
            "match_times": "4"
        },
        "ConvFormatRefreshFusionPass": {
            "effect_times": "0",
            "match_times": "19"
        },
        "ConvToFullyConnectionFusionPass": {
            "effect_times": "0",
            "match_times": "19"
        },
        "ConvWeightCompressFusionPass": {
            "effect_times": "0",
            "match_times": "19"
        },
        "CubeTransFixpipeFusionPass": {
            "effect_times": "0",
            "match_times": "1"
        },
        "DeconvWeightTransFusionPass": {
            "effect_times": "0",
            "match_times": "4"
        },
        "FIXPIPEAPREQUANTFUSIONPASS": {
            "effect_times": "0",
            "match_times": "23"
        },
        "FIXPIPEFUSIONPASS": {
            "effect_times": "0",
            "match_times": "23"
        },
        "RefreshInt64ToInt32FusionPass": {
            "effect_times": "1",
            "match_times": "1"
        },
        "RemoveCastFusionPass": {
            "effect_times": "0",
            "match_times": "48"
        },
        "SameInputConv2dPass": {
            "effect_times": "0",
            "match_times": "10"
        },
        "SplitConvConcatFusionPass": {
            "effect_times": "0",
            "match_times": "4"
        },
        "StrideHoistingPass": {
            "effect_times": "0",
            "match_times": "18"
        },
        "TransdataCastFusionPass": {
            "effect_times": "0",
            "match_times": "25"
        },
        "ZConcatDFusionPass": {
            "effect_times": "0",
            "match_times": "4"
        }
    },
    "session_and_graph_id": "0_0",
    "ub_fusion": {
        "TbeConvCommonRules0FusionPass": {
            "effect_times": "18",
            "match_times": "18",
            "repository_hit_times": "0"
        }
    }
}]

ge_check_op.json内容,

{
    "graph_id": 0,
    "op": [
        {
            "error_type": "infer_shape_error",
            "input0": {
                "data_type": "DT_FLOAT",
                "layout": "ND",
                "shape": [
                    1,
                    128,
                    80,
                    80
                ]
            },
            "input1": {
                "data_type": "DT_FLOAT",
                "layout": "ND",
                "shape": [
                    1,
                    128,
                    81,
                    81
                ]
            },
            "name": "/up1/Concat_1",
            "output0": {
                "data_type": "DT_FLOAT",
                "layout": "ND",
                "shape": [
                    1,
                    128,
                    80,
                    80
                ]
            },
            "reason": "InferShapeFailed!",
            "type": "ConcatD"
        }
    ],
    "session_id": 0
}

图片效果:

皮带跑偏:

下面的几个图分别表示有左右托锟的效果图、无托锟的效果图、只有单侧托锟的效果图、一侧托锟只有1个的效果图。

                         原始视频帧图片                                              皮带分割效果图                               皮带直线方程图

皮带启停:

视频效果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2040262.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

超详细!!!electron-vite-vue开发桌面应用之配置路由router(五)

云风网 云风笔记 云风知识库 一、安装依赖 npm install vue-router二、配置项目文件路径 三、配置路由router 在src下新建一个router目录,然后在里面添加一个index.ts文件,在里面配置路由 import { createRouter, createWebHashHistory } from vue-…

针对thinkphp站点的漏洞挖掘和经验分享

0x1 前言 浅谈 目前在学习和研究thinkphp相关漏洞的打法,然后最近对于thinkphp资产的收集方面有了一个简单的认识,然后写一篇新手看的thinkphp相关的漏洞收集和挖掘的文章来分享下。然后后面是给师傅们分享下后台文件上传,然后直接打一个ge…

RCE-eval长度限制绕过技巧

目录 限制16字符 题目源码 方法一&#xff1a;$_GET[1] 方法二&#xff1a;file_put_contents 方法三&#xff1a;usort(…$_GET); 限制7字符 题目源码 限制16字符 题目源码 <?php $param $_REQUEST[param]; If ( strlen($param) < 17 && stripos($param…

微服务系列:Spring Cloud 之 Feign、Ribbon、Hystrix 三者超时时间配置

Feign 自身有超时时间配置 Feign 默认集成的 Ribbon 中也有超时时间配置 假如我们又使用了 Hystrix 来实现熔断降级&#xff0c;Hystrix 自身也有一个超时时间配置 注: spring-cloud-starter-openfeign 低一点的版本中默认集成的有 Hystrix&#xff0c;高版本中又移除了。 …

Gin框架接入Prometheus,grafana辅助pprof检测内存泄露

prometheus与grafana的安装 grom接入Prometheus,grafana-CSDN博客 Prometheus 动态加载 我们想给Prometheus新增监听任务新增ginapp项目只需要在原来的配置文件下面新增ginapp相关metric 在docker compose文件下面新增 执行 docker-compose up -d curl -X POST http://lo…

C++ 设计模式——模板方法模式

模板方法模式 模板方法模式逐步重构并引入模板方法模式初始实现提取共性并引入模板方法模式实现具体类 完整代码示例模板方法模式的 UML 图UML 图详细介绍 模板方法模式适用于以下场景 模板方法模式 模板方法模式是一种行为设计模式&#xff0c;它定义了一个算法的骨架&#x…

C++11代码实战经典—MySQL数据库连接池

课程总目录 文章目录 一、项目介绍1.1 关键技术点1.2 项目背景1.3 连接池功能点介绍1.4 MySQL Server参数介绍1.5 项目功能点设计和技术细节 二、MySQL数据库编程三、项目代码逐步实现3.1 连接池单例模式实现3.2 实现加载配置项3.3 连接池的构造函数3.4 实现生产者3.5 实现消费…

其他浏览器正常,火狐浏览器ui-grid换行问题

ui-grid火狐浏览器兼容性问题 ui-grid表格插件问题描述解决方案 ui-grid表格插件 火狐浏览器 UI-grid 兼容性问题 其他如Edge、谷歌、360浏览器正常情况下 火狐浏览器 问题描述 如上图一和图二显示&#xff0c;UI-gird在火狐换行了&#xff1a;从图片来看&#xff1b;后面…

【车载开发系列】ASPICE标准实践---使用Drome系统保证一致性

【车载开发系列】ASPICE标准实践—使用Drome系统保证一致性 【车载开发系列】ASPICE标准实践---使用Drome系统保证一致性 【车载开发系列】ASPICE标准实践---使用Drome系统保证一致性一、一致性的目的二、ASPICE标准三、ASPICE标准实施难点四、保证一致性的实践1. 参与评审2. 可…

ES6-ES13学习笔记

目录 初识ES6 变量声明 解构赋值 对象解构 ​编辑 数组解构 ​编辑模版字符串 字符串扩展 includes() repeat() startsWith() endsWith() 数值扩展 二进制和八进制表示法 &#xff08;Number.&#xff09;isFinite()与isNaN() Number.isInteger() Math.trunc …

vue前端可以完整的显示编辑子级部门,用户管理可以为用户分配角色和部门?

用户和角色是一对多的关系用户和部门是多对多得关系<template><div class="s"><!-- 操作按钮 --><div class="shang"><el-input v-model="searchText" placeholder="请输入搜索关键词" style="width:…

上海凯泉泵业入职测评北森题库题型分析、备考题库、高分攻略

上海凯泉泵业&#xff08;集团&#xff09;有限公司是一家大型综合性泵业公司&#xff0c;专注于设计、生产、销售泵、给水设备及其控制设备。作为中国泵行业的领军企业&#xff0c;凯泉集团拥有7家企业和5个工业园区&#xff0c;总资产达到25亿元&#xff0c;生产性建筑面积35…

Python 在PDF中添加条形码、二维码

在PDF中添加条码是一个常见需求&#xff0c;特别是在需要自动化处理、跟踪或检索PDF文件时。作为一种机器可读的标识符&#xff0c;PDF中的条码可以包含各种类型的信息&#xff0c;如文档的唯一标识、版本号、日期等。以下是一篇关于如何使用Python在PDF中添加条形码或二维码的…

Linux 【进程替换】详细讲解

替换原理 进程是由PCB和内核数据结构以及进程的代码和数据形成 用 fork 创建子进程后执行的是和父进程相同的程序 ( 但有可能执行不同的代码分支 ), 子进程往往要调用一种 exec 函数来进行进程替换 ,对子进程进行替换由于原先子进程与父进程使用的是同一物理内存空间&#xff0…

前端 JavaScript 的 _ 语法是个什么鬼?

前言 我们有时候会看这样的前端代码&#xff1a; const doubled _.map(numbers, function(num) { return num * 2; });刚接触前端的童鞋可能会有点惊奇&#xff0c;不知道这个 _ 是什么语法&#xff0c;为什么这么神通广大&#xff1f; 其实 _ 是 Lodash 或 Underscore.js …

Django Project | 云笔记练习项目

文章目录 功能整体架构流程搭建平台环境子功能先创建用户表 并同步到数据库1.用户注册密码存储 -- 哈希算法唯一索引引发的重复问题 try登陆状态保持 -- 详细看用户登录状态 2. 用户登录会话状态时间 cookie用户登录状态校验 3. 网站首页4.退出登录5.笔记模块 列表页添加笔记 …

AFSim 仿真系统----脚本

概述 脚本为用户提供了一种在模拟中基于发生的事件执行复杂指令集的方式。该语言类似于 C# 和 Java&#xff0c;对于具备基本编程技能的人来说应该会很熟悉。它采用块结构&#xff0c;包含熟悉的声明、赋值和控制流语句&#xff0c;允许用户检查和操作模拟环境。 脚本本质上是由…

【Linux】sersync 实时同步

原理 rsync 是不支持实时同步的&#xff0c;通常我们借助于 inotify 这个软件来实时监控文件变化&#xff0c;一旦inotify 监控到文件变化&#xff0c;则立即调用 rsync 进行同步&#xff0c;推送到 rsync 服务端。 环境准备 步骤1&#xff1a;获取数据包 获取 sersync 的包…

UE5学习笔记12-为角色添加蹲下的动作

一、一点说明 1.蹲下使用了ACharacter类中Crouch();函数&#xff0c;函数功能是先检查是否存在运动组件&#xff0c;将bool类型的变量变为true&#xff0c;该变量代表是想要蹲下。 2.通过源码可知存在是否蹲下的bool变量bIsCrouched如图&#xff0c;如果对:1有疑问请搜索C位域 …

C++ | C++中的继承和组合:代码复用的艺术和应用

目录 一、继承&#xff1a;代码复用的艺术 1、继承概念 代码说明1&#xff1a;继承方式和访问控制 代码说明2&#xff1a;作用域与成员访问 代码说明3&#xff1a;构造函数和析构函数 2、基类和派生类对象赋值转换 派生类对象到基类对象的转换(向上转型)&#xff1a; 基…