当前位置: 首页 > news >正文

RockTrack:A 3D Robust Multi-Camera-Ken Multi-Object Tracking Framework

RockTrack: A 3D Robust Multi-Camera-Ken Multi-Object Tracking Framework

基础信息

  1. 单位:哈尔滨理工大学
  2. 论文:https://arxiv.org/pdf/2409.11749
  3. 代码:https://github.com/lixiaoyu2000/Rock-Track (未全部放出)
  4. 数据集:nuScenes
    在这里插入图片描述

摘要

  1. 随着检测技术的提高,多目标跟踪算法快速发展,特别是经济实惠的多相机跟踪。
  2. 现有的多相机端到端跟踪技术,由于训练的原因,导致局限于单一的检测器,导致灵活性降低了。
  3. 此外,目前的通用跟踪器忽略了多摄像机检测器的特性,比如:运动观测的不可靠性和视觉信息的可行性。
  4. 为了解决这些挑战,本文提出了RockTrack,一种用于多相机检测器的3D MOT方法。
  5. 遵循TBD框架,RockTrack与各种现成的探测器兼容。
  6. RockTrack包含了一个置信引导的预处理模块,从单个探测器的不同表示空间中提取可靠的运动和图像观测结果。
  7. 然后将这些观察结果融合在一个关联模块中,该模块利用几何和外观线索来减少不匹配。
  8. 得到的匹配通过分阶段估计过程传播,形成启发式噪声建模的基础。
  9. 此外,我们引入了一种新的外观相似度量,明确地描述对象亲和力在多相机设置。
    10.RockTrack在59.1%的AMOTA的视觉跟踪排行榜上取得了最先进的性能,同时展示了令人印象深刻的计算效率。

引言

contributions
1. 我们提出了RockTrack,一种基于TBD框架的鲁棒和灵活的3D MOT方法,专门为多视图探测器设计。
2. 我们引入了一种新的多视图外观相似度度量来明确地捕获对象间的亲和力(affinity)
3. 我们开发了一个可扩展的几何滤波器和适应运动测量噪声,以提高空间可靠性在多相机探测器。我们还提出了一种伪视觉跟踪器滤波器,并实现了多模态匹配,以有效地利用视觉信息。
4. RockTrack建立了一个新的最先进的,59.1%的AMOTA在仅相机test排行榜(多镜头跟踪)。

相关工作

Camera-only 3D Detection.
Camera-only 3D MOT.

方法

A. Confidence-Guided Pre-Processing Module
B. Motion-Appearance Data Association Module
C. Noise-Adaptive Motion Module
D. Lifecycle Module

实验

阅读时间(2024年9月19日)

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Oracle事物
  • 计算机人工智能前沿进展-大语言模型方向-2024-09-18
  • Hexo框架学习——从安装到配置
  • HTB-Blue(永恒之蓝漏洞复现)
  • 更换UFS绑定固件与“工程固件”的区别 小米10s机型更换cpu绑定包对比 写入以及修复基带
  • 【C++】猜数字小游戏
  • Hotohiko Sakamoto算法,以及用其计算星期几【算法 15】
  • Vue 中阻止点击事件穿透
  • Arcgis实现面空间位置从东至西从南至北排序
  • Matlab simulink建模与仿真 第十四章(信号输出库)
  • 梯度计算中的一些算子
  • Go语言错误处理详解
  • 【AIGC】Kolors:快手开源的文生图大模型
  • WebGL系列教程九(动画)
  • Mysql SqlServer 分页
  • [NodeJS] 关于Buffer
  • 2019年如何成为全栈工程师?
  • Android Volley源码解析
  • JavaScript 一些 DOM 的知识点
  • Java深入 - 深入理解Java集合
  • leetcode378. Kth Smallest Element in a Sorted Matrix
  • passportjs 源码分析
  • Promise面试题2实现异步串行执行
  • SAP云平台里Global Account和Sub Account的关系
  • Sequelize 中文文档 v4 - Getting started - 入门
  • SQLServer之创建数据库快照
  • TiDB 源码阅读系列文章(十)Chunk 和执行框架简介
  • 翻译:Hystrix - How To Use
  • 可能是历史上最全的CC0版权可以免费商用的图片网站
  • 聊聊flink的TableFactory
  • 学习笔记TF060:图像语音结合,看图说话
  • 用Visual Studio开发以太坊智能合约
  • 【运维趟坑回忆录 开篇】初入初创, 一脸懵
  • ​queue --- 一个同步的队列类​
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • ‌JavaScript 数据类型转换
  • # SpringBoot 如何让指定的Bean先加载
  • #include<初见C语言之指针(5)>
  • (17)Hive ——MR任务的map与reduce个数由什么决定?
  • (ISPRS,2023)深度语义-视觉对齐用于zero-shot遥感图像场景分类
  • (k8s中)docker netty OOM问题记录
  • (react踩过的坑)antd 如何同时获取一个select 的value和 label值
  • (笔试题)合法字符串
  • (附源码)spring boot车辆管理系统 毕业设计 031034
  • (附源码)springboot 智能停车场系统 毕业设计065415
  • (附源码)ssm学生管理系统 毕业设计 141543
  • (十二)springboot实战——SSE服务推送事件案例实现
  • (一)【Jmeter】JDK及Jmeter的安装部署及简单配置
  • (转)EXC_BREAKPOINT僵尸错误
  • (转)Java socket中关闭IO流后,发生什么事?(以关闭输出流为例) .
  • (转)Linux下编译安装log4cxx
  • (转)负载均衡,回话保持,cookie
  • ./configure,make,make install的作用(转)
  • .Net Core/.Net6/.Net8 ,启动配置/Program.cs 配置
  • .Net mvc总结