当前位置: 首页 > news >正文

自动驾驶-如何进行多传感器的融合

自动驾驶-如何进行多传感器的融合

image

附赠自动驾驶学习资料和量产经验:链接

引言

自动驾驶中主要使用的感知传感器是摄像头和激光雷达,这两种模态的数据都可以进行目标检测和语义分割并用于自动驾驶中,但是如果只使用单一的传感器进行上述工作的话,很难应付极端或复杂路况。因此,多传感器融合被认为是实现L3级别以上自动驾驶的优秀方案。

image

1.多传感器开源数据

image

多传感器开源数据汇总

2.融合策略概述

传统划分传感器融合的分类主要是前融合,深度特征融合和后融合。但是这种划分方法不够细致,最近很多论文的多传感器融合也突破了上述三个划分的边界。因此,提出一种新的方案.

image

策略概述

主要分为强融合和弱融合两个方面,强融合包括前融合,深度特征融合,不对称融合和后融合。下面继续引用论文的图表进行表述。

3.融合策略详细分类

**前融合:**如下图所示,前融合是一种数据层面上的融合策略,并且这种融合策略以激光雷达的数据为主,摄像头的数据为辅。利用摄像头的数据获取不带距离信息的语义分割结果来融合点云的原始数据,简单粗暴。

image

前融合

深度特征融合:原始文章用的deep-fusion来进行表述,我的理解是深度特征,也就是两种不同传感器经过计算后的feature map或者tensor,对于点云来说可以使用voxel-base的算法进行处理得出特征空间和图像的feature map进行融合。这种方法使整个自动驾驶的感知更加紧凑,也是目前很多学者在尝试的方案之一!

image

深度特征融合

**后融合:**就是两种传感器分别进行计算得出检测或分割的结果,然后在根据多传感器标定的情况进行结果的融合。目前百度pollo等很多大厂开源或者路测的方案多基于此,比较直观也最能快速工程化实现的方案。但是我在工作中发现这种方案会放大不同传感器的固有缺陷(比如毫米波虚检对,激光在异常天气不够鲁棒,摄像头缺少深度信息等)。融合策略过于生硬!

image

后融合

**不对称融合:**我的理解是不同阶段进行进行的融合,比如利用激光雷达计算后物体的proposal与图像在feature map阶段进行融合,不同点是feature map阶段比proposal阶段更抽象,然后进行tensor融合,最后进行解码得出结果。这种方案更多是在实际应用中尝试发现,好与不好要更多的去尝试!

image

弱融合:弱融合和上述不同,既不是数据也不是特征层面不同阶段的融合,而是一种学习策略上的融合,用一个信号监督另外一个模态数据的模型学习结果,以这种方式弱化有监督学习对大规模标签的依赖,毕竟都得花钱标注不是。现有研究领域中有些深度估计方面的论文用的就是类似的方法,很有研究价值的一个方案!

image

弱融合

**结论:**融合策略千万条,安全第一条,融合不规范,亲人两行泪!

上述论文的理解包含部分自己的观点,请谨慎食用!

论文地址:

Multi-modal Sensor Fusion for Auto Driving Perception: A Survey​arxiv.org/pdf/2202.02703.pdf

相关文章:

  • DMA知识
  • selenium元素定位--xpath定位--层级与逻辑组合定位
  • VUE3——reactive对比ref
  • 阿里云子域名配置,且不带端口访问
  • unity实现2D主角视野锥解决方案
  • 部标JT808车辆定位监控平台单服务器13.6万接入压力测试记录(附源码)
  • 面试题-Elasticsearch集群架构和调优手段(超全面)
  • 谷粒商城——缓存——SpringCache
  • 计算机网络——网络基础1
  • 在django中使用kindeditor出现转圈问题
  • Leetcode 3.26
  • 图像处理与视觉感知---期末复习重点(4)
  • 【前端】-【性能优化常识】
  • Midjourney AI绘图工具介绍及使用
  • GIMP - GNU 图像处理程序 - 工具栏窗口 (Toolbox) 显示
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • 【跃迁之路】【735天】程序员高效学习方法论探索系列(实验阶段492-2019.2.25)...
  • Android框架之Volley
  • Angular6错误 Service: No provider for Renderer2
  • ES6核心特性
  • FineReport中如何实现自动滚屏效果
  • Promise初体验
  • Spring核心 Bean的高级装配
  • Sublime text 3 3103 注册码
  • ⭐ Unity 开发bug —— 打包后shader失效或者bug (我这里用Shader做两张图片的合并发现了问题)
  • Xmanager 远程桌面 CentOS 7
  • 翻译--Thinking in React
  • 关于for循环的简单归纳
  • 精益 React 学习指南 (Lean React)- 1.5 React 与 DOM
  • 理解IaaS, PaaS, SaaS等云模型 (Cloud Models)
  • Salesforce和SAP Netweaver里数据库表的元数据设计
  • Spring第一个helloWorld
  • ​ssh免密码登录设置及问题总结
  • !! 2.对十份论文和报告中的关于OpenCV和Android NDK开发的总结
  • # 透过事物看本质的能力怎么培养?
  • (二)WCF的Binding模型
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (每日持续更新)jdk api之StringBufferInputStream基础、应用、实战
  • (学习日记)2024.03.25:UCOSIII第二十二节:系统启动流程详解
  • (转载)在C#用WM_COPYDATA消息来实现两个进程之间传递数据
  • *Django中的Ajax 纯js的书写样式1
  • .NET Core 实现 Redis 批量查询指定格式的Key
  • .NET 使用 XPath 来读写 XML 文件
  • .NET/C# 在 64 位进程中读取 32 位进程重定向后的注册表
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)
  • .NET开发不可不知、不可不用的辅助类(一)
  • .NET设计模式(2):单件模式(Singleton Pattern)
  • /bin/bash^M: bad interpreter: No such file or directory
  • [ 代码审计篇 ] 代码审计案例详解(一) SQL注入代码审计案例
  • [2016.7 day.5] T2
  • [BIZ] - 1.金融交易系统特点
  • [bug总结]: Feign调用GET请求找不到请求体实体类
  • [C#] 如何调用Python脚本程序
  • [C++]AVL树怎么转
  • [CISCN2019 华北赛区 Day1 Web2]ikun