当前位置: 首页 > news >正文

自动驾驶:使用 3D 时空卷积网络的自监督点云预测

参考文献:

B. Mersch, X. Chen, J. Behley, and C. Stachniss, “Self-supervised Point Cloud Prediction Using 3D Spatio-temporal Convolutional Networks,” in Proc. of the Conf. on Robot Learning (CoRL), 2021

大多数自动驾驶汽车使用 3D 激光扫描仪,即所谓的 LiDAR,来感知周围的 3D 世界。LiDAR 生成汽车周围场景的局部 3D 点云。一个典型的 LiDAR 传感器每秒生成大约 10 个这样的点云。这些 3D 点云广泛用于众多机器人和自动驾驶任务,如定位、物体检测、避障、映射、场景解释和轨迹预测.

预测传感器在未来可能会看到什么的能力可以增强自动驾驶汽车的决策。一个有前途的应用是将预测的点云用于路径规划任务,例如避免碰撞。例如,与预测交通代理未来 3D 边界框的方法相比,点云预测不需要任何先前的推理步骤,例如定位、检测或跟踪来预测未来场景。在预测的点云上运行现成的检测和跟踪系统会产生未来的 3D 对象边界框,正如去年不同研究人员在点云预测中所展示的那样(Weng 等人在 CoRL’20;Lu 等人,通过在 arXiv上发表的文章) . 从机器学习的角度来看,点云预测是一个有趣的问题,因为下一次传入的 LiDAR 扫描总是提供地面实况数据。此属性提供了以自我监督的方式训练点云预测的潜力,无需昂贵的标记,并且还可以在线评估其性能,仅在未知环境中具有很小的时间延迟.

图片

在最近由 Benedikt Mersch 在 CoRL 2021 上展示的工作(https://www.ipb.uni-bonn.de/wp-content/papercite-data/pdf/mersch2021corl.pdf)中,源代码可用**(https://github.com/PRBonn/point-cloud-prediction)**,解决了从给定的过去扫描序列中预测大型无序未来点云的问题.高维和稀疏的 3D 点云数据使点云预测成为一个尚未完全探索的具有挑战性的问题.可以通过将预测的未来场景流应用于最后接收的扫描或生成一组新的未来点来估计未来点云.默施等人专注于生成新的点云来预测未来的场景.与利用循环神经网络来建模时间对应关系的现有方法相比,使用 3D 卷积来联合编码空间和时间信息,以上论文提出的方法采用基于连接范围图像的新 3D 表示作为输入。它联合估计未来范围图像和每个点的分数,以确定多个未来时间步长的有效点或无效点,该方法可以通过使用跳跃连接和使用圆形填充的水平一致性来获取环境的结构细节,并提供比其他最先进的点云预测方法更准确的预测.

图片

这种方法允许使用减少的参数数量来预测不同大小的详细未来点云以进行优化,从而加快训练和推理时间.此外,该方法也是完全自我监督的,不需要对数据进行任何手动标记.总之,该方法可以通过使用时间 3D 卷积网络的快速联合时空点云处理,从给定的输入序列预测一系列详细的未来 3D 点云,优于最先进的点云预测方法,概括很好地适应看不见的环境,并且比典型的旋转 3D LiDAR 传感器帧速率更快地在线运行.

图片

相关文章:

  • 文件共享的新面孔——《纽约时报》专访BitTorrent之父
  • 实战OpenPose项目1:开篇使用文档
  • 实战OpenPose项目2:开发环境配置与demo运行
  • Martin Fowler:设计已死?
  • 实战OpenPose项目3:pytorch 实现openpose(包括手和身体姿态估计)
  • 下一步CSDN Blog要增加和完善的功能
  • 实战OpenPose项目4:实时准确的全身多人姿态估计和跟踪系统
  • 知识图谱:知识表示学习(KRL)/知识嵌入(KE)必读论文
  • 关于国际标准书号ISBN
  • AI模型设计:C语言版 TensorFlow2.x安装与使用
  • AI模型设计必备:PyTorch与TensorFlow模型C++与python实现学习资料
  • 手机拍摄的书页
  • linux:bash和sh区别
  • AI模型设计:完美demo实现C调用python的tensorflow模型pb(附件源码python与C/C++动态库互相调用)
  • cmake命令set、option、find_package、target_link_libraries、add_executable使用方法
  • 【跃迁之路】【444天】程序员高效学习方法论探索系列(实验阶段201-2018.04.25)...
  • canvas 五子棋游戏
  • FastReport在线报表设计器工作原理
  • JSDuck 与 AngularJS 融合技巧
  • mysql 5.6 原生Online DDL解析
  • MySQL-事务管理(基础)
  • MySQL用户中的%到底包不包括localhost?
  • node-sass 安装卡在 node scripts/install.js 解决办法
  • Python十分钟制作属于你自己的个性logo
  • Tornado学习笔记(1)
  • 大整数乘法-表格法
  • 道格拉斯-普克 抽稀算法 附javascript实现
  • 仿天猫超市收藏抛物线动画工具库
  • 机器学习 vs. 深度学习
  • 基于 Ueditor 的现代化编辑器 Neditor 1.5.4 发布
  • 基于web的全景—— Pannellum小试
  • 简单数学运算程序(不定期更新)
  • 解析 Webpack中import、require、按需加载的执行过程
  • 找一份好的前端工作,起点很重要
  • Prometheus VS InfluxDB
  • 正则表达式-基础知识Review
  • ​520就是要宠粉,你的心头书我买单
  • ​Kaggle X光肺炎检测比赛第二名方案解析 | CVPR 2020 Workshop
  • #gStore-weekly | gStore最新版本1.0之三角形计数函数的使用
  • #传输# #传输数据判断#
  • (12)目标检测_SSD基于pytorch搭建代码
  • (pojstep1.1.2)2654(直叙式模拟)
  • (Redis使用系列) Springboot 使用redis实现接口Api限流 十
  • (二)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (转)C#开发微信门户及应用(1)--开始使用微信接口
  • (最全解法)输入一个整数,输出该数二进制表示中1的个数。
  • 、写入Shellcode到注册表上线
  • ./include/caffe/util/cudnn.hpp: In function ‘const char* cudnnGetErrorString(cudnnStatus_t)’: ./incl
  • .Family_物联网
  • .NET 8.0 中有哪些新的变化?
  • .net core 6 集成 elasticsearch 并 使用分词器
  • .Net 高效开发之不可错过的实用工具
  • .net 受管制代码
  • .NET 中选择合适的文件打开模式(CreateNew, Create, Open, OpenOrCreate, Truncate, Append)
  • .pings勒索病毒的威胁:如何应对.pings勒索病毒的突袭?