Posts MMF论文解读
Post
Cancel

MMF论文解读

目录

  1. 论文背景以及基本思想
  2. 算法基本流程
  3. 算法细节

Multi-Task Multi-Sensor Fusion for 3D Object Detection

论文背景以及基本思想

出发点:基于前作ContFuse的改进,ContFuse虽然融合了Image和Bev的信息,但是对于非常稀疏点云,效果有限。同时,ContFuse的detector head结构过于简单,

算法基本流程

  • 核心:
    • 参考AVOD设计了基于ROI-wise fusion的detector head。
    • 进行了ground plane的辅助网络:Unet结构,会预测点云Voxel Space每个Voxel的地面高度作为ground plane信息(BEV),BEV点云信息会减去对应的height信息,最后预测结果会相应加上height
    • 添加depth completion分支,进行深度补全,生成pseudo lidar,会在真实点云信息缺失的时候进行补充
  • 算法框架: img img img

算法细节

  • 关键点:
    • 作者认为基于2D图片提取proposal的方案不是最佳的,且认为直接从BEV图上进行Proposal的提取更简单(大小的一致性,遮挡较少)
    • Online mapping分支
    • Pseudo lidar能够补充远距离lidar数据的缺失,且单纯添加depth completion分支进行multi-task的训练也是有帮助的
  • Ablation Study: img img
  • Evaluation Results: img
This post is licensed under CC BY 4.0 by the author.