用QA问答详解BEV系列 [时序融合工程化:HENet/RecurrentBEV/PointBEV]
Q:BEV时序融合分为几种,各自优点和区别是什么?
时序融合分为并行融合 Parallel fusion 和递归融合 Recurrent fusion 2种,其中并行融合同时融合处理多个历史帧feat,可获取更丰富完整long-term信息,递归融合当前帧feat只与history feat融合,计算复杂度和内...
时序融合分为并行融合 Parallel fusion 和递归融合 Recurrent fusion 2种,其中并行融合同时融合处理多个历史帧feat,可获取更丰富完整long-term信息,递归融合当前帧feat只与history feat融合,计算复杂度和内...
怎么做选择
费马帕斯卡模型
。
分为两种,一种是完全黑盒OneNet,模型直接优化Planner;另一种是模块化端到端,即模块级联或者并联,通过感知模块,预测模块以及规划模块之间feat-level/query-level的交互,减少分段式自动驾驶模型的误差累积。
常规LSS范式思路是:预测2D feat和depth进行点积获得2.5D的视锥feat,然后通过相机内外参数转换为3D feat,通过voxel pooling将3D feat转换到BEV feat。
更丰富的3D信息:Occ提供了完整的3D场景表示,包括高度信息,而BEV...
前向投影:代表作LSS,思路:2D为主动,结合depth信息,投影到3D空间,生成稀疏的3D feat
反向投影:代表作BEVFormer,思路:3D为主动过,从3D query(point)投影到2D feat,生成密集但缺少深度信息depth,存...
多个视角的图像分别检测目标无法完整感知周围目标,例如视角图像间有重叠区域,单个目标会重复检出;目标太大单个视角无法覆盖则任意单个视角都无法完整检出。
后融合:先独立感知目标,然后再将结构化信息以目标级进行时序和多...