最近几天,特斯拉宣布,从2022年10月初开始,所有在北美,欧洲和中东制造的Model 3和Model Y不再配备超声波雷达,而是完全依靠特斯拉视觉来提供自动驾驶,FSD和主动安全功能此外,2023年起交付的Model X和Model S不再配备超声波雷达这意味着特斯拉将采用纯视觉自动驾驶方案,只有一个摄像头
特斯拉此举加剧了业界对自动驾驶解决方案孰优孰劣的争论那么真相是什么呢
这里,我们先来看看自动驾驶的底层逻辑它是三个步骤的结合:感知,决策和执行对周围环境的细致感知是一切决策的基础,也是自动驾驶汽车的安全保障在知道周围环境中物体的位置,速度和方向,路面的性质,路缘石的位置,信号等之后,自动驾驶系统就会开始规划和控制:首先,在接下来的短时间内,还有哪些运动物体会做什么,然后,按照整体规划做什么,最后,告诉汽车做什么
从这个逻辑和业界对视觉解决方案的描述来看,我们认为纯视觉派更接近人类驾驶的逻辑。
那么问题来了,既然纯视觉派更接近人类驾驶的逻辑,为什么还会出现视觉+传感器融合派呢。
虽然纯视觉解决方案的实现成本相对更低,更接近人类驾驶,高分辨率高帧率成像技术获得的环境信息更丰富,但摄像机捕捉的环境信息容易受到环境光的干扰,纯视觉解决方案更依赖训练进行图像处理,这必然导致环境认知的死角。
相比之下,fusion通过摄像头,毫米波雷达,激光雷达等设备收集车辆的周边信息激光雷达的加入可以获得更深层次的空间信息,对物体的位置,距离,大小的感知更加准确而且激光雷达是自发光的,不受环境光的影响也就是说,融合方案克服了纯视觉的缺点
但是,从技术角度来看,融合解决方案存在不足。
马斯克曾经这样解释过,纯视觉,尤其是在使用显式光子计算时,要比雷达和视觉的结合好得多,因为后者有太多的不确定性——当雷达和视觉感知不一致时,不清楚该相信哪一个马斯克的解释并非空穴来风
以之前一直被用户诟病的鬼刹为例特斯拉AI项目前负责人安德烈·卡帕西曾公开描述过一个幽灵刹车的典型案例:当车辆即将进入桥梁时,毫米波雷达探测到前方有一个静止的物体,然后它等待视觉系统告诉它,然后创建一个静止的目标并刹车与此同时,附近恰好有一辆行驶缓慢的汽车大致发生的情况是,视觉系统在几帧中报告了前车的减速,系统会将视觉系统报告的减速车辆与雷达报告的静止物体相关联,从而引起幽灵制动
对此,特斯拉Autopilot的最终结论:目视报告的减速一定是毫米波雷达报告的静止物体,所以天桥和缓慢行驶的汽车被识别为同一物体,导致幽灵刹车的出现。
从上面的刹车现象和特斯拉的结论,似乎可以得出结论:毫米波雷达在桥下通过的场景中,实际上拖累了视觉系统的判断。
需要注意的是,虽然特斯拉取消了超声波雷达,但将启动基于视觉的占位网络,可以实现Autopilot的高清空间定位,更远距离的能见度以及对物体的识别和区分能力不过目前只能在FSD beta中使用
此外,特斯拉还构建了纯视觉自动驾驶系统的多任务系统架构,具有多任务学习技术的最新实践和巨大潜力同时,特斯拉庞大用户群的驾驶数据收集也有助于智能AI训练
可见,特斯拉在纯视觉解决方案上的探索和创新从未停止。
此外,马斯克并不像业内所说的那样总是坚持纯视觉的解决方案比如最近有消息称,特斯拉正式向FCC提交了毫米波雷达相关的材料,这意味着特斯拉可能正在设计毫米波雷达根据特斯拉提供给当局的文件,这种高分辨率雷达将用于成像,配合摄像头进行自动驾驶的检测方案
事实上,从市场和用户的角度来看,无论是特斯拉的纯视觉还是其对面的融合解决方案,都出现过危险避让的情况,这说明自动驾驶在取得成绩的同时,还有创新和提升的空间。