2021年7月23日,随着特斯拉全自动驾驶(FSD)的第九版本升级,该系统彻底放弃了雷达输入,转而完全依赖汽车的摄像头。该系统自2020年10月开始进行Beta测试,正式发布后,以附加组件的形式出售,售价为1万美元。
在2021年5月的时候,特斯拉方面就宣布,在美国制造的 Model 3 和 Model Y 汽车中完全移除雷达,并暗示该公司正在加倍努力制定与大多数其他自动驾驶项目不一致的战略。特斯拉步入纯视觉的道路有两个主要原因,第一点是激光雷达的造价极高。
第二点则是整个自动驾驶系统基于人类识别障碍的方式,人类驾驶员在驾驶过程中,并没有像是激光雷达等信号输入设备来判断道路情况。相反,人类驾驶员只能通过肉眼来判断道路情况。通过强化学习的方式,特斯拉认为机器理应获得相同的决策能力,因此押注于纯视觉。
早在2019年时,特斯拉CEO Elon Musk就在首个特斯拉自动驾驶开放日上直言“任何依赖激光雷达的人都注定失败”,当然,他也因此树敌无数。
人工智能依赖数据,目前特斯拉已对旗下自动驾驶系统进行了约1.5pb数据量的道路视频训练,该公司人工智能主管Andrej Karpathy认为,新的纯视觉解决方案优于传统激光雷达和视觉的组合。
另外一点,特斯拉今日建成了一台超级计算机,专门用来处理复杂的道路情况。根据特斯拉的数据,该计算机的算力位于全球第五。
激光雷达的最大卖点是通过从物体上反射激光来实现令人难以置信的精确深度感测,但是通过颜色判断、三角测量等方法,基于视觉的系统也可以估计深度,缩短了摄像头和激光雷达的差距。2019年时,特斯拉就发布了一种基于摄像头的伪激光雷达解决方案,将基于相机的深度估计转换为激光雷达使用的同类3D点云,进而显著提高了精度。
以数字的视角来看摄像头和激光雷达,可能两者之间只有1%不到的差距。对于特斯拉来说,当他们发现视觉可以达到激光雷达99%的效能时,他们会自然而然地认为达到100%也是可能的。不过这也正是长尾问题的核心所在,鲜有自动驾驶汽车像特斯拉一样敢于押注纯视觉,这也是老生常谈的问题了,业内普遍认为,还是摄像头和激光雷达的组合方案才是最可靠的。