2024年了,想进智驾第一梯队,除了芯片算力还得卷什么?

前段时间,我们公司的主编老白去美国体验了特斯拉FSD。作为传说中的终极智能BOSS,可以先看一下它的实力。

在我们体验后不久,特斯拉正式推送了他们的V12版本。在国外的评测视频中,FSD可以在斑马线前等待行人,以丝滑的方式进行无保护的左转弯,或者在被突然车辆逼停后快速跟进。

作为OCC功能最早的品牌,特斯拉在该领域的技术目前可以说是一流的。

OCC并不是一个新词,但在它被提出之前,很少有汽车公司将其作为重点宣传对象。

我已经尽了很大努力来推广我自己的纯视觉+OCC。除了瞄准特斯拉这个标杆之外,我还需要拿出一些新东西,在智能驾驶时代再迈出一步。

OCC恰好是棋子。

行业新宠

OCC的全称是占位网络(Occupancy network),其风头丝毫不亚于激光雷达,几乎所有做智能驾驶功能的主流车企都会用“现有成果”或“OCC上车通知”的形式提及这项技术。目前,将这一技术搭载在公交车上的公司包括特斯拉、华为、极限悦、智己等。

与作为硬件的激光雷达不同,这是一种软件技术,它具有通过大量算法训练处理传感器捕获的信息的能力,不仅可以构建实时三维场景,还可以与系统的其他算法进行比较“对齐”验证和标记数据。

这么说可能有点抽象,但我们可以先看一段视频:小米发布会2023年11月

这是展示OCC上车效果的最佳方式。在视频中,车辆就像在乐高世界中行驶,移动的车辆本身、其他道路参与者、静止的路灯、绿化带和其他物体以各种颜色的方形图像显示。

有些人可能认为这种建模很常见,只是模拟游戏水平的千分之一。但是,不同的是,游戏中的建模全部是设定的对象和场景,而视频是随机和实时的场景。

换句话说,即使我们在开车时,我们也无法在脑海中呈现出这样一个完整的场景,尤其是当汽车在盲区内从后面驶来时。setupfactory脚本语言

我们注意到的和我们没有注意到的,这辆车可以注意到,并且它的贡献占用了网络技术。它是怎么做到的?

展开后,OCC将空分成许多小的三维正方形,每个小正方形被称为“体素”。当摄像机捕获的图像连续输入到OCC时,OCC将观察图像对应的空之间每个体素的状态是被占用还是空闲。

(绿框标记的地方是“自由状态”

我们打个比方。放置棋子的棋盘是“占据”状态,没有棋子的格子是“自由”状态。

我们再举一个例子来模拟真实场景。在一个巨大的广场上,只有一辆车停在前面,所以经过OCC的分析,只有前面那辆车所在的区域显示在当前感知房间空“占用“状态,其他区域都是“自由&quot状态。

(黑白方块代表“自由”状态)

看到这里,为什么OCC被称为“占领”网上的每个人也应该很清楚,区分哪里可以避免“占领”空,哪里可以使用“自由”是它的主要任务。

下一步是生成“语义”标签。

一方面,OCC丢失的图像信息本身具有识别功能,另一方面,新添加的高度信息使目标对象更加全面,可以与数据库中的对象相对应并标记相应的类别。

有人可能又要问了。如果一个障碍已经面目全非,而且没有办法定义它,该怎么办?

这就是OCC的天才之处。如果遇到未知目标,语义标签可以直接定义为“未知”,但它在空之间定义为“占用”状态的流量不变,车辆自然知道该区域无法通行。

就像人类在开车的时候会遇到一些未知的障碍物,但是认不出来也没关系。我们知道他们过不去,所以我们可以做出躲避的动作。

正是基于这一原理,华为做出了GOD算法,实现了具有强大避障能力的AEB函数。

传统的AEB是提前为车辆设定一个白名单,只有当白名单中的障碍物被识别出来时,才会触发刹车。并且使用“空如果被占用则无法通行”躲避障碍物的想法不再受白名单的限制。

所以一旦OCC上车,汽车就会像人一样灵活?

不是万灵药

只能说,这项技术将使智能驾驶更加灵活,但仍有许多困难。

从OCC的技术落地来看,虽然原则上可以在任何地点使用,但最终效果取决于R&D的投入量和工程师的水平。

例如,在训练算法时,样本类别和测试场景的数量、训练序列和验证序列“要做的题量”都会影响最终结果。

(英伟达计划在2023年自动驾驶开发竞赛中赢得3D占用预测挑战赛)

包括OCC运算在内,动态目标和静态目标的分割同样困难。

例如,建筑物不会移动,汽车会移动,因此它们应该分开处理,以防止静止的物体移动,否则“汽车上的传送带”就是一个笑话。

跟踪动态目标也很困难。想象一下,如果在视频“积木”中,移动的卡车突然在几帧中展开,然后按原样聚集在一起,你还认为这是可靠的吗?

如果我们只考虑单个体素而不能跟踪和推断障碍物的轨迹,那么它在实际应用中仍然很困难。因此,运动物体的体素将被汇总并划分为一个整体。于世光 江苏

也许你会问:如果感知能力足够强,OCC也足够成熟,智能汽车是否不可战胜?

这个问题其实可以从我们体验的特斯拉FSD中得到答案。

特斯拉FSD一路表现出色,但在一个施工路段出现了问题。

这时候,原路线应该右转。然而,由桩和桶铺设的新车道仅支持直线行驶。该系统清楚地认识到了障碍,并最终停止了罢工。

我们推断OCC识别只能直行,因为在路线规划中需要右转,这是算法中交通规则的逻辑和可行性空之间的冲突。

在算法中,车辆知道桩桶的规则,以及桩桶形成的车道线是否在普通车道线规则之上。

当原有路线被打乱时,是停机还是主动寻找“可行路线”目标?

简单来说,有问题的地方是“静止”还是“移动”?

这些都不是OCC能够解决的问题。

写在最后

事实上,在实践中,当司机会开车,但他没有经验,并且他没有被输入太多的交通规则以在特殊场景中超越规则时,当原始路线被打乱并且他对周围环境不熟悉时,肯定没有办法开始。

不同的是,人类有“试试看”。这是个错误。那我就四处看看”的情绪思维,车辆在驾驶任务中遇到故障时可能处于一片混乱的状态。

因此,如果我们不能完全适应特殊规则,即使像OCC这样模拟人类思维的高级技术上车,机器驾驶也永远不会取代人类驾驶。

结束

未经允许不得转载:科技让生活更美好 » 2024年了,想进智驾第一梯队,除了芯片算力还得卷什么?