不存在全局的最优解,只有局部的最优解---得看你从哪个局部出发。从整个智驾的框架出发,感知是一切的源头,你先得认识世界才能思考,然后才知道应该怎么动作。感知都能有什么呢?
毫米波雷达,超声波雷达,激光雷达,摄像头,今天大体上就是这些东西了,以及藏在背后的高精度地图。如果你说雷达和摄像头和人类体感的眼耳差不多,那么高精度地图就像是藏在你大脑里的嵌套记忆认知---你每天都在这条路走,这条路的每个细节你都很熟,如果你是公交车司机,你甚至闭着眼都能绕过几个弯。
从信息参考来源的角度,你会知道“当然信息是越多越好”,所谓的感知融合,其实就是把“每一个传感器的信息结合到一起”,这种感性认识的背后有什么理性存在呢?
高斯概率。
每个传感器都是有测量误差的,机械的尺寸链上这种误差叠加最终会导致“误差”进一步放大,但是在数学上这种信息的互相套用,通过交集反而是可以让“误差”缩小的:比如说桌面有一堆牌1-10,你从中抽出一张来猜,小明告诉你不可能是12345,小王告诉你不可能是78910,你就会知道答案就是6,在这种不确定性的背后找到确定性,就是高斯融合的意义。
激光雷达,在这其中扮演着很重要的角色。
因为毫米波、超声波、摄像头,在极端条件下都存在硬伤,距离信号衰减,雨天、夜晚怎么办,等等等,是不是多一个激光雷达,对这个“确定性”是至关重要的影响。
可以说高精度地图的存在有其意义---在智驾初期大大降低了智驾的难度,但它不是终点,因为更新太慢了,而且敏感地区禁止测绘。而到了今天“无图”技术已经可以做到和近似“有图”体验的时候,大家都知道,到了该和高精度地图说再见的时候了。
激光雷达的存在也有其意义---在去高精度雷达的过程,提高对周围感知准确程度它提供了很大帮助。但是它不是万能的,不仅有使用边界的限制,而且很贵。
“贵”,在今天,就是原罪。
如果智驾的盘子已经很大,我们可以在高端产品做高级体验,低端产品做次一级方案这都不是事,但问题就在于,智驾的盘子没打开---多数人意识不到智驾是什么。一旦智驾没有进入主流视野,它的保有量上不去,数据量上不去,无法哺育上层的技术开发,也无法分摊零部件的成本,就只能继续贵下去,也只能继续卖不动。
这是去激光雷达的最大意义---它也不是没有逻辑支撑,比如马斯克说的,人开车就是靠眼睛,为什么车不行?
更何况,车的眼睛可比人多多了。
这是纯视觉方案的核心。
纯视觉方案什么时候可以成为主流,让历史告别激光雷达呢?当然是“车”对世界的认识,达到了和人眼一样的程度---差别不在于“眼”,而在于“脑”。
这件事背后仰仗的,就是端到端。
你开车的时候,确实是看到了什么,想到了什么,决定了怎么开,手脚如何动作,但是大脑在电光火石之间的处理本质上是近似黑箱的过程,事后也许你能说清楚自己当时咋想的,但是你开车的当下,你不会给自己这个思考的过程。
灵魂在开车。
跳过了一个“显性”的条件判断式的决策过程,通过一个更高层次的灵魂,链接信息和最终结果的“隐性”思考,就是端到端,当然我觉得多数人对这件事已经很熟了。
AI嘛!就是人工智能,模拟的就是人脑。神经网络嘛!模拟的神经,不是人类的神经,是哪里的神经!
所以你知道了,纯视觉技术的泛化,其背后要求的是汽车自己的智慧程度,向人类的决策思维靠拢的过程---越接近人类的决策水平,纯视觉的能耐就越大,去激光雷达的可能性就越大。
智驾其实已经进入到了新阶段了。
从端到端目前打出来的成绩看,纯视觉基本上是行业里的下一步计划了:体验拉上来,就要讨论“大规模泛化”的进程了。只有真正的大规模泛化,才能在数据量上去进一步迭代算法,在保有量上进一步实现降本,最终实现智驾平权。
评论
收藏
加电