|
朋友们,今天咱们来唠个挺硬核但贼有意思的科技瓜——特斯拉最近悄悄整了个大活,申请了一项能把2D画面自动脑补成3D高精地图的AI专利!不用激光雷达、不靠昂贵传感器,纯靠摄像头+算法就能还原世界细节,甚至能看清停车位上的残障标志和消防通道线。有人说这是自动驾驶“抠掉激光雷达”的终极省钱方案,也有人觉得特斯拉又在画饼。具体咋回事?咱一起往下深扒!
特斯拉最近向美国专利局提交的一份文件(编号US20250282344)曝光,里头详细描述了一套基于纯视觉的AI空间建模技术。简单来说,这套系统就像给车子装了个“脑补引擎”——只用普通摄像头拍到的2D画面,就能还原出周围环境的精细3D结构,连地面上的涂鸦、坡道弧度、停车线宽度都能精准捕捉,精度直接拉到10厘米级别!
要知道,过去自动驾驶系统想搞3D地图,普遍得靠LiDAR(激光雷达)这种烧钱硬件。一颗LiDAR动不动就几万美金,而特斯拉这方案只用摄像头就能搞定,成本砍得一刀见底。这也符合马斯克一直以来的执念:“纯视觉才是人类开车的本质,人眼也没长激光雷达啊!”
▍ 怎么做到的?Transformer+有向距离场(SDF)
这套技术的核心是个叫“有向距离场(Signed Distance Fields)”的数学建模方法。传统方法只会把空间切成一个个小方块(voxel),然后标记每个方块“有没有被占用”,效果粗糙得像打了马赛克。而特斯拉的AI能算出每一个点到最近物体表面的精确距离,连曲面、斜坡、不规则边缘都描得清清楚楚。
更骚的是,他们用了Transformer架构(对,就是ChatGPT同款底层技术)来整合多个摄像头的画面,再跨时间段分析(从时间点t到t-3的连续帧),连移动的车辆、行人轨迹都能预测出来。也就是说,这套系统不仅看得清,还能记得住,相当于给车开了个“时空外挂”。
▍ 停车困难户的福音?识别涂漆车位、残障标志、消防通道!
最接地气的应用场景必须是停车!传统自动驾驶找车位一般只能识别清晰的白线,但现实中很多车位划线模糊、有特殊图案(比如残障标志)、甚至根本没线……特斯拉这套AI却能通过voxel级别的涂漆检测直接认出车位类型,还能判断是否合规。
这功能要是真落地,都市开车党简直狂喜——数据显示纽约司机平均每年花107小时找车位,相当于整整4天半坐在车里兜圈子绕路!全美司机年平均找车位时间也达到17小时,油费+时间成本超过300美元。如果车子自己能秒定位空闲车位,通勤效率直接拉满。
▍ 成本暴杀同行?Waymo一套传感器够买6台特斯拉!
没有对比就没有伤害。目前行业头部玩家比如Waymo的自动驾驶出租车,装了13个摄像头、4个LiDAR、6个雷达,单套成本逼近20万美元(约606万新台币)。而特斯拉打算推出的Cybercab目标售价只要3万美元(约91万新台币)——价格差6倍以上,这还不算后续维护中激光雷达的高替换成本。
从2022年开始特斯拉就已经在所有FSD(全自动驾驶)系统中彻底移除超声波传感器、雷达和LiDAR,全面押注纯视觉。虽然目前FSD系统平均每13英里还需要一次人工干预,但特斯拉靠着持续迭代视觉算法,正在把容错率一步步压下去。
▍ 专利里还有哪些隐藏细节?
子体素精度:将空间解析度从33厘米提升到10厘米,几乎能看清井盖纹理级别的细节;
跨帧追踪:综合过去几帧的画面数据来预测物体移动轨迹,减少瞬间遮挡造成的误判;
表面材质感知:不仅能识别物体形状,还能区分不同材质(如水泥地、环氧地坪、金属坡道)对驾驶的影响。
特斯拉这套专利技术,说它是自动驾驶领域的“成本屠夫”加“技术卷王”还真不过分。当然啦,纯视觉方案到底能不能彻底替代激光雷达,至今业内还在吵架。但没人敢否认:如果真能用摄像头+AI算法就能实现高精空间重建,那绝对是对整个行业的一次降维打击。至于下一步会不会在FSD v12以上版本实际落地?咱们继续保持关注,蹲一波实测效果~
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|