AI Talk | 上海交大许敏:不盲目跟随特斯拉,抓住AI融合机遇探索中国解决方案
发布时间:2025-08-06 22:48 浏览量:1
作者|华芸
编辑|何芳
近期,两份来自不同背景测试机构的报告,犹如两面镜子,折射出中国智能驾驶产业喧嚣背后的深刻隐忧。懂车帝《智炼场》对36款车型的城区、高速高危场景辅助驾驶测试竟无一全部通过;理想I8碰撞测试东风猛龙引发的广泛关注,无不昭示着行业对技术先进性与安全性的渴求与焦虑。
在产业热度爆表、商业化呼声高涨的当下,华汽研究院AI Talk与上海交通大学汽车工程研究院院长许敏教授的一席对话,直刺行业浮躁本质:
一、产业惯性催生“虚火”:
许敏教授一针见血:中国拥抱新技术,常陷入“先虚后实”的怪圈——概念乍现,便迅速裹挟在资本与政策的狂潮中高歌猛进,标榜“产业化”与“全民落地”,而基础研发、核心问题却常被悬置。智能驾驶正是当下这股“虚火”的典型承载者。
二、两条主流技术路径之争:
特斯拉路径(视觉+AI经验派):其核心并非堆砌硬件,而是依托数百万真实车辆积累的海量驾驶数据,利用AI大模型学习人类“老司机”的经验和决策逻辑,其本质是让AI模仿人类“见招拆招”。国内多数企业选择靠堆叠激光雷达、毫米波雷达、超声波雷达等传感器,并辅以强大算力和预设规则模型,试图精确感知环境并覆盖所有可能场景。
该路线成本高昂、难以穷尽所有极端场景(尤其是未知危险组合),且极易陷入“硬件军备竞赛”与“算力内卷”的泥潭——“投得越多,算得越慢”,却未必换来安全性的指数级提升。
三、AI革命性与“融合”的真义:
许敏教授点出了AI在智能驾驶领域的真正革命性意义:它首次实现了人类驾驶经验的“数学化记录与共享”。“老司机”的经验不再神秘、不可复制。但局限同样存在:AI本质是“复制已知”。它难以有效处理“从未见过”或极端复杂叠加的罕见场景。
“融合”的真谛:正因如此,视觉派依赖的AI经验模型与多传感器派的高精度感知能力并非对立,而是互补共生。AI大模型负责处理主流、可复制的驾驶逻辑,而激光雷达等传感器则扮演 “补漏者”的角色,在AI模型“未知茫然”或反应不及的极端时刻进行安全兜底。
四、不盲目跟风,敢为天下先探索中国道路:
中国拥有顶尖的制造、工程落地和规模化复制能力,但探索原创技术路线的勇气与定力极度稀缺。当前行业普遍存在的“风向标式跟风”现象——一旦某条路线获得市场追捧或舆论热度,全行业往往不顾自身积累和技术特点,“迅速掉头”,导致资源、项目、人才、资本蜂拥而至又急速撤出。
中国应抓住“融合”机遇,在视觉AI经验模型和多传感器感知能力的交汇点,结合中国独特复杂的混合交通路况、基础设施现状、政策法规环境和消费者使用习惯,打造专属的、能形成闭环的数据驱动体系。
以下为采访实录(略有删减):
华汽研究院:您觉得懂车帝测试是不是代表了当下中国汽车厂智能车的一个真实的水平?
许敏:我觉得这个测试来的恰到好时候,给行业的虚热拍拍冷水。大家都知道不仅是在自动驾驶,在新能源汽车动力,在智舱、大数据、人工智能、大模型等细分领域,凡是新的东西,很快就会被说成是一种马上就要产业化,马上就要投入应用。
到底应该怎么样应用,被吹的虚高脱离现实。但是科学的进步也是缓慢一步一步来的,并有他自身的规则,不是按照我们人们的意志转移的。懂车帝测试的现象在其他热门的技术方向也出现了,整体来讲大家的心态太浮夸了。
到底我们的智能驾驶能干什么?到底他能够给我们带来什么?我们到底应该怎么去做这个事情?这个时候,需要大家冷静思考。
汽车工业在为人类带来巨大便捷的同时,也伴随着显著的负面影响。环境污染(如尾气排放)虽然事关长远,但其对普通民众的短期影响相对间接,更多依赖政府层面的规制引导。
然而,交通安全问题则截然不同,它如同一个挥之不去的阴影,真切地笼罩着全球社会。每年由交通事故造成的庞大人员伤亡(数十万甚至上百万生命逝去)、伤残以及惊人的财产损失,构成了一个沉重的社会代价。支撑这一代价的是一个同样庞大的保险体系——本质上是全社会在被动地为交通事故的巨大成本“集体买单”。
正是在这个痛点之上,智能驾驶技术蕴藏着革命性的潜力:它有望大幅降低、甚至从根本上消除人为因素导致的交通事故。这一愿景如若实现,对社会安全福祉的提升、对汽车行业形象的革新,其贡献将是不可估量的。因此,智能驾驶自诞生之初,其最崇高、最迫切的使命就应当明确聚焦于此:成为交通安全的“终结者”,而非仅仅是便利性或体验感的增项。
人类驾驶员能力具有显著的个体差异和经验边界。在常规状态下,或许表现稳定,但在关键的能力“极限区域”——如复杂视野盲区(“看不到”)、突发状况下的反应迟滞(“来不及反应”)、以及判断失误或操作错误(“误操作”)等场景中——人的脆弱性暴露无遗。
而智能驾驶的核心价值,恰恰在于能够突破这些人类固有的生理和心理局限:其传感器能超越人类感官覆盖盲区;处理系统的决策与响应速度远超人类反应时间;精准的逻辑控制能避免人为误操作。
因此,要真正实现其安全使命,智能驾驶系统的核心能力构建与技术迭代路径,必须坚定地聚焦于“高危场景”而非一般路况。这意味着研发、训练和验证的重心,应当放在那些极易发生事故的特殊、极端或“边缘”工况上。唯有通过在这些真正考验安全性的“试金石”上反复锤炼,智能驾驶技术才能兑现其消除事故、保障生命的根本承诺。
事实上,懂车帝的测试用例远远不够。真正具有革命意义的测试应直击人类必然失守的高危场景——那些占交通事故80%以上的视觉盲区、突发险情、极限反应失效场景。智能驾驶是减少事故的安全冗余保障技术,被虚夸为自动驾驶后本末倒置了,造成非专业用户的盲目相信,这才是引发安全事故发生的根源。
华汽研究院:特斯拉这次在懂车帝的测试当中还是比较领先的,所以您觉得这说明了啥?
许敏:人类经验的不可复现性驾驶行为的核心是经过长期实践形成的默会知识,具有高度情境化、模糊决策的特征。如同顶尖工程师对复杂系统(如发动机燃烧控制、湍流流体力学)的优化能力,或优秀作家的创作直觉,其底层逻辑难以被完全解析为数学规则。这是当前技术难以彻底替代人类的核心壁垒。
人工智能的颠覆性在于首次实现对经验型知识的系统性转化。将难以量化的经验型知识,转化为可存储、可迭代、可规模化应用的数据模型,实现对人类经验库的升级扩充。
智能驾驶应遵循生物进化启示:人类双目视觉已充分适应地表环境,车辆通过多摄像头布局即可满足感知需求。激光雷达是洞穴生物的特殊解决方案,在开放道路场景属于冗余设计。核心在于利用AI学习人类驾驶经验,而非强行复制蝙蝠的声呐感知模式。
人工智能的核心突破在于将海量人类驾驶经验转化为可复用的决策模型。通过全球驾驶员应对突发场景(如避让行人、湿滑控制)的数据训练,AI可形成超越个体的“超级经验库”。这种基于软件算法的方案成本极低(千元级),且能通过OTA无限复制升级。相比之下,依赖激光雷达+高精地图的硬件路线需单车投入数万元,且对复杂环境的解析能力反而不及经数据训练的AI系统。
特斯拉技术路线的本质在于构建数据驱动的经验复用模型:通过全球车队采集的百亿英里真实驾驶数据(涵盖各类突发场景),训练出模拟人类驾驶决策的神经网络。该模型的核心优势在于——训练阶段虽需大算力支持,但部署至车载终端时仅需中等算力芯片即可运行,大幅降低硬件成本。相较之下,国内主流方案过度依赖车端实时感知与高算力芯片解析环境信息,本质是用硬件算力弥补数据经验的缺失。
需客观认知的是,即便特斯拉方案亦存在物理局限:在超越人类经验范畴的极端场景,仍需激光雷达等传感器提供冗余保障。因此理想的技术路径应是“数据经验主导+关键硬件兜底”,而非非此即彼的路线对立。当前产业瓶颈在于:部分企业为短期利益夸大硬件价值,却忽视数据资产的核心作用,这恰是制约中国方案实现超越的关键症结。
华汽研究院:您觉得到底懂车帝这个测试对中国制造产业的反思是什么?
许敏:我是感觉到需要整个社会能够达到很好的共识。当前智能驾驶面临的根本挑战在于信任危机。若行业持续忽视对极端场景的验证能力,最终将导致技术泡沫化。用户质疑的核心并非技术本身,而是现有测试体系无法覆盖真实事故中的复杂工况。我觉得懂车帝覆盖的场景可能1%都不到。标准制定的困境在于:试图通过有限测试项目穷尽无限可能的现实变量,本质上是工程学上的不可能任务。
早在上世纪90年代,美国高校的交通事故司法鉴定研究就建立了成熟方法论:基于物证数据逆向推演碰撞全过程,其还原精度甚至能成为法庭证据。遗憾的是,这些沉淀数十年的真实案例库至今未被有效转化为测试标准,致使大量研发资源消耗在闭门造车的实验场景中,而非聚焦于挽回生命的关键场景验证。
华汽研究院:辅助驾驶L2辅助驾驶的这个强制国家标准,到底是应该定的高一些,还是应该定的稍微宽松一些?
许敏:当前智能驾驶评价体系的核心缺陷在于缺乏量化、可验证的极端场景考核标准。应以交通事故司法鉴定数据为基础,建立包含60-80个高频高危场景的测试库(如横穿车辆避让、湿滑路面失控等),并设定明确的能力阈值:例如系统在80%通过率可认证为L3级。
智能驾驶技术落地必须建立明确的责任隔离机制。参考福特F-150的L2系统设计范例:在结构化道路启用驾驶辅助时,系统同步实施三重防护——实时监测驾驶员状态、设置系统能力边界、强制风险管控。
同时要求厂商遵守两项原则:一是严禁能力夸大宣传;二是必须通过车机系统明确告知可用场景及失效风险,建立“辅助系统不等于驾驶员替代”的认知基础。
安全技术的突破从来不是替代逻辑而是增强逻辑。我觉得数据驱动为主、硬件保障为辅,这两者相结合可能是相对比较完美的自动驾驶行为。经验模型层基于海量人类驾驶数据训练AI决策主干,覆盖常规场景,通过影子模式持续迭代优化。硬件兜底层激光雷达/毫米波雷达等传感器专攻剩余极端场景,在算法失效时提供物理级冗余保护该架构的关键在于分层设计。
华汽研究院:中国朝着AI数据驱动的模式这个方向,最重要的能力是什么?
许敏:最重要的是原创新能力,盲目跟随特斯拉不可取。局限在于,纯视觉方案需依赖超算级训练能力;马斯克已在同步研发低成本激光雷达(通过Dojo超算项目),我感觉其最终方案实为“视觉主导+硬件兜底”的复合体系,而非目前搭载的纯视觉方案。
中国不缺优秀的工程师、不缺海量数据、不缺强大的制造能力。最缺的是:敢于舍弃短期利益,坚持走原创路线,并愿为长期引领投入的企业家与科学家群体。