江湖,又到了风云变幻急的时候。前几天,蔚来ET7连续直播13小时挑战续航1000公里刷爆车圈。但相对于“蔚小理”曾经的意气风发,这场直播却充满奋力一搏的壮烈感。150度电池包,的确能缓解中国车主续航不足的深度焦虑,但如果想着仅凭这招就能在高新技术扎堆的电动车江湖呼风唤雨,就未免简单。江湖新的打开模式已锁定——就是智能驾驶,它的背后是基础算力、AI大模型、云计算所有这些尖端的科技。所以,蔚来真正的麻烦还在后面。现在,比蔚来更麻烦的可能是通用Cruise。Cruise,在之前众多智能驾驶相关的排行、测评中是仅次于谷歌Waymo的存在,遥遥领先于百度、特斯拉,也一度被看作是通用汽车的未来。

1703820351778168.png

图源:Cruise官网

但只是因为未能合理处理一个Corner case,Cruise的境遇急转直下,牌照被叫停,高管们纷纷离职,还有裁员……从第二滑到排行榜单屏都看不到,仅5年。Corner cases(CC),是自动驾驶场景中不常见或一些极端的场景数据,比如路边变形的事故车,或者外观变动大的车辆等等,它的背后往往意味着更大安全事故的可能性。一个Corner Case接近毁掉一家自动驾驶企业。这也意味着,自动驾驶技术行至今天,仿佛已经到了冲击珠峰的最后几百米,每进一步,都非常困难。现在,这个江湖的最大悬念就是:谁将第一批登顶?

行百里者半九十

续航400公里,还是1000公里,重要吗?重要,但不是唯一的重要。从商业的角度,为了多出来的几百公里,用户要多花很多钱,值不值一定会成为一个问题。从技术护城河的角度,电动汽车的几大核心部分:动力电池、电机、电控和智能驾驶,前三个都有了相对成熟的解决方案,差距也在可容忍范围内,只有智能驾驶,才是行业公认的“天王山”。不久前,美国加州机车辆管理局公布了一份《2018年自动驾驶接管报告》,62家持牌公司达到披露标准的有48家,全是行业的顶级玩家,它们当年的差距大到超乎想象。

1703820378246142.png

如今5年过去,L2已经成熟,L3似乎近在咫尺,这个进化速度让人们相信,自动驾驶的大时代肯定会来,只是时间早晚。但Cruise的遭遇带来了一抹阴影,头部玩家之间的差距看起来大为缩小,但想要弥补却变得比5年前更难。行百里者半九十,这警告现实而且残酷。自动驾驶95%以上的常见驾驶场景,或者说容易的都解决了,剩余5%场景(即业内所称的Corner case)的处理能力才是最残酷的考验。如果不能成为第一批解决这个技术问题的企业,那很可能就意味着出局。

Corner case于智能驾驶而言,大约就相当于珠穆朗玛峰北坡位于8680米处的那个高数米而几乎垂直的岩壁,过不去,北坡就叫“死亡线路”,过去了就是无限风光。它们罕见,却又无法完全避免,花样层出不穷,自动驾驶必须保证高效应对,否则,就有极大可能导致严重事故。2018年,特斯拉就因为一次事故,导致在某个测评中垫底。按照传统方法,要征服Corner case,有点玄学的意味。比如,它们的算力需求是碎片化的,从0.5T到几十、甚至几百T,对数据精度的要求,也是大相径庭,当然还涉及到算法,导致投入、产出比难以估算。

1703820405731725.png

简单说,如果用传统的路测车辆去发现、积累这些无穷尽的Corner Case,在成本、安全性、和时间上可能都是车企无法承受的。更麻烦的是,有很多Corner Case在路测中可能永远也不会遇到。所以,要赢得这场比赛,让自动驾驶尽快成为“老司机“,有两种办法:第一,找到一个搭配智能辅助功能车辆足够多的地方,这也是马斯克一直对中国电动车市场极为羡慕的原因之一;第二,就是当下最火的人工智能大模型,在GPT进化到GPT4-Turbo之后,新思路已经跃然而出。

上海人工智能实验室和华东师范大学的研究人员在今年7月发表了一篇论文中指出,虽然人类驾驶员和以前基于优化的自动驾驶系统都会开车,但人具备基本常识,而传统的自动驾驶系统连常识也需要学习和训练。但是,以GPT技术加持的LLM能够像人类驾驶员一样用常识推理复杂的驾驶场景,从而解决Corner Case 问题。

1703820424771235.png

图注:研究人员用具体例子展示了LLM在驾驶场景中强大的零样本理解和推理能力。利用常识知识,不仅让LLM能够更好地理解场景中的语义信息,还能让其做出更理性的决策,更符合人类的驾驶行为。

在国内,以华为云为代表的厂商在用大模型解决Corner case方面,已经积累了不少经验。

第一,你可以将其理解为真实重构。

盘古大模型结合NeRF技术,构建AI 3D引擎以及在此之上的AI 3D平台,进行建模、渲染以及3D 素材制作、场景制作等工作,最终实现将不同时刻拍摄的视频、图片、点云等多种模态的数据重建为虚拟的3D空间,并通过重建各类障碍物素材库,变换已有场景的天气、昼夜、季节等环境因素,基于已有路采数据做场景重建等方式,构造出新的Corner case。传统上培养一个老司机可能需要积累100亿公里的驾驶数据,那么现在这个里程被大大缩减,而且不用真车实跑,让大模型跑起来就可以了。

第二,数据标注一步到位。

传统主要是通过回放方式来给数据分类,而大模型+NeRF的方式可对街景、泊车等场景进行三维重建,实现“同一对象只标一次”即可迁移所有相关图像,“同一场景只采一次”即可获得不同视角图像,数据成本可降低到路采+人工标注模式的1/5,效率也大大提升。车厂每年积累的数据不断增加,甚至达到百TB级别,但真正能够用做算法训练的数据占比不到 10%,想提高利用率要么花千百亿重新进行数据标注,而盘古的场景理解大模型则已经可以高效从原始数据中把需要的数据筛选出来,最高可降低90%的标准量,效率提升30%-40%。

第三,算法优化。

传统技术路径中,自动驾驶方案中的算法训练也是需要经过反复验证,而大模型可以学习自动驾驶系统的弱点,自动创建对抗性场景,无需手动调整算法,可以适应更快节奏、更大规模的训练。大模型哪家强,现在公认的是美国遥遥领先,中国紧随其后,欧美日韩各有所长,而这个江湖的命运现在都聚焦在了大模型上。

1703820444801498.png

变“短板”为“跳板”

1975年,为了征服珠峰北坡8680米处的绝壁,中国将一个长6米的金属梯树立于此,让国际上对中国人居然从北坡登顶珠峰的质疑,从此烟消云散。当年中国一定要登顶的背后也是一场国际较量,中国与尼泊尔为了珠穆郎波峰的归属争执了几十年,尼方提出的最大质疑就是:你说珠峰归你,但你还从未从中国境内登顶过一次。所以,中国梯包含了国人的尊严,赌上了几批登山队员的生命,背后也包含了中国最顶级航天材料加工技术。如果说,大模型就是我们实现自动驾驶的那个“金属梯”,但这道梯子本身也绝不简单。每一个大模型背后都意味着海量算力的投入。比如,在自然语言处理领域GPT-3模型,就需要上千片A100芯片超一个月的训练时间。国盛证券估算,GPT-3的单次训练成本就高达140万美元,对于一些更大的大模型,单次训练成本介于200万美元至1200万美元之间。据业内机构预测,全球头部AI大模型训练算力需求每3~4个月翻一番,即平均每年增幅达到10倍。与算力需求端的高歌猛进相比,算力供给端则明显跟不上节奏。地缘争端更是人为加剧了这场竞赛的不公平。

过去几个月,并济科技、汇纳科技等多家 A 股上市公司公告,将内嵌英伟达A100芯片的高性能算力服务收费上调100%,而一些云厂商则悄然暂停A100服务器出租业务。英伟达专供中国大陆市场的H800型号芯片,因新增列入禁售名单,其售价已翻倍,从原本的人民币21万元急涨至最高人民币40万元,但仍然很难买到。在算力焦虑之下,业内甚至出现了“谁能争抢到算力,谁就更有先发权”的观点。所幸的是,国内有华为云这样的算力玩家顶了上来。而通过可持续的算力服务,华为云已经成为大模型企业的重要算力提供商。

据了解,华为云乌兰察布数据中心部署了单集群达2000P Flops的昇腾AI云服务,大模型训练30天长稳率达到90%,断点恢复时长不超过10分钟,同时训练效能可以调优到业界主流GPU的1.1倍,推动大模型技术更好地服务于汽车行业。

华为云乌兰察布数据中心

昇腾算力底座可部署于私有云、公有云、专属云、人工智能计算中心 AICC 等。除了支持华为的AI框架Mindspore 外,还支持 Pytorch、Tensorflow 等主流 AI 框架,框架中的90%算子,可以通过华为端到端迁移工具从 GPU 平滑迁移到昇腾。

在安全方面,华为云也异常重视。为了满足监管和车企的需求,华为云在乌兰察布汽车专区采用3分区合规架构设计,包括数据处理区、智驾业务区和网络中继区,实现严格物理隔离和权限控制,满足自动驾驶开发合规要求。在运营上,华为云还构建7层安全纵深防御体系,并打造了安全云脑方案,构建300多个安全检测模型,100多个自动响应剧本,实现99%的安全威胁5分钟闭环。

同时,在汽车专区的认证资质方面,华为云通过了业内120+权威安全合规认证,是中国首个通过汽车TISAX认证的云厂商。

此外,华为云还构建了AI-Native存储系统,提供数据24小时入云、精细存储、高效训练服务,助力汽车行业面对智能化带来的数据浪涌挑战。事实上,对于车企而言,有了大模型和算力仍然不够,还需要一个构建数据闭环能力的平台,把大模型和算力池的强大功效真正发挥出来,对车企而言就是自动驾驶开发平台。众所周知,大模型开发和调优是一个复杂的系统工程,而安全、高效地运维、使用大规模算力也有着极高的技术门槛。因此,车企们就需要一个强大的工具包,来实现开发自动驾驶方案所需算力、数据、算法的同时加速。

在国内,华为云的自动驾驶开发平台就是这样一个功能强大的基础设施。该平台基于盘古大模型和ModelArts AI开发生产线,提供了数据生成、自动标注、模型训练、云端仿真、虚实结合仿真、数据闭环等一系列能力,帮助车企和商用车企业加速自动驾驶算法的开发验证和优化迭代,降低成本和风险,提升效率和安全性。
目前,该平台已经在长安、一汽等多个车企以及矿用卡车、港口ART、专线物流重卡等商用车场景中应用并取得良好效果。比如,在露天矿上进行装排土作业的场景下,华为云就帮助无人驾驶宽体车实现了全无人驾驶、全天候7*24小时连续作业,解决了露天矿扬尘遮蔽、无标识颠簸道路、特种作业车辆混行等多种挑战,并对重载达上百吨的车辆规控算法进行了有效调优,实现厘米级的精准停靠。

1703820483645935.png

时间窗口不多了

人工智能大模型对自动驾驶的影响到底如何?汽车行业的人都在关注特斯拉的自动驾驶系统FSD V12。此前有消息称,特斯拉近期已向内部员工提供FSD V12,而业内预计明年年初会正式面世。业内人士普遍认为,FSD V12的发布将拔高自动驾驶层级,让L3(有条件自动驾驶)级别以上的竞争提前到来。而最近,随着北京、上海大量发放L3自动驾驶测试牌照,一场新的自动驾驶竞赛又迫在眉睫了。最忧虑的还是那些传统车企,它们在这场竞赛中,已经被远远的拉下。

现在,绝大多数传统车企的自动驾驶方案还停留在L2级别,而如果不能快速升级至L3级别,可能很难参与未来更加激烈的市场竞争,被淘汰将不可避免。但要参与L3级别的竞争,传统车企的技术现状又着实令人担忧。一些车企想着靠堆砌硬件的方式来追求L3级别的自动驾驶能力,但是过多的硬件配置又拉高了车辆的成本。此外,仔细观察行业,你还会发现,虽然车企口头上都对自动驾驶信誓旦旦,但是很多车企根本就没有搭建其专业的自动驾驶开发平台,而有些车企虽然已经搭建开发平台,但真正能用起来的又不多。不用说,L3级自动驾驶方案研发所涉及的技术门槛很高。以传统车企现有的人才结构,很难走特斯拉那条全自研的路,更何况市场也不会给予车企更多时间进行技术积累。
面对现实,华为云已经铺就的技术平台,也许会成为它们跨越绝壁的梯子,能让它们避免被L3的竞争过早的淘汰。事实上,通过这种合作模式,自动驾驶领域未来专业化的分工体系也初现端倪,可能也更符合汽车行业的发展现状。

1703820531152580.png

结语

汽车智能化的大时代已经到来,整个产业链都被裹挟在巨浪之中,或被动或主动,但改变、创新是唯一的选择。同时,围绕自动驾驶方案的研发,也已经成为车企不能输也输不起的核心战场。根据麦肯锡的预测,到2025年全球自动驾驶技术及相关应用的市场规模将达6000亿美元。伴随大模型驱动的研发平台加速进化,自动驾驶量产进程也将驶入快车道。与巨大的市场机遇相伴,一条决定车企未来命运的自动驾驶生死线也已经慢慢划开。从L2到L3级别的升级,看似简单,但闯过去了才有可能是新时代的弄潮儿,闯不过去就一定是旧时代的诺基亚。由于有了“中国梯”,已经有上千人征服了曾经的“死亡路线”,而且死亡率一直在下降。在自动驾驶的珠峰攀登之路上,显然传统车企也需要找到能让自己突破技术瓶颈,避免行百里者半九十的那道“中国梯”。