对话何小鹏、李力耘:如何区分“真假端到端”?

“中国第一辆端到端汽车。”

5月20日,Xpeng Motors的AI日,何宣布端到端大规模车型已上车,即日起,AI天玑系统将全面推送给用户,覆盖所有在售车型。

在特斯拉FSD V12的推送之后,国内智能驾驶行业一直在争论“端对端”。《小鹏》的上映,犹如一颗深水炸弹,再次点燃了《端游》的热度。

根据发布的消息,小鹏的端到端宏大模型由三部分组成,即神经网络XNet、监管宏大模型XPlanner和宏大语言模型xdrion。变形金刚超能勇士崛起

XNet可以模拟人类的感知能力,可以将自动驾驶系统的感知范围提高2倍。XPlanner可以使机器的驾驶策略拟人化,使前后倒退减少50%,违规停车堵塞减少40%,安全接管减少60%。xdrion可以使自动驾驶系统具有与人脑相同的理解和学习能力,并可以识别等待区、潮汐车道、特殊车道、街道标志等。

与此同时,何肖鹏还表示,小鹏的端到端大模型未来可以每两天迭代一次,其智能驾驶能力将在未来18个月内提高30倍。

此前,小鹏的自动驾驶系统有大约10万+行代码,但一个无限接近人类驾驶员的自动驾驶系统需要大约10亿行代码,而且人工编写规则几乎是不可能的。切换到端到端大模型后,系统将能够实现几乎无限的规则。

何肖鹏表示,之前,小鹏认为实现无人驾驶需要很多年的时间,但今天,经过端到端的大规模汽车测试后,小鹏认为机会不会太遥远,也许几年后,它将看到更强大的无人驾驶,甚至完全无人驾驶。

除了端到端模型,AI天启系统还包括三个功能:萧艾P、AI司机和AI保镖。

萧艾P相当于大语言模型加持的语音助手小P,具有更高水平的理解和需求推理能力。AI司机可以实现AI驾驶和AI泊车功能。

此外,何还透露,梦娜系列的第一款车型,也将于今年6月亮相。

会后,接受了自动驾驶负责人何和的采访,就小鹏自动驾驶规划、端到端和大模型等问题交换了意见。以下是本次交流的内容。雷锋。com在不改变原意的情况下对其进行了编辑和整理。

问:你如何看待特斯拉对自动驾驶的关注?小鹏的自动驾驶研发会增加吗?

何肖鹏:很难评价他们的动作。它们是不同的路线。大模型是自动驾驶的颠覆性变化,而不是比例的变化。今天,我特别提出下一代新的自动驾驶。我相信我们会和所有的朋友拉开非常大的差距,而且会提高几十倍。

我自己的判断有了变化。在今年之前,我认为中国完全实现无人驾驶还需要很多年,需要解决的问题太多了。但今年,端到端的大模型开始在公交车上进行测试。我们看到数据后,觉得机会就在不远的将来。几年后,我们可能会看到更强大的无人驾驶甚至完全无人驾驶的到来。过去10年,大家都认为智能化只是新能源汽车的辅助。用户对智能的需求过去排在第10和第9位,但现在可能排在第5和第4位。我认为在不久的将来,我们将是绝对的前三名。

问:小鹏下一步如何保持领先甚至远远领先于大型模特?

何肖鹏:自动驾驶是一件非常困难的事情。这不是靠钱或人能做到的。它有成功的概率和非常大的数据门槛,未来会越来越难,因为头部效应会越来越明显。

其次,在过去的一年里,许多公司一直在效仿小鹏制作“高精地图”,但没有成功。他们只在极少数地区使用浅色地图或非高精度地图。事实上,这方面的技术难度远远超过了最初的NGP。很多人说,在高精地图上做高速辅助驾驶比较容易,但在市区很难去掉地图。

去年,中国开始有了大模型的创业风格,但大模型真正从模型到应用再到项目落地的难度远超预期。

今天,我们的升级只是第一步,但我们已经看到了一种方法论并真正将其落地,我们可以每两天进行一次内部OTA。在过去,人们根本做不到。在过去,自动驾驶的规则处于10万级别。现在我们用的是大模型,未来我们要做到1亿、10亿甚至更大的规模。

当然不能完全和之前的自动驾驶相比,因为是推理模型,逻辑和之前完全不一样。手机 中关村

我认为包括小鹏在内的少数企业将把绝大多数正在做自动辅助驾驶或上一代具有规则和人工智能辅助的智能辅助驾驶的企业越拉越远。

问:与特斯拉的FSD相比,具有AI功能的小鹏智能驾驶系统有哪些优势?小鹏说,在18个月内,他的智力驾驶能力将提高30倍。达到这个能力后,职责分工有变化吗?以及,智能驾驶的成本降低到了什么程度?

李丽云:我们无法评论特斯拉的具体表现,尤其是在中国。如果特斯拉FSD能进入中国,我们会欣然接受。鲶鱼效应可以促进国内智能驾驶行业的发展。我们非常希望FSD在进入中国后能帮助您更好地了解小鹏的智能驾驶,我们对我们的智能驾驶也非常有信心。

如何看“AI定义汽车”?以前大家都认为端到端的AI大模型是一个大网络。事实上,人类是最通用的人工智能系统,它由眼睛、耳朵、嘴巴、鼻子、大脑、小脑和运动神经组成。它们可能会重叠,但也是分工非常明确的主题。因此,我们对AI的理解也提出了既有联系又有分工的XBrain、XNet和XPlanner,它们可以很好地提高AI智能驾驶能力的上限。

但与此同时,我们也在从高精地图或10万+规则一路挣扎。我们不仅可以保证非常好的上限,而且我们的下限也有多年积累的技术。

此外,我们还有一个非常高效的迭代系统,例如每两天一个内部版本,每个月都需要为用户更新,每个季度都会更换“新车”,迭代也非常快。

问:最近一两年,一些车企正在布局智能驾驶赛道。很多人说,智能驾驶时代已经到来。智能驾驶时代,赢家已经确定了吗?后面的人还有机会吗?

何肖鹏:没有人能说得清,中国没有一家汽车公司拿到船票。我想没有人拿到船票,所以每个人都有机会。

小鹏在这个行业非常敬业,一些企业近年来一直在追赶。我认为他们的方向是正确的,但这不是几个人几年就能赶上的,而是一件非常长期的事情。

我相信在未来,这个行业会有几家公司能够把全无人驾驶或者全自动驾驶做到中国乃至全球最好,但不会太多,因为难度很大。

例如,真正原创的大模型在中国和世界各地都很少见,其中一些模型的推进速度很快,例如OpenAI,但其中许多模型的推进速度并不快。大模式拼的是长期专注和综合能力,包括数据规模、技术实力和商业实力。

我同意会有越来越多的公司编写软件,软件公司的算法能力和技术会越来越快地提高。但在大型车型领域甚至很难出现Tier1。Tier1卖给你一个自动辅助驾驶软件,只是更新时间晚了一点。但是大模型的数据要回收。今年小鹏的年度计算成本超过10亿美元,但如果我们想从90、91、99、99.1和99.991继续前进,这一成本将是多少?

过去,在软件时代和智能软件时代,使用Tier1作为集成商是可以的,但在大模型时代非常困难,因此未来合作模式将被从根本上颠覆。

q:端到端大模型虽然可以提高能力上限,但也遇到了黑盒无法定义的问题。在提升整个智能座舱和智能驾驶的体验方面做了哪些优化?

李丽君:自动驾驶进入无图时代后,大家会发现AI真的可以突破10万+线路图的上限,实现无上限规则的能力。AI自然能够在一个非常不确定、模糊空的需要博弈的空间中找到一个非常好的解决方案。而且,如果我们使用一个好的模型架构能力和一个好的系统,AI仍然具有自我进化和学习的能力。当然,我们仍然需要给它一些指导和方向,以便AI可以提高上限。

人工智能是可解释的吗?即使它是一个端到端的大型模型,也有不同的部分专注于该地区。XBrain侧重于对整个大场景的认知,XNet侧重于感知和语义。他们在工作中密切配合,共同训练和标注,是一个有机的整体。

如果我们在工程实践中遇到问题,我们可以发现是因为我们理解了问题,还是我们没有看到问题,或者是因为我们看到了问题并正确理解了问题,但行动是错误的。这在我们的实践中很容易解决,也是小鹏真正批量生产端到端大型车型的最重要前提。

问:每个人都在谈论端到端和大模型。大型号之间的性能有什么不同吗?是什么决定的,算法、算力还是数据量?

何肖鹏:首先,必须有。外面各种语言模型天天宣传,就像以前的手机出走一样,是一样的逻辑。但自动驾驶模式是一种垂直的专业模式。目前我们还在做前期培训,没有后期培训。

我觉得在这个领域,目前看L4配方的大车型安全性和体验会更好。模型有多大,这个模型的数据有多强,最终取决于客户体验和用户的价值。这是我自己的看法。

李丽云:这也取决于我们的计算能力利用率和模型更新的速度。每个更新的版本都能保证进度吗?我觉得整个效率体系和算力也很重要。

问:您能告诉我们端到端分析方法的硬性指标是什么吗?

何肖鹏:现在很难。端到端本身是系统内的能力,指的是在各种复杂场景下的成长和个性化能力。端到端是即时响应,规则非常稳定,在类似的环境中可以实现广义反馈。

对于端到端大模型的硬性指标,我认为是最终的接管率。如今,如果电池寿命没有问题,您可以每1000公里接管一次。在市区,今天所有城市都辅助驾驶。我认为安全接管可能是100公里或100公里。但是体验接管在十公里之内。如果在市区接管100公里、300公里和500公里,体验完全不同。这是以前的规则算法永远做不到的,因为问题是无限的。未来,我们将考虑制作一些工具来衡量接管率,并在任何道路上行驶100公里,看看它的个性化程度如何,但这非常困难。

问:特斯拉说它在宣布端到端时放弃了30多万行代码。我们能定义它放弃了10万行代码吗?我们是一个完整的端到端的神经网络还是后处理?

何肖鹏:我们不能这么说,因为我们没有准确的统计数据。没有人敢说端到端是一个神经网络,它是在一个系统中完成的,就像刹车在哪里一样,它必须有一个规则的系统。我们在规则系统上有优势,可以沙盒化制动控制器的算法。

问:今年小鹏在智能驾驶和训练数据方面的投资约为42亿元。销量波动时如何衡量这个投入产出比?我们应该减少对他人的投资还是保持更多的投资?

何肖鹏:我们今年在R&D投资了大约70亿元人民币,这是非常坚定的投资。从2019年到2020年,许多汽车在纯电动市场的销量出现了波动。我们认为这种波动大约是1-2年,这并不代表其销售能力和整体能力。所以我一直想强调,短期销售不值钱,但研发要非常坚定。今年,小鹏的运营能力有了很大提高。去年6月,我们预计自行车成本将下降25%,到今年年底将远远超过这一水平。我们不会花不该花的钱,我们肯定会花更多该花的钱,包括智能驾驶。

问:你提到今年将在算力领域投资7亿元。这会成为一种惯例吗?就像马斯克说每年要投资10亿买卡一样。

何肖鹏:这不是通常的做法。明年肯定会更多,所以我们有点惨。

问:端到端会让大家回到一个起跑线上还是差距会扩大?如果端到端成熟了,智能驾驶的发展需要的人会不会越来越少,算力成本会不会越来越高?这是一种权衡关系吗?

何肖鹏:这取决于不同的团队。过去,全球有很多优秀的公司并没有真正将L4落地。这背后有很多原因,不仅仅是算法能力或某些能力。小鹏的道路是软件和硬件相结合,从起点到高点共同努力,而不是从高点到低点,这是一个非常巨大的差异。在汽车领域做好自动驾驶是工程能力、经验能力、全局通用能力、成本和控制能力,而不仅仅是效果,这是非常不同的。夏普是海信的旗下品牌吗

我认为,要做好端到端需要庞大的机队、庞大的算力,以及在安全领域的长期渗透。这些都是基本条件,没有这些条件就做不好。

q:在通用能力越来越强的情况下,为什么还要继续推出AI驾驶、AI泊车等相对特定场景的智能功能?

李丽君:通用模型的能力越来越强,但它解决了最通用的体验、效率、舒适和安全,这与AI驾驶和AI停车并不矛盾。AI驾驶和AI停车更多的是千人千面,学习你的习惯做出改变。你居住的城市、你的路线或你的停车习惯都是不同的。其实人也可以比作AI。每个人都是非常强大的AI,但每个人都有点不同。

何肖鹏:如果它是完全通用的AGI,它仍然远离真正的能力。你可以通过做一个特定的场景来为现在的体验增加50分。你愿意再等10年或20年吗?我认为通用AGI不会很快实现。

问:今天,部分车型开始推送AI天启系统。你期待智家的长板在什么时候能给销量带来质的提升?

何肖鹏:转折点什么时候到来?我现在不敢说。过去大概知道有50个程序员,变成了100个,人数增加了近一倍。然而,在训练中,AI大模型在最初的训练中是不可解释的,从零到有用需要很长时间。

但是我们发现,从有用到有用,可能比想象中要快得多,这是以前靠堆人做不到的。所以今天我们仍然在培育它。我认为在目前硬件性能不变的情况下,仅通过软件升级就能实现巨大的颠覆,大约需要12-18个月的时间,但这需要巨大的训练量和长期的训练时间。我说它会颠覆很多以前做自动驾驶的公司,因为随着高级自动驾驶和无人驾驶的实现,智能辅助驾驶技术不能以单一软件功能的形式销售,智能驾驶会带来很高的数据成本。

问:在不改变硬件的情况下,12-18个月可能会出现拐点。这个拐点到底意味着什么?

何:我希望所有的城市道路,包括住宅区,都能实现非常低的接管率和非常高的安全率,你不会觉得它很慢或很笨,它总是卡在那里,玩游戏。

问:问:艾·知止是如何在海上着陆的?每个国家都有不同的数据要求。

何肖鹏:首先让规则的能力全球化,比如NGP,它对数据基本没有要求。在出海之前,我们将进一步优化大模型的端到端能力。在海外,我们将严格遵循数据隐私要求,使整体能力全球化。

问:今年我们与大众汽车的合作备受关注。小鹏是否愿意在未来将这种合作模式扩展到更多的汽车公司?

何:现在有一些厂家正在和我们沟通,希望通过这种方式进行更多的合作。我们不是标准的第一层,我们希望有更深入的合作伙伴走向全球。在过去,与公众合作是非常好的。每个大型海外企业都有很多值得学习的地方。

未经允许不得转载:科技让生活更美好 » 对话何小鹏、李力耘:如何区分“真假端到端”?