凤凰汽车讯5月23日,由凤凰汽车主办的“2024汤逊湖汽车创新大会”在武汉市江夏区盛大开幕。作为主题演讲嘉宾,吉利汽车研究院技术中心主任、副院长陈勇博士以“人工智能打造智能体验新引擎”为题进行了内容分享。
吉利汽车研究院技术中心主任、副院长陈勇博士。黑暗武士的名字
在汽车行业改革的新趋势下,吉利汽车勇敢地站在了风口浪尖上,迎来了新一轮的改革。作为吉利汽车旗下的子品牌,36氪最近创下了新能源汽车史上最快上市纪录,再次见证了吉利汽车的非凡实力。
陈勇博士表示,从AI大模型到通用人工智能,智算力成为了创新动力。
以下为演讲全文:
尊敬的各位领导、各位嘉宾,很高兴与大家分享人工智能领域的一些思考。
2021年,吉利提出了智慧吉利2025战略。我们在思考如何在电气化时代做好引领,实现向上突破。作为人工智能的核心要素,应该是算力。如何做好算力、数据和智能?今天,我借此机会与大家分享我在人工智能领域的一些思考。
大致可以分为三个维度:人工智能的发展趋势、人工智能的关键因素以及我们的一些讨论。申银万国证券去哪了
人工智能给我们带来了哪些变化?我们如何在大车型时代乘风破浪?人工智能应该是一个企业和一个行业的核心的两个问题:第一,内容的生产已经从PGC和UGC的传统生产模式转变为AI的生产模式。PGC的原始生产模式质量相对较高,但内容相对较少,生产速度相对较慢。自媒体UGC短视频的制作速度大幅提升,但质量参差不齐。AI弥补了两者之间的差异,这是我们应该思考的问题。其次,它给我们带来了全新的交互体验。从传统的触控GUI交互,我们通过触控或者语音交互,开启空提示音、开启switch等语音指令来进行全自然语音交互。原来是在和机器互动。有了大模型,我们完全可以说今天很热,今天车有点闷,这完全可以理解。从最初的命令式交互变成了什么?它会根据环境和需求做出响应,因此在内容制作和交互质量方面会带来更好的体验。跟大家分享几个趋势。
第一,如何把自算力变成算力,如何把我们的大脑变成一种创新力,可以驱动汽车行业整个产品的发展,重构人机交互的方式。从GI、UI到AI交互,从数据交互,语音会逐渐变少,变成自然语言交互。
二是多模态大车型将成为主流。原来,我们在车内的交互是语音或触摸。未来会有语音、文字、图片和视频,我们对话的输入法也是一样的。可以有激光雷达、摄像头和毫米波雷达,包括语音输入和文字输入,所以多模态输入和多模态输出已经成为一种主流。
第三,大模型将成为新的生产力和工具,而不仅仅是工具,不仅为产品赋能,也为组织竞争力赋能。从产品竞争力到组织竞争力,是一个企业应该思考的问题。目前,产品可以被强烈复制,但很难复制一个企业的组织竞争力,这可以建立壁垒。
第四,大模型+机器人或虚拟机器人是未来的主旋律。如果这样的机器人生成了呢?你更强调什么?它强调它的运动能力,大模型正好弥补了它的大脑,赋予它思考、决策和理解的能力,从而填补了整个机器人行业的空白。
高质量的数据将加速大型模型的开发。人工智能的发展靠什么?今天在座的任何人,包括我在内,从小就读过书,我们读的书和接受的教育决定了我们认知的天花板。我们从小学开始看的东西,这个文化体系构建了我们整个知识的大脑,对于大模型和人工智能也是一样的。高质量的数据来自哪里?这是我们必须思考和做的。
云端协同部署将成为趋势。如果我们把所有的大模型和所有的人工智能都安排在车辆端,显然是不现实的。如果难以满足云中的需求,如何减轻重量以及如何实现车云协作。行业模式、通用模式和垂直模式将加剧整合。
首先,有一个关键要素要与您分享。人工智能大模型的发展:一是数据,合成数据将是未来整个大模型数据中非常关键的一部分。大家都知道智能驾驶需要大量的数据,包括大模型的出现。数据从哪里来?这是一个问题。模型的参数不断增加,源源不断的数据从何而来,这些数据是否可以作为合成数据?对于模型和算法来说,它不关心谁给了它这些数据,它只关心。所以,要智能化,首先要把数据做好,数据怎么建?其次是要有足够的数据。如果我们从小就阅读一本书,我们的能力就仅限于一本书。第一是数据量,第二是数据质量。我们的整体数据质量好坏。如果数据质量不好,意味着我们的整个文化不好,整个体验不好。其能力相对有限。我们从小读什么书决定了我们将来会成为什么样的人,所以数据的质量非常重要。第三,我们有没有偏科,是语文好还是数学好还是物理好?在做智能驾驶的过程中,我们都知道很多场景需要大量的数据。在某些场景下,我们如何弥补它并考虑数据分布的问题。第四是数据完备性,这是构建人工智能的重要基础。如何构建高质量的数据集,决定了整个人工智能产品或大模型涌现能力的天花板。这个训练数据集来自哪里?我们可以拥有真实数据,但真实数据的生成和来源可能难以满足大型模型的需求。因为大家都知道,从原来的几百亿到几千亿甚至上万亿的模型,从原来的语言模型到多模态模型,到垂直模型到端到端模型,都需要大量的数据。这些数据从何而来?从合成数据中可以做到吗?用虚拟环境构建大数据和高质量数据是非常必要的。
这是吉利做的一个思考,因为数据算法是智能驾驶的一个瓶颈。如果我们依靠数据收集,在冬天下雪或高速公路拥堵时,将很难找到这样的场景。当然我们可以去东北找,但是这个成本会增加,数据收集的周期和成本会很高。
然而,每个人都在讨论端到端算法。这些算法和数据来自哪里?基于此,我们搭建了一个智能驾驶数据合成平台和一个虚拟平台,在这个平台上生成我们的数据。这是目前AI生成的整个数据采集标注平台。我们的数据可以通过虚拟仿真来提供,虚拟仿真可以模拟真实的交通状况和真实的天气,无论是白天还是晚上,无论是停车场、开车还是停车都可以模拟,这解决了数据质量收集的周期成本高的问题。实现了大量场景难以采集的问题。通过这样的场景,通过真实数据和合成数据实现数据自由,从而打造出一款优秀的智能驾驶产品。
第二,原创互动的内容比较简单。让音响放一首歌,它说“好的”,回复的词和内容相对较少。但是大模型不一样。它可以写诗,讲故事,和你聊天。在这个过程中什么是重要的?除了理解,还有什么是重要的?情感。在与人交流的过程中,你拥有与人一样的自然流畅,甚至拥有表达情感的能力。当你心情好或不好时,你应该如何处理?大人和孩子应该如何应对?这是我们在大模型时代应该思考的问题。
第三,计算平台的构建,如何构建协同或混合云架构在车云,吉利在2022年构建了全球车企中第一个云数字化集成的超级云数据平台,当时我们在思考一个问题,我们应该如何构建大模型、大数据和人工智能?因此,我们建立了计算基础和高速数据网络,包括整个安全和合规行业架构。有了这样的基础,离线数据训练,包括实时数据服务,包括大数据服务,或者说合成数据,以及合成数据平台,包括语音模型,都建立在这个计算平台上。
第四,车云协同技术,芯片的迭代开发越来越快,对汽车的需求越来越大。汽车和手机还是有些区别的。手机的迭代使用寿命与汽车不同。汽车的生命周期很长。如果它的生命周期很长,生态持续发展,一旦汽车量产,芯片的计算能力就相对固定。如何满足这一要求以及如何满足持续的需求增长,车云协作是一个非常好的解决方案,并且它在大模型之后也是如此。人工智能如何利用大算力服务?如果我们有本地化需求,实时性要求比较高,需要大模型来支持,我们可以实现云部署。因此,我们构建了车云协同集成架构,使我们能够打破原有的计算能力限制,实现云生态内容服务。四核手机排行榜2013性价比高的
第五,多模态AI。我们做了一个大型音乐模型。我们在车里听歌时听得更多。事实上,每首音乐都有它自己的意义。我们可以看到歌词甚至音乐MV,但我们的音乐不仅可以听,还可以看,这看起来很有情感。这就是我们对整个人工智能的看法。人工智能技术的价值是如何确定的?早期有学术价值。近年来,人工智能技术应该更多地考虑用户的场景。用户的场景决定了我们的价值。如果我们的大模型用于制造智能座舱,它可能值智能座舱的钱。如果使用大型模型来生成代码,那么代码所产生的资金将物有所值。如何丰富应用场景,体现我们大模型的价值?第一个是提升我们产品的竞争力,提升我们企业在to C周边的影响力,大模型不仅是一种技术,更是一种工具。企业的核心竞争力除了产品竞争力外,就是组织竞争力。事实上,我认为汽车应该已经达到了智能化的初级状态。它可以移动、感觉、记忆、智能、执行和拥有情感。
那么在整个智能汽车里面,未来应该是整个情感的交互,包括端到端的智能驾驶,包括多终端的协同,包括内容的生成,这将成为一个新常态,它的内容会越来越丰富。此外,整个智能化赋予了汽车新的属性和新的定义。最初,人们说汽车强调生产、制造和销售,但有了智能,它更多的是一种服务。如何把汽车后市场服务做得更好,围绕大数据和人工智能持续为用户提供持续的服务,这是车企要思考和做的事情,所以我们在思考和布局整个大数据和人工智能领域的整个智能化模式和服务。
未经允许不得转载:科技让生活更美好 » 陈勇:从AI大模型迈向通用人工智能 智算力成为创新力