中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o

新智元报道。

编辑:编辑部

【新智元简介】央企通信巨头再次奏响大模型舞台的超级声音!在刚刚结束的中国移动人工智能生态大会主题论坛上,中国移动发布了“九天”多模态基座模型,成为国内最可靠、最懂行业的全栈模型。

在通用大模式的时代大潮中,中国行动,勇立潮头,不掉队!

5月24日,中国移动在第七届数字中国建设峰会中国移动人工智能生态大会主题论坛上发布了最新自主研发的“九天”千亿多模态基座模型。

凭借自主研发和行业积累,“九天”基座模型堪称“中国最值得信赖、最有知识的行业”。

与其他企业不同,央企的大型模式面向国民经济的支柱产业,目的是为国家基础设施改造赋能,“为产业注入智慧,为国家筑基。”

中国移动不愧为“央企人工智能的领跑者”。

AI聊天对接会,遇到问题独立寻求人类帮助。

GPT-4o发布当天,向大家展示了强大的AI语音助手能力,将电影《她》中的萨曼莎带入现实。

中国移动的现场演示在OpenAI中一点也不输。

九天JIU JIU

第一个“九天99”是定制的个人助理。

两位童鞋向在场的一些人展示了真正的AI助手如何让主人的效率翻倍。

一边是哮天,一边是九九。

我的小弟弟问他的助手哮天,“我有点紧张。我该怎么办?”?

热心的哮天开始推着小弟弟,为他加油。

旁边女生的助手“九九”帮她生成了“三个关于二次函数的初中数学题”,并在后续提问下给出了详细的解题步骤,分分钟得到了初中生的指导。

接下来,99还生成了一张六一儿童节的图片,背景是“九天蓝”。

最后,99完成了一个非常实用的功能:告诉它自己的时间计划,它可以帮助安排日程,比如在日程中加入后天上午9点的会议。

更有甚者,哮天和九九这两个AI助手在现场直接互通电话,满足会议需要,根本没有业主的业务。

九天薛山

另一个出现在演示中的是《九天好学》。

作为基于知识数据和专家指导的产品,可以帮助我们进行专业的行业分析或行业洞察。

而且,如果我们有一个作品需要完善,我们还可以驱动模型和专家对话进行修改。

比如它在写方案的时候遇到了网络运维方面的问题,会主动去请教人类专家。

在两位专家给出建议后,它可以自动进行相关的更新和修改。

九天网络快播出的新剧

《九天网络》向我们展示了一个复杂系统是如何实现全局智能感知的。

在演示过程中,杭州亚运会的场馆和周边地区通过3D技术在孪生数字世界中再现,通信网络的信号覆盖也得到可视化呈现。

基于此,“九天网络”可以感知网络状态、设备状态和用户体验。

全局监测和感知结果也可以以可视化的方式呈现。信号的孔径使各处的网络状态清晰可见。下图中,黄色区域表示信号较好,红色区域表示信号拥堵。你甚至可以在路上跟踪一个人,并从个人用户的角度进行分析。

运维人员在检查设备时可以佩戴ar眼镜,视觉监控能力可以帮助分析设备,并将分析结果直接叠加在运维人员的可视范围内。

此外,远程专家也可以参与指导设备的检修和维护。

numberformatexception怎么读

十亿个参数+多专家架构

以上展示的所有产品和能力都来自于中国移动“九天”千亿多模基础模式的加持。

要实现如此复杂智能的基座模型,需要在模型架构和参数尺度上不断进行技术突破。

从2013年开始,中国移动进行人工智能的自主研发。经过十年的深耕和同领域的不断积累,“九天”模式已经做到了技术领先。

“九天”基座模型采用纯解码、多专家的框架,创新了模型的学习模式——通过结构化数据建模渐进学习。

模型的参数从十亿、百亿一直攀升到最新的一千亿。

为了适应不同的应用场景,九天提供了1.5B、3B、7B、13.9B、100+B等不同参数的型号版本,可以灵活部署在各种设备和平台上。

而且中国移动下一步还在规划更大的训练计划,将数据集规模从5万亿增加到20万亿token,进一步增强模型能力。

如此尖端的结构和庞大的参数,“九天”在国际比赛中的表现可谓出众:

在语音合成领域,2024年INTERSPEECH声码器电路获得世界第一。

视觉评价也很优秀,2023年获得CVPR VSS(视觉语义分割)赛道视觉理解第一名。

根据MME-P列表,“九天”基座模型的生成能力相当于世界第九水平。

除了比赛成绩喜人之外,在各项测试中的测评成绩也很优秀。

“九天”基座模型在大家熟悉的多语言理解MMLU、编码HumanEval和数学GSM8K基准测试中取得了不错的表现。

此外,在中国C-Eval、MBPP、BBH的基础上,基座模型取得了领先优势。

此外,在11个行业领域,中国移动在124个细分类别中测试了基座模式,超过8万次大学考试或职业资格考试。结果如下图所示。

“九天”基座模型在11个领域取得了最高成绩。

在这些会议上的“聪明”表现,以及在竞赛和评比中的骄人成绩,完全配得上其“最懂行业”的定位。

智能复杂系统

作为全栈模式,九天将其能力面向各种复杂行业的需求,提出了“智能复杂系统”的概念,以期为行业“注入智慧”。

大型号的“智能”说起来容易,实现起来却很难,需要克服很多问题和壁垒。

为了实现复杂系统的智能化,中国移动集团首席科学家冯等专家做了大量的工作。

如果说AI是一片大海,现在的智能只是表面。想去深水区,除了一般的推理、生成、推理能力外,还需要对复杂系统的感知、预测、诊断、控制和决策。

大多数复杂系统都是混沌系统。我们如何从微观走向宏观,从混乱走向清晰?

这需要结构化数据。因为在一个复杂的系统中,会有很多设备,很多数据。

此外,还有来自多个来源的数据,让AI看到我看到的,做我做的,听我听到的。

如何将这些信号特征化,并与一般模态数据融合,是复杂系统实现真正AI的关键。

一般来说,复杂系统的智能化需要解决两大问题:一是大而不稳,二是多而不适。

因此,中国移动在“九天”基座模型的研发中使用了很多策略和技术,包括多层信息加固、溯源信息字段的一致性检查、尺寸模型协作等。

这些技术的结合使得“九天”模型变成了一个面向“原子化任务”的agent。

它不仅具有当前前沿大模型的理解、生成和推理能力,还进一步延伸了更“类人”的感知、预测、诊断、控制和决策能力。

从各个行业的微观数据到泛行业模型的宏观生态,从混乱复杂的问题中提炼出清晰简单的解决方案,是“智能复杂系统”的目标。

开放模态源

九天将自己定位为通用“全栈”大模型的原因之一,就是要突破各种模式之间的壁垒,实现复杂大模型系统“全模式”之间的智能推理。

不仅包括语音、语言、视觉等常见模式,还包括结构化数据,让模式的设计更好地匹配各行各业的落地场景。

另一个原因是中国移动在通信领域发挥着主导作用,因此大型模型可以灵活地部署在各种资源和设备上。

目前大模型由于参数过大、设备兼容性低等原因,只能在服务器端或PC端进行推理,而能够在云端提供全面服务的中国移动却不服。

“九天”模型不仅可以部署在常见的移动电子设备和IOT传感设备上,如智能手机、平板电脑、汽车和可穿戴设备,还可以应用于各种复杂的信息源,包括雷达、红外、声波、无线射频等。

这些复杂的信息源虽然人类无法察觉,但对工业生产、通讯、服务等领域的一些支柱产业却非常重要。

对多种来源的强适应性,让“九天”轻松进入各行各业,快速应用。

聚焦重点行业

国内外市场有很多大的型号。为什么只有“九天”敢自称自己最懂行业?

从模型定位、训练数据到AI生态、应用场景,“九天”R&D团队始终不忘“专注行业”的初衷

让最前沿的AI模型服务于骨干行业的技术革新,服务于国家基础设施的智能转型。

因此,“九天”的定位是一个复杂的产业体系,要在政府治理、工业生产、民生服务、通信特色四大领域发挥重要作用,提供基地模式。

“九天”基地模式从培训开始,就与行业紧密挂钩——不仅融合了通信、能源、建筑、交通等八个行业的专业知识,而且占所有培训前数据的10%,超过了所有国内外同行。

此外,对于结构化数据的处理,强调了营销、出行等行业的应用,提升了模型的网络智能实践体验,比传统手段提升10%-15%,解决了大型模型无法精确处理结构化数据的问题。

在视觉理解领域,训练数据包括7000万视频网络和200亿+的图片、文字、视频等行业特征数据,让模型不仅“看得清”、“看得懂”,而且“看得准”。

在“九天”基座模型的基础上,中国移动建立了一套面向全行业的大模型体系和AI生态系统,开发了15个行业大模型。

全力支持独立生态

中国移动作为AI行业的“国家队”选手,站在了AI技术的浪潮之巅,用实际行动展示了自主研发的决心,展现了央企应有的担当。

在研发“九天”模型系统的过程中,R&D团队还致力于实现AI生态在计算能力、芯片、框架、算法等领域的“本土化”。

在芯片层面,“九天”系列大型号解决了一个很大的训练难题——异构芯片之间的切换。

在11家厂商生产的17款不同芯片上,团队完成了适配、迁移、测试、标准比对等一系列工作,从而支持了模型在异构芯片之间的平滑转换和持续训练。

为了加快国内AI产业的发展,中国移动也提出了“100000”智能基地计划,打造“10000万卡计算能力、10000亿美元模型、1000000亿美元平台”。

在计算能力方面,中国移动将建设3个2万卡智能计算中心和12个区域智能计算中心。

目前,呼和浩特建设的超大型单体智能计算中心已超过全球所有运营商,成为央企“十大超级工程”之一。

随着AI的大规模落地,推理计算能力需求激增。中国移动还将对已部署的1500个边缘计算节点进行全面升级,升级训练的计算能力资源比例将达到1:10,即1卡训练,10卡推送。

到年底,全网大型号训练卡将达到10万卡+,规模超过30 EFLOPS。

其次,中国移动将升级计算机网络的新大脑中心,构建数字网络的新保障。

在“百汇平台”上,还将有丰富的大小模型、数据集和AI原生应用,集模型体验、下载、调优、部署、应用、评测等功能于一体,为创业者和开发者提供“一站式”服务平台。

该模型是安全可信的。

“九天”系列大型机型之所以“值得信赖”,不仅体现在支持国产化自主研发,更根植于对机型安全性的高标准、严要求。

为了解决大规模模型在应用中面临的“遗忘”、“错觉”等常见痛点,团队在训练中应用了知识升级整合、持续动态学习等关键技术。

此外,模型还配备了完善的数据安全、系统安全等保障机制,真正做到了安全、可信、可控。龙梅子资料个人

这种对安全的执着追求终于得到了官方认可。

“九天”自然语言交互模型同时通过了“生成式人工智能服务备案”和“国内深度合成服务算法备案”,成为央企研发的首个完成双备案的大模型。

在中国软件评测中心进行的测试中,“九天”模型也获得了最高级别(A级)的安全认证。

十年磨一剑,跨越式发展

一系列优异成绩的背后,是全集团打造“世界级信息服务科技创新公司”、肩负国家科技创新重任的雄心壮志,也是R&D团队锐意进取、力争十年前十的决心。

和中国移动集团首席科学家冯博士是整个人工智能领域的领军人物。

她在2013年9月加入中国移动研究院,也就是那个时候,运营商已经嗅到了AI未来的潜力。

十年来,冯博士带领团队在AI技术的研发上步步为营,稳扎稳打,见证了公司在AI领域“跨越式”发展的全过程。

如今,中国移动成立了“九天”人工智能研究院,引进了2000名专家和150多名AI专业博士,组建了2000人的AI核心团队,开展人工智能基础技术、算法、平台和应用的全栈研发,具备大规模模型数据构建、预训练、微调、推理等全链路技术的自主创新能力。

去年,中国移动先后发布了“九天客服”、“九天海事”、“九天网络”等垂直行业模型,以及面向骨干行业开放的“九天中青基地模型”,发出了央企在大模型领域的响亮声音。

除了发布的产品和机型,中国移动还取得了丰硕的科研成果——独创提出了系统化的AI技术,得到了产学研各界的广泛认可和支持。

获得中国通信研究院科技进步一等奖,申请专利930余项,发表顶级论文160余篇,在约20项大型国际比赛中取得前5名的成绩。

展望未来,正如本次大会的主题“赋能AI,用智慧筑牢国家根基”,中国移动将肩负起AI“国家队”的使命,继续前行,将AI领域最前沿的进展带给千家万户和商家。

未经允许不得转载:科技让生活更美好 » 中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o