谷歌“复仇”OpenAI:万亿参数大模型性能碾压GPT-4,语言理解首超人类

出品|搜狐科技

作者|梁昌俊

在过去的一年里,被OpenAI连续挂机的Google开始了“复仇”。今天凌晨,谷歌正式发布了其人工智能模型Gemini,声称将彻底碾压GPT-4。

“Gemini是我们迄今为止最强大、最通用的型号,它在许多领先的基准测试中表现出了最先进的性能。”谷歌首席执行官桑德尔·皮帅说。

根据谷歌给出的基准测试结果,Gemini在多项测试中完全击败了OpenAI的GPT-4。可以说双子座是唯一一个宣称全面超越GPT-4的大型型号。

这也意味着,虽然大机型的热度有所降温,但科技巨头围绕大机型的技术竞争仍在继续。在谷歌的不断追赶和Meta开源联盟的围堵下,OpenAI-微软联盟也面临着越来越大的压力。vcf格式是什么

万亿参数,30多项性能测试超过GPT-4。

这是谷歌半年多努力的结果。今年4月,谷歌合并了两个内部团队Google Brain和DeepMind,共同应对双子座。DeepMind的联合创始人兼首席执行官戴密斯·哈萨比斯成为双子座团队的领导者,并与谷歌搜索和其他团队合作。

Gemini定义为多模态模型,能够归纳并流畅地理解、操纵和组合不同类型的信息,包括文本、代码、音频、图像和视频。公开资料显示,双子座拥有万亿参数,计算能力高达1e26 FLOPS,是GPT-4的5倍多,总数据集是GPT-4的2倍。

谷歌Gemini有三个不同的版本:Gemini Ultra、Gemini Pro和Gemini Nano。这些模型适用于不同的场景。Gemini Ultra用于处理高度复杂的任务,Gemini Pro用于扩展各种任务,Gemini Nano可用于手机等终端设备。

哈萨比斯表示,这是AI发展的重要里程碑,标志着谷歌新时代的开始。同时,Gemini是谷歌迄今为止最灵活的模型,可以在所有设备上高效运行,从数据中心到移动设备。

根据谷歌公布的测试结果,从对自然图像、音视频的理解到数学推理,在大规模语言模型(LLM)研发中广泛使用的32项学术基准中,Gemini Ultra的性能已经超过了目前最先进的水平。

在MMLU的大规模多任务语言理解测试中,Gemini Ultra以90.0%的高分首次超越人类专家,GPT-4以86.4%的得分率超越人类专家。在推理、数学和代码等许多核心能力的基准测试中,Gemini Ultra高于GPT-4。

MMLU是由美国俄亥俄州立大学等机构的研究人员联合推出的大规模、多学科、多模态的理解与推理基准测试。它采用数学、物理、历史、法律、医学、伦理学等57个科目测试大模型的世界知识和解题能力。

此外,Gemini Ultra在图像等多模态基准测试中的表现优于GPT-4。在MMMU基准测试中,Gemini Ultra image的得分率为59.4%,高于GPT-4V (56.8%),其他五项测试也高于GPT-4V。同时,在大多数视频和音频的基准测试中,它也超过了GPT-4V。

Hasabis认为,这些基准突出了Gemini最初的多模态特性,并显示了它在更复杂的推理方面的潜力。“它具有通过阅读、过滤和理解信息从数十万份文件中提取意见的卓越能力,这将有助于在从科学到金融的许多领域以数字速度实现新的突破。”

目前业界创建多模态模型的标准方法是分别训练不同的模态组件,然后拼接在一起粗略模拟一些功能。这些模型有时可以很好地完成描述图像等特定任务,但在更概念性和复杂的推理方面却无能为力,这也是目前许多追逐GPT-4的模型面临的技术挑战。

正因如此,Google将Gemini设计为原生多模态,从一开始就在不同的模态上对其进行预训练,然后用额外的多模态数据对其进行微调,进一步提高其有效性,这也是Gemini优于现有多模态模型的关键点。

谷歌还发布了其迄今为止最强大、最高效和可扩展的TPU系统云TPU v5p。在过去的几年里,谷歌虽然依赖英伟达芯片,但仍在继续开发以TPU为核心的自有AI芯片。随着新计算系统的发布,它将能够更快地训练下一代大模型,并更快地推出新产品和新功能。

此外,在AI安全方面,谷歌表示,Gemini也进行了全面的安全评估,研究了网络攻击、说服力和自主性等潜在风险领域,并在对抗测试和内容安全方面采用了基准测试和过滤方法来应对关键的安全问题。三星b5310手机

谷歌开启“复仇”,OpenAI和微软联盟承压。

双子星座的推出是谷歌真正的报复。

在今年的大模大赛中,谷歌屡遭外界诟病,其技术和产品进步被OpenAI挂了很久。Bard是第一个匆忙对ChatGPT发起收购的公司,由于演示延期,其市值损失了1000亿美元。

后来,在5月的I/O大会上,谷歌宣布推出PaLM 2,这是一款用于基准测试GPT-4的大型型号,但透露研究重点正在转向双子座。显然PaLM 2更多的是试水,双子才是真正的杀手锏。

在AI领域有着长期投入的谷歌,也不愿意错过这一变化。正如皮查伊所说,ai将是最深远的变革,其影响力远远超过移动技术或互联网。

他认为,AI有潜力为全世界人民创造机会,这将带来新一轮的创新和经济进步,并以前所未有的规模促进知识、学习、创造力和生产力的发展。

双子座团队的领导者哈萨比斯也是AI的信徒,将AI视为毕生工作的重心。他是一个年轻的天才。他16岁进入剑桥大学。2010年,他联合创立了DeepMind。被谷歌收购后,他进入谷歌,领导推出了打败人类的围棋机器人AlphaGo。

“从十几岁时为计算机游戏编写AI程序,到多年来作为神经科学研究人员试图理解大脑的工作原理,我一直相信,如果可以制造出更智能的机器,我们就可以用这些机器以不可思议的方式造福人类。”哈萨比斯表示,AI将不再仅仅是一个智能软件,它将更加有用和直观,就像一个专业的助手或助手,Gemini的推出离这一愿景又近了一步。

为此,谷歌将推出广泛的双子星登陆计划。谷歌聊天机器人Bard将使用微调版Gemini Pro进行更高级的推理、规划和理解,这是Bard推出后最大的升级,将在170多个国家和地区提供英语服务,未来将扩展不同模式,支持更多语言和地区。315晚会几点钟开始?哪个台

谷歌也会在手机硬件上安装Gemini,手机模式正在成为行业趋势。Pixel 8 Pro将是首款搭载Gemini Nano的智能手机,将拥有记录应用汇总等新功能,Gboard将推出智能回复功能,WhatsApp将从明年开始推出更多信息应用。

此外,谷歌表示,在未来几个月,Gemini将被应用于更多的产品和服务,如搜索、广告、Chrome和Duet AI。目前Google已经开始在搜索方面测试Gemini,带来了更快的搜索生成体验。美国用户英文搜索的延迟降低了40%,质量也有所提升。

除了内部产品,谷歌还向开发者开放Gemini的功能。从12月13日开始,开发者和企业客户可以通过Gemini API获得Gemini Pro,Android开发者可以通过AICore使用Gemini Nano。性能最强的Gemini Ultra还在进行大规模的信任和安全检查,将于明年初开放使用。

随着Google Gemini的推出,压力也来到了OpenAI。在过去的一年里,OpenAI相继推出了GPT-4和GPT-4Turbo等大型模型,并在此前推出了名为GPTs的服务和GPT商店等商业布局。虽然此前持续数天的内部“政变”以萨姆·奥特曼回归而告终,但也给OpenAI的未来发展蒙上了一层阴影。

与OpenAI结盟的微软继续推进新机型的落地。本周早些时候,微软正式庆祝了人工智能助手Copilot诞生一周年,并宣布了即将推出的新功能,包括支持GPT-4 Turbo,更新DALL-E 3模型,添加新的代码解释器功能,以及Bing内的深度搜索功能。

谷歌双子星的推出将在技术上超越OpenAI-微软联盟,这可能会吸引更多的用户。与OpenAI相比,Google拥有更多的全球用户,尤其是手机等硬件终端用户,拥有海量的实时数据,具有整体生态优势,而OpenAI仍然更依赖微软。

OpenAI和微软越来越面临开源联盟的压力。Meta、IBM、AMD、Intel等50多家公司和研究机构本周宣布成立人工智能联盟,推动AI开放。该联盟排除了OpenAI、微软、英伟达等。大部分成员支持开源大模型,因此也被视为Meta领导的开源对闭源OpenAI的集体封杀。

目前来看,微软和谷歌在大模式上的投入并没有为其带来明显的业绩贡献,但技术竞争和商业布局仍将是这几家巨头之间的无限追逐博弈。

未经允许不得转载:科技让生活更美好 » 谷歌“复仇”OpenAI:万亿参数大模型性能碾压GPT-4,语言理解首超人类