谷歌发言人承认:Gemini AI 演示视频内容和语音提示均非实时录制

12月9日,据彭博报道,汤姆& aposHardware等外媒当地时间周五报道,谷歌发言人在接受采访时承认,谷歌前段时间发布的大语言模型Gemini的演示视频并不是实时录制的。

乍一看,在这个镜对镜的视频中,双子模型可以找到藏在指定塑料杯中的纸团,或者看到一张“点连线”的图片是一只螃蟹。然而,谷歌发言人告诉彭博,这个演示视频是通过使用镜头中的静态图像帧和文本提示“拼凑”而成的,Gemini只能对输入提示和静态图像做出响应。同样,视频中用户与双子的语音交互也是通过后期配音来完成的。

html代码

至于视频中人物的说话、绘画、展示物品甚至魔法,似乎只是为了演示视频而特意安排的。在谷歌的YouTube官方频道中,谷歌还添加了“为了演示的目的,减少了延迟,将Gemini的输出缩短为简洁”的描述。这意味着双子座的响应时间实际上比视频呈现要长。

此外,谷歌DeepMind的研究副总裁兼深度学习负责人Oriol Vinyals进一步解释了这个视频:这个视频展示了用Gemini构建的多模态用户体验的“可能的样子”,目的是为了启发开发者。它声称,视频中所有的用户提示和输出都是真实的,为了简洁起见,已经被缩短。而且视频中显示的型号是Gemini Ultra。柯达M550储存卡

根据IT之家此前的报道,谷歌声称Gemini Ultra的性能在32个广泛使用的学术基准中的30个中表现出了超越当前时代的“先进成果”,而这些基准也是LLM领域最常用和最广泛使用的测试。万科集团财务报表分析数据是采用四舍五入?

其中在MMLU(大规模多任务语言理解)中以90.0%的成绩成为首个超越人类专家的模型(该测试综合了数学、物理、历史、法律、医学、伦理学等57个学科)。

Gemini Ultra在新的MMMU基准测试中也表现出59.4%的领先性能,该测试涵盖了“需要考虑的”不同领域的多模态任务。

明年初,谷歌还将推出一款全新升级的Bard Advanced,让用户可以更好地体验其最佳模式和功能,即Gemini Ultra。

未经允许不得转载:科技让生活更美好 » 谷歌发言人承认:Gemini AI 演示视频内容和语音提示均非实时录制