谷歌发言人承认：Gemini AI 演示视频内容和语音提示均非实时录制-科技让生活更美好

12月9日，据彭博报道，汤姆& aposHardware等外媒当地时间周五报道，谷歌发言人在接受采访时承认，谷歌前段时间发布的大语言模型Gemini的演示视频并不是实时录制的。

乍一看，在这个镜对镜的视频中，双子模型可以找到藏在指定塑料杯中的纸团，或者看到一张“点连线”的图片是一只螃蟹。然而，谷歌发言人告诉彭博，这个演示视频是通过使用镜头中的静态图像帧和文本提示“拼凑”而成的，Gemini只能对输入提示和静态图像做出响应。同样，视频中用户与双子的语音交互也是通过后期配音来完成的。

html代码

至于视频中人物的说话、绘画、展示物品甚至魔法，似乎只是为了演示视频而特意安排的。在谷歌的YouTube官方频道中，谷歌还添加了“为了演示的目的，减少了延迟，将Gemini的输出缩短为简洁”的描述。这意味着双子座的响应时间实际上比视频呈现要长。

此外，谷歌DeepMind的研究副总裁兼深度学习负责人Oriol Vinyals进一步解释了这个视频:这个视频展示了用Gemini构建的多模态用户体验的“可能的样子”，目的是为了启发开发者。它声称，视频中所有的用户提示和输出都是真实的，为了简洁起见，已经被缩短。而且视频中显示的型号是Gemini Ultra。柯达M550储存卡

根据IT之家此前的报道，谷歌声称Gemini Ultra的性能在32个广泛使用的学术基准中的30个中表现出了超越当前时代的“先进成果”，而这些基准也是LLM领域最常用和最广泛使用的测试。万科集团财务报表分析数据是采用四舍五入?

其中在MMLU(大规模多任务语言理解)中以90.0%的成绩成为首个超越人类专家的模型(该测试综合了数学、物理、历史、法律、医学、伦理学等57个学科)。

Gemini Ultra在新的MMMU基准测试中也表现出59.4%的领先性能，该测试涵盖了“需要考虑的”不同领域的多模态任务。

明年初，谷歌还将推出一款全新升级的Bard Advanced，让用户可以更好地体验其最佳模式和功能，即Gemini Ultra。

未经允许不得转载：科技让生活更美好 » 谷歌发言人承认：Gemini AI 演示视频内容和语音提示均非实时录制

谷歌发言人承认：Gemini AI 演示视频内容和语音提示均非实时录制

作者：pu

相关推荐