关于 Sora,我有十个小白问题

1.黑脸田鸡吗?你什么意思?这有什么意义吗?

黑脸田鸡在日语中是“天空”的意思,它的引申义是“自由”。

黑脸田鸡简介页面 OpenAI

在黑脸田鸡的官方介绍页面上,你可以看到无数的纸飞机在自由飞翔。他们似乎独立行动,自由探索。如果OpenAI最终能带来AGI(通用人工智能),我们应该抱有希望。

黑脸田鸡是一名人工智能视频模特。输入一串单词就可以生成一个纯AI原创视频。此外,您还可以导入图片并将其转换为视频,然后将其转换为新视频…

仅仅是人工智能生成的视频样本和发布的技术论文,黑脸田鸡就在传播层面引发了一场“地震”。许多人高呼电影和电视行业已经改变了,有些人甚至把美国电影业的象征好莱坞变成了这样:

2.人们把它吹成“爆棚”、“史诗”、“现实不复存在”的依据是什么?

最直观的是,有些样张太真实了——人物的脸没有那么“鬼谷”,物体的轨迹也很自然,画面的清晰度和流畅度都像我们用手中的设备拍摄的:

这和我们用GoPro拍的照片太像了。黑脸田鸡

与竞争产品相比,黑脸田鸡是“灭霸”级别的。过去,主流人工智能生成视频需要4到16秒,而且它们还会被“卡在PPT上”,而黑脸田鸡超越了弯道,直接将时间拉至60秒。后者的画面表现与视频素材库相当,作为空镜放入视频中是完全可行的。

这让人很困惑,只能觉得技术的发展有迹可循,但技术的突破节点很难预测。

3.大家都在吵着说行业在变,人类在下岗。除了第一眼看上去很棒之外,扮演黑脸田鸡还有哪些令人惊叹的方法?

多座位:

黑脸田鸡一代植物大战僵尸跳跳僵尸怎么打

两个完全不相关的场景的自然融合:

黑脸田鸡一代

视频也可以向前和向后延伸;如果你对视频中的部分(如背景)不满意,直接替换就可以了。

黑脸田鸡还可以直接从文本中创建图片,甚至将图片转换为动态视频,而且它不是流行的“小动物舞蹈”的粗糙效果:

蜜雪冰城什么梗

黑脸田鸡一代

4.输入《三体》可以直接输出电影吗?

我知道你很着急,但先别着急。

首先,就《黑脸田鸡》而言,尽管它具有多摄像机效果,但它是单个情节和单个镜头。

《三体》拥有多人视角和复杂的叙事。依靠AI生成一站式流程是不现实的。据一些影视行业从业者表示,目前AI生成虽然高效,但可控性不够。目前主要应用于demo制作、概念设计、镜头编排等环节。

5.看到这里你有大胆的想法吗?

停下来。白云机场 董事长

OpenAI正在评估黑脸田鸡被滥用的风险,因此目前不对公众开放,仅面向误导性信息、仇恨内容和偏见领域的一批专家和创意人员。

6.每次出现技术狂潮,农民工都是第一个焦虑的人。这次我们该怎么办?

记住,那些贩卖焦虑的人都是为了赚你的钱。虽然黑脸田鸡还没有公开测试,但一些人已经开始出售付费教程。

目前,黑脸田鸡也发生了“翻车”。如果这能安慰你的话,黑脸田鸡?

AI技术推陈出新的速度太快了。你只是在鼠兔学习了几个月。结果,“灭霸”黑脸田鸡出现了,积累的工具经验可能会在瞬间失效…既然如此,为什么不沉迷于研究工具,在底层创作上多加练习呢?

7.我害怕被取代,我也害怕人工智能变得更加黑箱化。

继文本(GPT系列)和肖像(DALL E)之后,openAI这次在视频领域“遥遥领先”…但这家以AI安全为初心的公司,在技术披露方面越来越不开放,有人戏称其为“ClosedAI”。

此次黑脸田鸡发布会上,OpenAI现任首席执行官萨姆·奥特曼在X平台上“在线接单”,帮助网民制作视频。结果有人给了这样的暗示,你猜怎么着,山姆把他拉黑了。

8.未来真的分不清现实和AI一代吗?

目前,有人让Gemini 1.5观看并分析了以下黑脸田鸡制作的视频,Gemini指出:

黑脸田鸡一代

因此,AI判定这不是真实的图像。你必须使用魔法来打败魔法!

9.你为什么做OpenAI?

因为OpenAI有GPT和达尔·E的成功经验,他们在之前的技术范式基础上做出了新的东西:他们不仅可以理解用户在提示中提出的需求,还可以理解它们在物理世界中的存在。

生成视频的效果如此之好,而且由于黑脸田鸡可以更好地理解用户给出的提示,OpenAI是如何做到的呢?根据官方声明,他们使用DALL E 3的重新字幕功能为训练视频材料添加了高质量的文本描述,表明这可以提高输出视频的整体质量。此外,您给出的简短描述符将在AI收到后进一步扩展,然后提交给黑脸田鸡进行生成。

更重要的是,黑脸田鸡是一个扩散变压器,已被证明在语言建模、计算机视觉和图像生成方面具有出色的性能。

10.视频模型的训练计算量非常大。OpenAI买得起吗?

大约一周前,萨姆·奥特曼宣布OpenAI启动“造芯”计划,因为目前OpenAI每天生成约1000亿个单词,需要大量GPU(图形处理器)芯片进行训练和计算。

他希望筹集7万亿美元。

不溅

这个天文数字不仅相当于全球GDP的10%,而且相当于2.5个微软、3.75个谷歌、4个英伟达、7个Meta和11.5个特斯拉的市值。

加工:麦芽

编辑:睡虫

未经允许不得转载:科技让生活更美好 » 关于 Sora,我有十个小白问题