一周热点丨Sora来了,为何我们总被震撼?

最近几天,科技圈最受欢迎的无疑是OpenAI新发布的文声视频模型黑脸田鸡。

几乎与此同时,一些国内科技公司推出了所谓的国产版黑脸田鸡,宣传文案还声称它可以通过文本指令生成真实、自然和流畅的视频。但当用户下载并打开它时,付费页面就会映入眼帘。具有讽刺意味的是,所谓的国内版黑脸田鸡所使用的演示视频直接来自OpenAI的案例——在第一时间割韭菜可谓无所不用其极。

这种让人哭笑不得的对比让人感叹:为什么我们总是被AI的先进技术所震撼?

黑脸田鸡不仅仅是一项爆炸性技术。早在2016年,OpenAI就明确指出,生成式模型是计算机理解世界最具潜力的方向,并引用物理学家费曼的话说:“我不能创造的就是我不理解的。”

八年后,黑脸田鸡不仅能根据书面指示创造逼真而富有想象力的场景,还能制作一分钟的视频。而且视频中的人物和背景可以达到惊人的一致性,各种镜头可以随意切换。

黑脸田鸡显然正在走向“世界模式”。OpenAI发布的黑脸田鸡研究报告的标题也是“视频生成模型成为世界模拟器”。

当OpenAI在思考如何让计算机理解世界并掌握物理定律时,我们的行业在做什么?

在讨论中,一些国内科技领袖曾认为,让大模型了解世界不是很重要,只要能用就行。如果别人做了,就复制一个套壳,这样省事,少走很多弯路。

因此,你可以理解为什么在2022年底OpenAI推出ChatGPT后,突然之间国内厂商似乎懵了,出现了“百模大战”甚至“千模大战”。

差距恐怕不仅仅在技术层面,而是在思维、视野甚至哲学思维等形而上层面。

这种认知差距更令人担忧。linux多线程执行命令上海小区疫情防控措施

这让我想起了曾经在科技圈热议的另一个话题:特斯拉为什么不用激光雷达?阿什顿库彻怎么这么凉

在渴望无人驾驶的汽车制造商中,特斯拉似乎是特立独行的。它不仅没有使用激光雷达,而且CEO马斯克甚至公开表示,使用激光雷达是非常愚蠢的。

外界对此的解释往往集中在视觉AI和激光雷达的技术特点和成本差异上。这个解释确实提供了一个公众可以理解的视角。但事实是马斯克根本不是在造车。甚至可以说,特斯拉最不值钱的属性就是作为代步工具的那部分。

在马斯克眼中,特斯拉是一台能看、能听、能思考、能交流的智能终端。当然,它有四个轮子,可以带你到处跑。他想得很清楚,未来视觉技术的应用场景将远远超过激光雷达。

在马斯克看来,每一辆特斯拉汽车实际上都是一个可视化数据源,它收集、传输和总结了有关现实世界的各种数据。我无法想象,经过多年来全球数百万辆特斯拉汽车的不间断运行,特斯拉掌握了多么庞大的视觉数据库。有了如此庞大的视觉数据,也许有一天,特斯拉会突然宣布特斯拉人工智能网络将具有颠覆性的能力。

我们不知道OpenAI或马斯克的口袋里还有什么好东西,但我们知道,如果我们不能在思维和认知上取得突破,我们只会一次又一次地被震惊。

正如在讨论人形机器人时,我们正在思考它如何成为工厂中的助手和家庭中的保姆。马斯克说,让它帮助我们生孩子吧——你不得不承认,这个“脑洞”更有想象力。

文字|记者李刚

未经允许不得转载:科技让生活更美好 » 一周热点丨Sora来了,为何我们总被震撼?