英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?

老黄又来掀桌子了!

在今天上午的2023全球超级计算大会(SC2023)上,英伟达推出了全新的GPUH200

作为上一代H100的升级版,老黄干脆不装了,在官网单方面称H200为“/s2/]世界最强”。

但更美好的是,没有人会质疑他们违反广告法,因为在AI时代,对手只能看着英伟达的尾灯。

根据Nvidia官方披露的数据,H200最强的特点是大模型推理性能

以700亿参数的LLama2模型为例,H200的推理速度几乎是上一代H100的两倍,能耗也降低了一半。

能取得如此强劲的成绩,自然是H200的硬件。

参数方面,H200的主要改进是将上一代“G皇”H100的显存从80GB提升到141GB ,带宽从3.35TB/s提升到4.8 TB/s

这些进步主要归功于HBM3e内存技术

今年8月,SK海力士推出HBM3e后,号称单个带宽可达1.15TB/s,相当于一秒钟传输230部FHD高清电影(每部容量为5G)。

SK海力士正式公布HBM3e后不久,包括三星、美光在内的内存厂商纷纷跟进这项技术。

这个HBM3e其实是大家之前用的HBM3的升级版。

说白了就是性能更高,带宽更高。好处是芯片可以更快的速度传输数据,同时降低功耗。

非常适合AI 和大数据应用

于是英伟达第一次找到SK海力士合作。

所以我们可以看到H200用这个新技术没多久。

相比技术升级,H200和H100都是基于NVIDIA Hopper架构。

所以两个芯片是可以互相兼容的,那些填充H100的企业可以直接更换,不需要调整。

不过,乍一看似乎是王的轰炸,但实际上H200可能只是H100 的“中期改款”。

因为我们发现,H100和H200如果只谈峰值计算能力,其实是一模一样的。

真正提高的参数只有内存和带宽。

此前,常用于判断AI芯片性能的一个重要参数:训练能力。

H200相比H100 的提升也是不明显

根据英伟达给出的数据,在GPT-3 175B模型的训练中,H200只比H100强10%。

根据世通的说法,这次行动大概率是故意的

之前各大厂商都在忙着打造自己的大模型,对GPU最大的需求无疑是训练,所以大家当时的需求都是提高训练能力。

如今随着AI大语言模型的不断应用,训练模型在厂商眼里可能已经是牛太太了,只是大家都失去了推理的速度。

所以这次H200大概故意忽略了“算力”的升级,转而推理

不得不说老黄的刀法还是很准的。

当然这也是英伟达工程师给老黄挤牙膏的能力。谁让人家显卡真的遥遥领先呢?

即使是小幅度的提升,H200也确实配得上“世界最强”的称号。

而且根据锐捷金融集团的估算,H100芯片的价格在25000-40000美元之间,而增加的H200只会高于这个

现在亚马逊、谷歌、微软、甲骨文等大公司的云部门都交钱在明年H200排队发货了。

毕竟没有几千个GPU哪个大机型能升级?

我只能说这一波老黄又麻了。

但问题是,涨价永远不是AI芯片的问题。

今年创业公司,大厂,政府机关等。都还在分期抢一个H100,不用担心明年H200的销量

“人和狗都在买显卡。”去年说完这句话的马斯克,不得不转头加入“抢卡大军”。

更夸张的是,NVIDIA还表示H200的推出不会影响H100的扩张计划。

也就是说,英伟达明年依然计划销售200万H100芯片,从侧面也可以看出AI芯片有多少是不卖的。

然而,面对饥渴的全球市场,英伟达其实有点不知所措。。

作为AI革命的第一枪,OpenAI这样的人很惨,因为GPU不够用。

比如因为计算能力不够,他们的GPT被各种吐槽API卡住,速度慢;

因为算力不够,GPT再强的语境能力,也永远无法普及到全体员工;

因为计算能力不够,GPT无法向客户出售更多专有定制机型。。。

就连OpenAI的创始人奥特曼也几次出来炮轰计算能力不足。

为了解决这个问题,OpenAI也想了很多办法。

比如自研AI芯片,与英伟达等厂商更紧密的合作,供应商多元化。

上月初,有消息称OpenAI已经在寻找收购目标。

此外,特斯拉在7月份推出了由定制的人工智能芯片D1建造的Dojo超级计算机,以训练自动驾驶系统。

当时摩根士丹利直接爆了一份研究报告说:特斯拉比英伟达A100 节省了65亿美元。

当然,这并不意味着马斯克自研的AI芯片就比A100好。

但正因为自研芯片只需要做好自己的工作,更符合自己的需求,不存在计算能力的浪费。

就像英伟达的芯片是大杂烩,谁来吃都能吃饱;虽然自主研发的芯片只是一小碗菜,但是可以根据个人口味制作。虽然做的少,但是更有食欲。

其他大厂也没闲着,比如微软自研“雅典娜”,年初谷歌自研芯片突破。。

但我们前面说过,这款H200其实只是“中期改款”,不足以打消其他厂商的顾虑。

根据英伟达自己发布的消息,大的是明年要来的B100。从图来看,它至少是指数级提升的

因此,史超认为每个人都忙碌了很长时间。在硬实力面前,恐怕黄师傅的地位会越来越稳固。

你看,即使Meta早在2021年就意识到自己什么都做不了,比不上NVIDIA的 GPU 性能,然后转身下了老黄几十亿的订单(Meta最近好像有点自研的头脑)。

还记得老黄刚刚宣布英伟达是“AI时代的TSMC”的时候,很多人都是冷嘲热讽的。

结果现在才发现,这句话其实是老黄的一句谦虚话。

毕竟,2022年,TSMC“仅”占全球晶圆代工产能的60%,而英伟达现在已经占据了超过80%的可用于机器学习的图形处理器市场。

总觉得等老黄的大招真的来了,这些大厂的芯片自研项目可能又要夭折了。。。

作者:八戒编辑:姜姜&;顶线盖[/s2/]:环燕

未经允许不得转载:科技让生活更美好 » 英伟达又出新显卡,老黄是想毁了大厂们的自研梦吗?