真自主!龙芯3A6000深入揭秘:最强大的不是跑分 是这些

快科技报道:2023年11月28日,北京国家会议中心,以“中流击水”为主题的龙芯产品发布暨用户大会隆重上演。

在4000多家合作伙伴、权威媒体、专家学者、主管部门领导的见证下,新一代通用处理器龙芯3A6000、打印机主控芯片龙芯2P0500发布,围绕龙芯3A6000的多款整机产品亮相。公布了龙芯处理器核心IP和龙芯自主指令系统架构的授权计划。

如果多年后再回头看半导体国产化的道路,这无疑是一个关键时刻。

革命性的开幕式

“龙芯之母”黄灵仪院士今年4月离开了我们,大屏幕上播放的她那一段段豪言壮语令人动容。

1。龙芯3A6000:硬件性能飞跃基本完成

龙芯中科董事长胡发表主题演讲《将独立进行到底》,大会主题“中流击水”代表龙芯已经到了关键时刻,正在进行第二次转型,从政策导向型市场向开放型市场转型。

龙芯3A6000处理器由龙芯中科基于独立的LoongArch龙芯架构指令集设计,性能卓越,是我国独立桌面处理器设计的又一里程碑。

龙芯3A6000龙芯第四代微架构LA64的首款产品,采用自主成熟技术制造,拥有四个物理核心,支持同步多线程技术(SMT2),因此拥有八个逻辑核心,主频2.5GHz。

内存依然是双通道DDR4-3200,安全方面集成了可信模块,支持安全启动方案和SM2、SM3、SM4国密算法。

龙芯微架构已经进化了四代。第一代GS464用于龙芯3A1000和龙芯3B1500,第二代GS464E用于龙芯3A2000和龙芯33000,第三代GS464V/LA464用于龙芯3A4000和龙芯3A5000。

可以看出每一代微架构对应两代产品,架构和工艺交替升级的整体策略与英特尔的Tick-Tock策略非常相似。

第四代微架构LA664提升了所有指标,尤其是首次从4提升到6。同时在ROB、定点/向量物理寄存器、启动队列、功能组件、加载/存储队列等多项指标上实现了50%到100%的提升。

在这一代架构中,龙芯终于突破了同时多线程技术,赶上了Intel和AMD,从官方数据或者实测来看效率都相当高。

你已经看到了很多关于性能的数据。根据中国电子技术标准化研究院西塞实验室的测试结果,龙芯3A6000 SPEC CPU 2006、SPEC CPU 2017、Stream、Unixbench的测试成绩都很优秀。无论是单核性能还是多核性能,整数性能还是浮点性能都实现了很大的飞跃,甚至远远超过了Intel和AMD几代产品的提升。

综合测试结果,龙芯3A6000处理器整体性能基本相当于英特尔2020年上市的第十代酷睿i3-10100四核处理器。

要知道,很多用户还在89代酷睿的配置上。

胡强调,经过多年的“补课”,龙芯3A6000终于基本完成了这个任务,与当今主流处理器的差距基本被填补。

要知道,2002年的龙芯1号比当时主流的奔腾4差了20多倍。

2021年的龙芯3A5000已经把这个差距缩小到不到一倍,相当于三代酷睿i3四核,而仅仅两年之后,我们几乎完全赶上了!

龙芯3A6000只是一个全新微架构的第一站。未来一两年,我们还将看到面向服务器的龙芯3C6000、龙芯3D6000、龙芯3E6000,分别支持16核32线程、32核64线程和64核128线程,无论单核性能还是多核性能,都大大缩小了与世界领先产品的差距。

对于移动端,下一步将是龙芯2K3000。微观架构不一样。采用LA364,当然也是独立的LoongArch dragon架构指令集,最多8核8线程。

目前已经设计出龙芯3C6000,单芯片16核,内存四通道DDR4-3200,扩展连接64 PCIe 4.0,实现了数倍甚至数量级的提升。

虽然与世界最先进的12通道DDR5和128 PCIe 5.0还有代沟,但不是不可逾越的鸿沟。

龙芯相干链路集成两个或四个龙芯3C6000,可以得到龙芯3D6000和3E6000。

这是支持小芯片管芯设计的关键技术,可以对标Intel CXL、NVIDIA NVLink、AMD Infinity Fabric等先进的互连技术,相比传统的PCIe总线可以大大提高效率,降低延迟。

同时,龙链技术支持缓存一致性协议传输,可以保证CPU与GPU、CPU与GPGPU、GPGPU与GPGPU的高速稳定互联,完全扩展。

最重要的是这一切都是基于龙芯自主研发的物理接口,在标准化、性能效率、可扩展性、升级性等方面都可以自主掌握。

面向笔记本和云终端的新一代龙芯2K3000已经完成了前端设计,未来还有很多工作要做,包括内核、后端和外围。

最多能做到8核,单核性能堪比上一代台式机龙芯3A6000。它集成了自主研发的密码模块,支持PCIe 4.0、SATA 3、USB 3、HDMI等丰富的扩展和输入输出。

最关键的是,它将集成新一代自研LG200 GPGPU核心,不仅可以用于图形渲染,还可以加速计算和AI。这是一个统一高效的新架构。

LG 200作为龙芯研发的第二代图形核心,突破了GPGPU的关键技术。图形渲染支持OpenGL 4.0,通用计算支持OpenCL 3.0,AI加速支持INT8整数张量加速。

它还支持多节点互联,结合龙链技术,未来将有一个专用的独立的相同架构的GPGPU芯片!

路线图上还排列了服务器级龙芯3D7000和龙芯3E7000,桌面级龙芯3B6000和龙芯3b 7000,它们都将是LA664微架构的升级版本。

责任编辑:Q以上

未经允许不得转载:科技让生活更美好 » 真自主!龙芯3A6000深入揭秘:最强大的不是跑分 是这些