在2024年台北国际电脑展期间,我们有幸采访了AMD消费级处理器高级技术营销经理DonnyWoligroski,讨论了该公司在展会上发布的Zen5Ryzen9000的最新消息。Woligroski告诉我们,虽然Ryzen9000在游戏方面不会击败该公司现有的专用Ryzen7000X3D(它们目前是游戏领域最好的CPU之一),但这两款之间的差距将比我们过去看到的更小。AMD还在开发其3DV-Cache技术的改进版本,Woligroski解释了为什么新的Ryzen9000标志着向前迈出了一大步,尽管它们的核心数量和升压频率与前代产品相同。
AMD在新闻稿中将旗舰Ryzen9950X标榜为“全球最快的消费级台式机性能”,但值得注意的是,它并没有声称它是市场上最快的游戏,尽管其基准测试显示9950X在游戏方面平均比英特尔旗舰Corei9-14900K高出约11%。不过,该公司并没有将其与自己的Ryzen77800X3D进行比较,后者在我们的CPU基准测试中游戏性能名列前茅。
我问沃利格罗斯基9950X是否会成为市场上最快的游戏。“它是游戏中最快的吗?在我们的测试中,它比竞争对手快。X3D仍然是王者,但差距比X3D和非X3D之间的差距要小得多,”沃利格罗斯基回答道。“所以7800X3D确实会比9700X快,但可能没有你想象的那么快。”
这不是我们第一次看到AMD的专用、超强大的X3D游戏保持领先于新一代AMD:在我们的测试中,尽管拥有较新的Zen4架构,但最快的Ryzen7000Ryzen97950X落后于上一代Zen3Ryzen75800X3D约8%。直到一年后推出新款Ryzen77800X3D,AMD才打破了自己的记录。
沃利格罗斯基指出,这次X3D和非X3D之间的差距更小,这一改进可能得益于Zen5令人印象深刻的16%IPC增益、更快的L1和L2缓存以及更好的升压频率。我们还将看到Ryzen9000在生产力工作负载方面的表现比X3D快得多。Ryzen
77800X3D的第二代3DV-Cache将游戏性能提升到了一个全新的水平——它在游戏速度上比最快的标准Ryzen7000处理器快约30%。我们必须等待我们自己的测试才能看到新型号的效果如何,但AMD显然已经为其为X3D提供动力的新型3DV-Cache引擎制定了计划。
尽管标准Ryzen型号将比以往任何时候都更接近上一代X3D,但Woligroski还透露,其X3D上的下一代3DV-Cache实现也将有显著改进。
“说到X3D,我现在就不多说了,我们非常致力于X3D。事实上,我们即将推出一些非常非常酷的X3D更新。所以我们正在努力迭代,而不仅仅是重新开发它,”Woligroski说。
我们尚不清楚细节,但AMD可以采取多种措施来改进3DV-Cache。例如,两代以来,AMD的L3缓存都使用了密度优化的7nm节点版本。转向更新的工艺节点,比如6nm甚至5nm,可以让AMD塞入更多的L3缓存容量。
L3组还位于CPU顶部,这带来了散热问题,导致某些标准生产力工作负载的性能下降。更新、更薄的设计可以让公司降低L3组的散热开销,从而使X3D在标准工作中的表现更像常规的非X3D型号。
如果AMD解决了散热限制问题,它还可以将L3组放在两个CPU上。目前的12核7900X3D和16核7950X3D仅在两个CCD组中的一个上堆叠了缓存。这允许另一个组达到更高的加速时钟,但在保持更高时钟的同时将增加的缓存加倍可能会更好。当然,成本将是决定性因素,因为X3D技术确实价格不菲。
AMD的第二代3DV-Cache在第一代的基础上进行了改进,将L3组的数据吞吐量从2TB/s提高到了2.5TB/s,但它仍然使用了与上一代相同的混合键合方法和9微米TSV间距。间距非常重要,因为它衡量了将L3组连接到CPU的TSV的密度,而采用更小的间距(台积电目前提供6微米SoIC-X间距)可以让AMD将更多的连接塞进同样的面积,从而更大幅度地提高带宽和性能。AMD
还可以在组上包含一个额外的L2缓存,但考虑到当今的技术水平,目前尚不清楚这是否可行。我最近与AMD高级副总裁、AMD公司院士兼产品技术架构师SamNaffziger进行了交谈,询问AMD是否考虑堆叠L1和L2缓存。
“当然,如果你能实现更精细的3D互连,那么就完全可以了。因此,我们目前采用的是9微米硅通孔(TSV)间距。随着间距减小到6、3、2微米甚至更低,分区级别可以变得更加精细,”Nafzigger说道。(值得注意的是,他没有定义L2缓存所需的具体间距,因此目前尚不清楚这是否可行。)AMD甚至正在考虑为添加更大的CPU寄存器文件,但Naffziger表示,当今的混合键间距无法支持所需的带宽(不过,该技术已列入imec和代工厂路线图)。