人工智能计算器 v 200版-AMD对Zen4c内核的详细分析:CCD、192核
新闻①:Zen 4c单个CCD拥有翻倍的核心和L2缓存,等量的L3,但面积仅比Zen 4大10%
AMD会在本月中旬推出采用Zen 4c内核代号为Bergamo的EPYC处理器,最多拥有128个核心,它是针对计算密集应用进行优化的,和现在已经发布的EPYC Genoa相比拥有更高的吞吐量,它针对的是使用HBM的Xeon处理器,以及来自苹果、亚马逊和Google的更多核心数量的ARM服务器产品。
EPYC Bergamo所用的Zen 4c架构使用与Zen 4相同的ISA,但本质上是Zen 4内核的低功耗精简版,拥有更高的能耗比,Zen 4c核心大小远小于常规的Zen 4内核,这使得Zen 4c的单个CCD能拥有16个核心,而Zen 4的CCD只有8个核心。
SemianAlysis对Zen 4c内核进行了详细的分析,它和Zen 4同样采用台积电5nm工艺,Zen 4c单个CCD内拥有两个CCX,每个CCX拥有8个内核和16MB L3缓存,每个内核的L1和L2缓存与Zen 4是一样的,也就是每个核心拥有32KB的L1数据和指令缓存,1MB的L2缓存。
AMD将会在6月中旬推出128核的EPYC 9754和112核的EPYC 9734,核心数量较EPYC Genoa最顶级的EPYC 9654多出32个,TDP同样维持在360W,最高可提升至400W人工智能计算器 v 200版,当然了频率会低一些,基础频率从2.4GHz降低到2.25GHz,最高频率从3.7GHz降低至3.1GHz,总L3缓存从384MB降低到256MB。
EPYC Bergamo最多只有8个CCD,而EPYC Genoa最多拥有12个,两者的IOD是一样的,肯定有人在想AMD会不会做一个12个CCD、192核的产品?看上去好像可行,但实际上并不能,IOD上确实有12条GMI3链路,在Genoa上,远离IOD的CCD的GMI3布线在较近的CCD L3缓存区域下方通过,但在Bergamo上就很困难了,因为Zen 4c CCD上L3缓存一分为二,这样走线的空间就少了许多,必须使用多层布线才能从较近的CCD L3缓存下方通过。
从图片上就能看出,EPYC Genoa每组三个CCD是并排放在一起的,但EPYC Bergamo两个CCD之间有一定空隙,而且两组CCD之间是要留给PCI-E布线的,上下的PCB空间则要留给DDR5走线,所以现有的封装并不能容纳12个Zen 4c CCD。
上图是Zen 4 CCD和Zen 4c CCD的透视图,可见内部两个8核CCX是并列在一起的,每个都有16MB的L3缓存,而且L3缓存没有拥有3D V-Cache的硅通孔阵列,所以节省了一部分空间。在ISSCC 2023上,AMD透露Zen 4的CCD面积是66.3mm2,而Zen 4c的CCD设计面积只有72.7mm2,只增大了不到10%,要知道这里面其实是有翻倍的核心和L2缓存,而且L3缓存容量是一样的,可见Zen 4c的单个核心面积都大幅缩小了。
关于芯片互联方面,Zen 4和Zen 4c的IFOP设计是一样的,包括两个GMI3链路,然而好像并没有两个都有使用,两个CCX的信号需要通过单个链路多路复用与IOD通信,而且似乎与Zen 2架构一样CCD内部的两个CCX相互通信是要经过IOD的
这是Zen 4与Zen 4c单个内核的对比,很明显布局紧凑得多
与Zen 4相比,Zen 4c的核心面积降低了35.4%,这确实非常强,因为两者都拥有1MB的L2缓存,这意味着L2 SRAM单元占用着相同的面积,AMD通过让L2控制逻辑电路更紧凑来减少L2缓存的区域面积,而在不包含L2和相关电路的区域,核心面积缩小了44.1%之多,前端和执行区域面积几乎减半。但浮点单元缩小的程度没有那么大,这可能是出于散热的考虑,因为FPU通常来说是内核最热的部分,另外内核的SRAM单元布局也更加紧凑,核心面积减少了32.6%。
根据AMD高级副总裁兼首席技术官Mark Papermaster表示,Zen 4c和Zen 4的设计基本相同,拥有相同的IPC,只不过实现和布局有所不一样。
原文链接:
在Zen4发布之前,AMD的Zen4c架构就已经有消息了,但显然之前对消息的解读有误解,称Zen4c是小核架构。而今,一点都不小的Zen4c架构终于正式公布了,是针对专业市场EPYC产品的新架构,代号Bergamo。之前的Zen4 EPYC Genoa已经来到了96核的规模,新的Zen4c则利用单CCD下翻倍的核心数,终于实现了128核。从已曝光的Zen4c结构图来看,Zen4c要比Zen4架构紧凑的多,但逻辑单元部分似乎有所缩减,AMD是用了什么黑科技在这种情况下保持IPC性能不降低的呢??通过优化布局可以做到这样的进步,AMD真的是不简单啊,不知道这种优化的架构会不会来到民用市场呢??
新闻②:AMD承认EPYC Rome处理器在运行1044天后会卡死,暂无修复计划
AMD EPYC 7002是他们在2019年推出的服务器处理器,采用Zen 2架构,代号为Rome,而近日AMD发布了EPYC 7002处理器的勘误表,上面指出“在上次系统重置后大约1044天后,内核将无法退出CC6。”要解决这一问题你需要重启服务器,而且AMD已经表示不会修复这一问题。
1044天大约是34个月的时间,也就是说不到3年,而准确的时间应该是1042天12小时,出问题的可能是CPU REFCLK在54位带符号整数中计算10ns滴答,如果你计算这些滴答中的9千万亿次以上,你会在1042天12小时的时候溢出,一旦发生溢出内核就将处于卡死状态,并且不会接受任何外部中断请求,直到你把电源关闭并重启,这就能重置计算器了。
这个问题能够被发现就表明不止一个系统练习运行了将近三年而且还没有重启,发现这个漏洞应该花了很多时间,AMD的指南中表示,导致这个问题的原因是内核无法脱离CC6省电模式,进入该模式后会降低CPU电压和时钟频率,而不同系统出bug的时间误差可能取决于扩频调制和REFCLK频率惨况。
AMD不打算发布任何针对CC6错误的修复程序,而是建议管理员禁用CC6以避免内核卡死,或者干脆在时间期限来临前定期重启一次系统。
原文链接:
虽然新的EPYC Bergamo和Genoa的表现不错,但前辈Rome这边却出状况了……EPYC Rome其实就是Zen2架构的EPYC,在当时虽然不算很成熟,但也凭借单芯片64核的核心规模成为了性价比极高的服务器产品。发现这一问题可不容易,毕竟EPYC Rome的发布都是2019年下半年的事情了,而该问题需要34个月的时间不重启才会暴露。AMD对此事的处理方案可以说是几乎完全不管,只是公布了此问题的存在,这对于AMD未来在专业市场的影响可并不好,要知道企业用户对稳定性的要求要更高,而且也有更强的消费惯性,如果造成不好的影响太多,恐怕会及其影响销量啊……
新闻③:苏妈 AMD 全力押注 AI:MI300 对标英伟达超芯,研发增长近四倍,AI 早已成财报关键词
放眼五年,你会在 AMD 的每一款产品中看到人工智能。
它将成为 AMD 最大的增长动力。
在福布斯的最新采访中,苏妈毫不掩饰地表达了想要摘取“英伟达 AI 王冠”的野心。
因为 ChatGPT 浪潮下,英伟达这位 AI 基建狂魔显然已经杀疯,市值直接冲破万亿美元,跟苹果、Alphabet、微软等巨头站在了同一列。
而作为英伟达的老对手,AMD 自是不甘旁观。
近十年间股价飙升了 30 倍的它,亦想重现当年的逆风翻盘,在 AI 芯片领域分得一席之地。
苏妈表示:
AMD 还会有另一个阶段,我们必须证明自己会再次伟大。
作为对策,AMD“谋划”了直接对标英伟达超芯 GH200 的旗舰产品MI300,今年下半年就要正式推出。
就在最近,关于 MI300 的更多细节也曝光了,它将促成世界最快的超算诞生。
除了这个“秘密武器”,苏妈还有哪些对策?AMD 又有几分胜算?
“秘密武器”细节曝光
MI300 最新曝光亮相,是在今年国际超算大会(ISC)上的一台最新超算 ——
性能达 2 exaflop 的 El Capitan,即将在今年年末启动,届时它将取代当前的 Frontier 成为世界最快超算。
值得注意的是,该超算同样由 AMD 提供支持,不过这次将采用的芯片就是最新的 Instinct MI300。
总的来看,MI300 是一款数据中心 APU,共集成了 13 块小芯片,大多采用 3D 堆叠方式。
MI300 共包括 24 个 Zen 4 CPU 核心,1 个 CDNA 3 图形引擎和 8 个 HBM3 内存,总内存为 128GB。
由于晶体管数量达到了 1460 亿个,MI300 是 AMD 投入生产最大的芯片。
其中,九个计算管芯(compute die)由 5nm 的 CPU 和 GPU 混合而成,3D 堆叠在四个 6nm 的基本管芯(base die)上。
ITF World 2023 半导体大会期间,AMD 提出了一个“30x25”目标,即到 2025 年将芯片能效提高 30 倍。
该计划的关键就是 Instinct MI300,而 Instinct MI300 的关键就是其简化的系统拓扑结构。
如下图所示,AMD 上一代 Instinct MI250 芯片包含独立 CPU 和 GPU,中间靠 EPYC CPU 来协调工作负载。
相比之下,Instinct MI300 包含一个内置的 24 核第四代 EPYC Genoa 处理器,从而减少了一个独立 CPU 的存在,尽管如此人工智能计算器 v 200版,整体拓扑结构仍然不变。
这就实现了一个四个元素完全连接的 all-to-all 拓扑,它的好处就是允许所有处理器直接相互通信,而无需另一个 CPU 或 GPU 作为数据中继,有助于减少了延迟和不确定性。
从 AMD 目前透露的数据来看,这一改动使 MI300 能耗大幅下降的同时性能却大幅上升。具体而言,MI300 的 AI 性能是 MI200 的 8 倍,每瓦性能则是它的 5 倍。
(MI200 比 A100 快 5 倍)
另外,在本次 ISC 2023 上,美国劳伦斯利弗莫尔国家实验室 (LLNL) 的 CTO 介绍,MI300 带有高速缓存技术(Infinity Cache),但没有具体说明可用容量。
同时,MI300 可以在多种不同模式下运行,但主模式由单个内存域和 NUMA 域组成,它可以为所有 CPU 和 GPU 核心提供统一的访问内存。
据悉,MI300 将于今年下半年正式推出。
苏妈想要摘取英伟达的“王冠”
随着 MI300 更多细节曝光,苏妈 AMD 的野心也藏不住了。
据福布斯消息,苏妈正想方设法为 AMD 注入新的活力、重塑 AMD 业务,以便能在未来高度竞争的市场中占有一席之地。
这背后来源于强大的市场驱动。正如我们所见,英伟达独揽红利,正在成为 AI 算力首选供应商,其预期市盈率约为 64 倍,几乎是 AMD 两倍。
甚至直接有分析师直言:AI 等于英伟达。这一点已经根深蒂固了。
这也正是投资者关注 AMD 的原因:
他们想要穷人版“英伟达”。也许市场太大了,他们不需要有竞争力。
除此之外,还有其他潜在的威胁,比如客户们开始自主研发芯片以减轻依赖 ——
亚马逊 2018 年为云服务设计了个服务器芯片;谷歌花十年时间开发自己的 AI 芯片 TPU,就连 Meta 也开始自研了……
因此对于 AMD 来说,此时已然到了重塑的关键时刻。
苏妈表示,我认为还有全新阶段的 AMD,我们必须证明自己是个好公司。
首要的举措,就是持续的芯片升级。
在她的指导下,研发支出增长了近四倍,达到 50 亿美元,几乎相当于她当时上任时 AMD 的全部收入。
去年,AMD 推动美国橡树岭国家实验室 Frontier 拿下世界最快超算 500 强榜首。除此之外榜单中 121 个系统也都采用了 AMD 的芯片。不过当时这些还主要是 CPU 驱动。
最新的 MI300 将革命性地融合了 CPU 和 GPU,直接对标英伟达超级芯片。
此外,还通过收购来对抗英伟达。
最引发行业热议的正是去年 AMD 以 488 亿美元收购了赛灵思。
这一公司业务集中于 FPGA、可编程处理器、ACAP 等领域,在全球 FPGA 市场占据 40% 以上的市场份额。赛灵思 CEO Victor Peng 担任 AMD 总裁以及 AI 战略负责人。
其收购的最大目的就是增强其数据中心技术的实力。
过去几年间 AMD 数据中心的收入始终持续增长,甚至比 AMD 整体增长都快。
而在最新的财报中,其数据中心和嵌入式业务已经贡献了超过 50% 的营业额。而人工智能也成为了财报中的重要关键词。
这样的增长趋势有点当初英伟达内味了。
但想要把握住机遇,苏妈以及 AMD 还有很多工作要做。在接受福布斯采访时,苏妈形容这样的挑战是 **“有趣的”。
再一次证明「你是伟大的,你为世界做出的贡献会留下持久的遗产」,这些对我来说都是有趣的问题。
而上一次这么证明,还要回到 AMD 水深火热之时,正是由她一己之力实现了硅谷史上最伟大的转机之一。
AMD 近十年股价已飙升 30 倍
2014 年,已经诞生了 45 年的 AMD 陷入崩溃边缘:
产品不能按期交付,笔记本市场被英特尔占据,新兴的智能手机市场则被英伟达、高通和三星三者瓜分,服务器市场份额也从原来的 1/4 缩至仅 2%。
这让 AMD 不得不炒掉 1/4 的员工,股价跌到仅值 2 美元,被分析师直称公司“已无法投资”。
同样 45 的苏妈在此时接过 CEO 一职,上任第二天,就告诉员工:我相信我们可以打造出最好的产品。
并立刻确定了挽救 AMD 的三条核心战略:
创造伟大的产品、加深客户信任、简化公司。
她命令工程师们重新专注于设计出能够击败英特尔的芯片,尽管这可能要耗时多年。
不过很快在 2017 年,Zen架构的成功上市就让市场看到了 AMD 转危为安的信号,AMD 也实现了 CPU 领域的成功突围。
然后在 2019 年,AMD 又率先发布 7nm 制程显卡,实现制程超越,2020 年发布第三代 Zen 架构,在处理器的速度上做到市场领先地位……
终于在去年,AMD 市值超过英特尔。
而纵观苏妈接手的这近十年时间,AMD 的股价已上涨了近 30 倍。
再次重温这段故事,让我们看到了 AMD 和苏妈的逆风翻盘实力。
苏妈能否再次实现野心,带领 AMD 复制当年的成功,在 AI 芯片领域取得与英伟达正面抗衡的实力 ——
让人期待,让人好奇。
原文链接:
苏妈对AI市场的未来还是非常看好的,AMD未来在专业市场的发展也将更关注AI领域,这是肯定的。但至于摘取“英伟达 AI 王冠”,只能说AMD错过了最好的时机了。在生成式AI的发展初期,AMD并没有抓住最好的时间,以至于 NVIDIA几乎承担了唯一的AI产品赋能职能,这也间接促成了NVIDIA在AI领域几乎成为行业的必须选择。事实上,这样的尴尬情景也发生在AMD现在的专业市场上,太多的专业应用依赖于CUDA核心,这也是NVIDIA前期铺垫的结果。幸而,对于AI,现在依旧是发展的初期阶段,不知道AMD能不能走好这步棋!
买电脑到电脑吧评测室淘宝店
店铺口令链接:
38啊小要去而这以可出之对能哈 CZ0001 电脑吧评测室
好看的文章记得点下在看哦
欢迎加入买电脑讨论群:386615430
欢迎加入电脑吧评测室官方一群:798545305
关注B站@电脑吧评测室
备注:
文章转载自网络(链接如上)。文章出现的任何图片,标志均属于其合法持有人;本文仅作传递信息之用。如有侵权可在本文内留言。