AMD终于从英伟达“平替”变成了“平起平坐”!
发布时间:2025-06-26 17:28 浏览量:1
编译 | 华尔街大事件
在全球人工智能军备竞赛中, AMD(NASDAQ:AMD)长期以来一直落后于英伟达,其估值反映出投资者对其在下一代高性能计算(“HPC”)和生成式人工智能部署领域竞争力的持续怀疑,但这种情况可能很快就会开始转变。
具体来说,AMD 近期发布了其下一代Instinct MI350 系列加速器,预计将于 2025 年下半年量产,同时还发布了 MI400 系列加速器及其配套的“ Helios ”机架式基础设施平台的预览版。加上其ROCm软件堆栈的持续改进,这些进展将继续增强 AMD 日益增长的雄心,即在全栈层面与英伟达为持续推进的 AI 转型而精心打造的同类产品展开竞争。即将到来的产品升级周期可能会显著缩小 AMD 的技术差距,从而释放潜在的盈利拐点,支持其股价的估值追赶。
然而,不稳定因素的加剧增加了长期人工智能支出环境出现动荡的可能性。这构成了一股反作用力,可能会推迟甚至结构性地抑制AMD即将抓住的利用人工智能相关基础设施建设的机会,使其在需求向下游应用层转移之前获得成功。
在6月12日AMD“推进AI 2025 ”主题演讲中,首席执行官苏姿丰公布了公司针对AI基础设施建设的下一代产品路线图。此次更新重点强调了硬件和软件创新,这巩固了AMD作为数据中心AI市场新兴竞争者的地位,有望在市场中占据重要份额:
Instinct MI350系列加速器
备受期待的 MI350 系列加速器将包括 MI350X 和 MI355X,预计将于 2025 年下半年开始批量出货。这些加速器已针对日益增长的计算密集型生成式 AI 和 HPC 工作负载进行了进一步优化。具体而言,MI350 系列承诺在其前代产品的基础上实现显著改进,AI 计算性能提升高达 4 倍,推理工作负载性能效率提升 35 倍。
Instinct MI400系列和“Helios”系统
AMD 还预览了 MI400 系列加速器,预计将于 2026 年开始批量出货。虽然详细规格仍然有限,但这款下一代数据中心 GPU 的重点在于将其集成到 AMD 首个 AI 机架规模系统 Helios 中。
Helios依托于 AMD 近期整合的系统设计能力,该能力源于其于第一季度完成的对ZT Systems 的收购。Helios 将集成基于 HBM4 的 MI400 加速器、UALink高速互连以及 Zen 6 EPYC “ Venice ” 服务器 CPU。该系统支持 72 个 GPU 配置,并借助 AMD Pensando “ Vulcano ” AI 网卡进一步增强,使每个 GPU 的带宽横向扩展能力较前几代产品提升高达 8 倍。这一全面的架构旨在应对下一代 AI 工作负载日益增长的规模和复杂性,并为 AMD 的超大规模客户提供一个高效的全栈替代方案,以取代目前正在快速发展的 Nvidia Blackwell NVL72 系统。
ROCm 7 和 AMD 开发者云
AMD 软件堆栈的最新更新——ROCm 7,是对硬件路线图的补充。ROCm 7 专为更复杂的 AI 和 HPC 工作负载量身定制,相比上一代 ROCm 6,推理能力提升了 3.5 倍,训练性能提升了 3 倍。此外,它还进一步增强了与针对推理优化的行业标准框架(例如SGLang、vLLM和llm-d )的兼容性。预计这将进一步加速开发人员的采用,从而有利于更广泛的 AMD 生态系统产品的普及。
AMD 还推出了“ AMD 开发者云”,允许开发人员通过 ROCm 7 在基于 MI300 的云实例上测试和部署工作负载。这有望为构建和扩展 AI 创新提供更简化的环境,并加强开发人员对更广泛的 AMD 生态系统的采用。
AMD 下一代硬件和软件产品组合的核心主题是优化——无论是在性能可扩展性方面,还是在部署灵活性方面。从 MI350 和 MI400 系列加速器到 ROCm 7 软件堆栈,AMD 的定位不仅在于新的数据中心 AI 构建,还在于增强现有的基础设施——这种方法与其 EPYC 系列服务器 CPU 的升级策略一致:
在企业领域,我们看到了需求回暖的迹象,因为首席信息官需要增加更多通用计算能力和 AI 计算能力,同时保持现有基础设施的物理占用空间和功耗需求。这种情况与我们的 EPYC 处理器的价值主张完美契合。凭借我们高核心数和高能效,与竞争对手相比,我们能够以减少 45% 的服务器数量提供相同的计算能力,从而将初始资本支出降低高达一半,并将年度运营支出降低 40% 以上。
资料来源:AMD 2024 年第一季度财报电话会议记录
即将推出的 MI350 和 MI400 系列加速器代表着 AMD 在缩小与行业领导者 Nvidia 在产品性能和部署方面的差距方面迈出了战略性的一步。AMD 的核心差异化优势在于能够为客户提供优化。
例如,MI350 系列加速器旨在实现最大的部署灵活性。具体来说,MI350 系列可在传统风冷服务器环境中以最多 64 个 GPU的集群形式部署,帮助超大规模服务器和企业环境优化其现有基础架构,以支持下一代 AI 开发。同时,下一代直接液冷机架可同时支持最多 128 个 MI350 系列 GPU 部署。预计这将进一步缩小 MI350 与 Nvidia Blackwell 系统之间的性能差距。回想一下,Blackwell GB200 NVL72 目前采用 72 个 GPU 的配置,相当于大约144 个 GPU,因为每个 GPU 都基于二合一芯片组构建。Blackwell GB200 NVL72 系统是同类系统中第一个功耗需求达到 100 kW 的系统,开启了向液冷服务器的强制性过渡。
MI350 的竞争优势因其领先的内存容量而进一步增强,每块 GPU 最高可达 288GB HBM3E,与 Nvidia 在其下一代GB300 NVL72系统中采用的最新标准一致。这种硬件可扩展性和向后兼容部署的结合,为 AMD 带来了差异化的价值主张,尤其对于寻求更快部署时间和更低总体拥有成本 (TCO) 的超大规模客户而言。这些功能也使 AMD 能够更好地满足对推理工作负载日益增长的需求,而性能效率和运营灵活性对于推理工作负载至关重要。
展望未来,AMD 的产品节奏预计将因即将于 2026 年推出的 MI400 系列及其配套的 Helios 机架式系统而得到进一步加强。具体而言,Helios 代表了 AMD 首款机架式 AI 基础架构,并将其基于 HBM4 的 MI400 GPU 和 Zen 6 EPYC “Venice” 服务器 CPU 与 UALink 和 AMD Pensando “Vulcano” AI NIC 网络解决方案相集成。这款 72 GPU 平台专为计算密集型 AI 工作负载而设计,与前几代产品相比,每个 GPU 的带宽销售量提高了 8 倍以上。Helios 由 AMD 与新整合的 ZT Systems 设计团队合作开发,将使 AMD 与 Nvidia 的同类 Blackwell NVL72 系统展开直接竞争。这标志着生态系统日趋成熟,未来可能会提升市场对 AMD 驱动的 AI 部署的需求。
与硬件升级相辅相成的是 AMD 最新的开源软件堆栈 ROCm 7。如前文所述,ROCm 7 在业界领先的先进 LLM 上实现了平均 3.5 倍的推理性能提升,训练性能较 ROCm6 提升了 3 倍,并扩展了与行业标准框架的兼容性,以支持日益复杂的 AI 和 HPC 工作负载。为了进一步简化应用流程,AMD 还推出了“AMD 开发者云”,提供基于 MI300 的“无硬件”云实例,以实现“无摩擦”的 AI 开发流程。
AMD 不断扩展的全栈软硬件产品即将推出的一系列更新预计将进一步增强其已经建立的势头。Meta Platforms(META)继续在 AMD 的 MI300 系列实例上部署其专有的 Llama 3 和 Llama 4 训练和推理工作负载就是明证。
OpenAI在 2022 年底通过 ChatGPT 引发了人们对生成式人工智能的浓厚兴趣,也公开支持 AMD 即将推出的创新。具体来说,这家人工智能巨头已经通过 Microsoft Azure(MSFT )上的 MI300X 实例运行其工作负载。它还在积极与 AMD 合作,以便在 2026 年推出基于 MI400 的下一代部署。这些早期信号证明 AMD 的路线图越来越可行,不仅在性能上与行业领导者 Nvidia 的产品持平,而且在领先的人工智能开发商中也越来越受欢迎。总的来说,下一代产品组合标志着 AMD 参与长期人工智能计算机遇的能力的关键扩展,为其基本前景提供了附加的顺风。
然而,我们也对日益增多的外部风险愈发谨慎,这些风险可能会抑制AMD在新兴基础设施建设领域加速参与的预期。其中包括不断变化的贸易环境,这可能会对AMD即将到来的需求环境产生不利影响。
尽管经历了长期转型,但疲软的经济背景预计将导致企业和超大规模数据中心的支出环境趋于疲软,尤其是在人工智能基础设施等资本密集型领域。这可能会无意中削弱AMD即将到来的增长周期,而该周期正由下一代MI350和MI400系列升级支撑。值得称赞的是,这家芯片制造商即将发布的产品路线图(部分侧重于优化传统服务器环境)应该能够提供一定的韧性。该公司提供灵活、向后兼容解决方案的战略非常适合IT预算可能收紧的环境。然而,这可能不足以抵消通常伴随经济恶化而出现的更广泛的支出回落。
尽管美联储维持了年底前再降息50个基点的预期,但短期内借贷成本的任何缓解都可能只是昙花一现。历史先例表明,美国向宽松周期的过渡通常与更深层次的经济衰退同时发生。
除2020年疫情引发的降息外,上一次重大宽松周期始于2008年,当时正值全球金融危机期间。尽管2008年末首次降息,但标准普尔500指数(SPY / SP500)在随后的12个月里下跌了10%以上。与此同时,美国失业率翻了一番,从2007年末的5%上升到2009年末的10%。如果出现类似的萎缩,企业人工智能支出可能会面临新的压力,这对AMD预期价值升值所依赖的即将到来的升级驱动型增长轨迹来说,又是一个外部风险。
虽然分析师维持 AMD 的目标价范围与之前的报道相同,但前述分析中概述的日益严峻的经营环境可能会将该股的近期表现拉近至下行情景。
具体而言,分析师对AMD每股105美元的下行情景价格是基于基于10.5%五年营收复合年增长率和45.7%盈利复合年增长率的贴现现金流分析得出的。
这些假设低于我们基于12.2%五年营收复合年增长率和48.9%盈利复合年增长率的基准情景预测。下调主要反映了美国经济和相关风险可能对人工智能基础设施支出造成压力,导致近期预期减弱,从而削弱了AMD由升级驱动的增长前景。12个月基准展望的放缓最终导致预测期内的复合增长轨迹相对于基准情景有所放缓。
直流现金流折现法 (DCF) 分析还采用了 9.6% 的加权平均资本成本 (WACC),这与 AMD 的资本结构和风险状况相符。预估终值是将 3.5% 的永续增长率应用于预计的 2029 年 EBITDA 计算得出的。这些假设反映了 AMD 主要市场的长期经济扩张预期,以及其稳定状态现金流(以 2029 年 EBITDA 为代表)可持续增长至永续的可持续速度。
诚然,在日益激烈的人工智能军备竞赛中,AMD 正进入进一步提升市场份额的关键阶段。即将推出的 MI350 和 MI400 系列加速器,以及 Helios 机架式系统和 ROCm 7 软件堆栈,代表着意义非凡的进步,有望缩小与目前行业领先者英伟达在性能和部署方面的差距。Meta 和 OpenAI 等行业领导者的早期采用,进一步证明了 AMD 在更广泛的人工智能生态系统中日趋成熟的地位,为实现盈利增长和估值上涨提供了可靠的途径。
然而,由于逆风加剧,这种乐观的前景正面临越来越缓和的风险。尽管AMD灵活、以优化为导向的产品路线图具有一定的防御性,但它仍然面临着进入缓和环境的风险,这与先前预期的升级周期前景相悖。因此,分析师目前将该股评级下调至中性,因为AMD的长期结构性承诺可能会被近期不确定性加剧所抵消。
转自:美股研究社