变化一:已观察到的推理需求加速(市场已部分交易)
四月底五月初美股巨头季报显示,token 量(尤其是三月份)边际变化显著。谷歌 5月 20 日 IO 大会进一步确认了 to C 端 token 量的加速增长(微软季报已显示 to B 端token 量加速)。
这解释了为何市场预期的微软和 Meta 资本开支削减并未发生:推理需求的增长填补了潜在缺口。例如,微软砍掉的是面向 OpenAI 训练的数据中心,而推理需求补位。
推理需求的加速无需等待爆款应用出现,其增长态势清晰可见,且与 AI 商业模式的闭环逐渐清晰有关。市场对此变化的持续性和规模可能仍低估。
训练需求一直存在,但此前受限于供给(如英伟达 GB 系列问题)。
预计今年下半年,OpenAI 和 xAI 等超大集群所需的 BB 系列芯片将逐步交付,满足积压需求,训练量将开始回升。
这仅是训练需求复苏的起点。一旦 OpenAI/xAI 通过大集群推出下一代模型,第二梯队的公司(如谷歌、亚马逊)可能跟进。目前这些公司训练需求处于待定状态,但一旦领头羊有进展,其需求可能迅速释放。
市场(A 股和美股)目前对此预判尚未交易,因需看到数据(美股)或认识不足(A股)。
上半年训练和推理需求预期共振向下,下半年则有望共振向上。
判断训练需求无需等待爆款模型,推理需求无需等待爆款应用。应更早关注 token量(应用端)和研究模型演化格局(模型端),避免在信息普及后错过行情。
本次更新围绕推理需求,重点讨论 ASIC 产业链。
提及即将举行的 Marvell AI Day,预期其将对 ASIC、光互联等环节的未来趋势做出判断,值得关注。后续将整理分享其观点。
核心驱动: AI 推理需求增长、算力需求增加、成本控制诉求、降低对英伟达依赖。
厂商进展:
其他厂商:OpenAI、xAI、Apple 等也在推进自研芯片,预计 2026 年下半年开始放量,初期规模较小(各小几十万颗)。
合作情况:
亚马逊:25年主力合作方为Marvell。Trainium3主要合作方为 Alphawave,但 Marvell 也参与部分型号(如 Trainium2 Ultra/Trainium3Lite)。下一代(Trainium4)合作方待定(可能延续多供应商策略)。
微软:第一代合作方为创意电子。第二代(Maia 200)采用双路径:部分自研+创意电子后端;部分全委托 Marvell。预计 Marvell 方案占比较大。下一代(Maia 300)合作格局可能更复杂(博通、联发科等可能参与竞争)。
总体趋势: 尽管竞争导致份额可能分散,但 ASIC 芯片总量快速增长,头部设计服务厂商(如博通、Marvell)通过拓展新客户(如苹果)仍能获得增长。
在 ASIC 业务方面,可能澄清与亚马逊(Trainium3)、微软(Maia 200)等项目的合作情况。
可能更新 AI 相关收入指引(此前预期 2024 年 15 亿、2025 年 25 亿美元)。
可能提供连接技术迭代路径及市场空间的新指引。