春节前(需求驱动涨价) : 头部大厂训练需求旺盛,主抢 NVIDIA H200/B200/B300;推理端5090 受追捧, 价格从 7500-8200 元/月飙升至最高 14000 元/月。 国内 H200 存货被炒高至 7.5万-8 万元。字节跳动因文生视频模型成为最大需求方。
春节后(恐慌与供给焦虑) : 受“美超威事件”影响,市场担忧高端卡断供,引发第二波抢购潮。 京津冀等热点区域资源被扫空, 现货服务器价格翻倍, 存量租赁涨 20%-30%, 新集群报价大涨。此周期延续至 4-5 月。
5 月份后(趋稳与分化) : 推理卡 5090 价格稳定在 1.6 万-1.8 万元/月,原因在于价格已达高位平台期, 且与腾退出的 A100(2.4 万-3 万+/月) 存在性价比博弈。 但 B 系列和 H 系列等训练大卡因进口极难,涨势依然最猛。
供需模式: 多数国产卡(摩尔线程、燧原等)为定向采购模式;华为昇腾是唯一预先建设的系列,因 2024-2025 年超前建设,2026 年初部分资源池闲置。
价格与趋势: 春节前昇腾 910B 未涨价(维持 3 万左右/月,部分低至 2.8 万) 。春节后受
NVIDIA 断供担忧影响,大厂开始将业务转向国产算力(如 DeepSeek 全面转向昇腾) ,新模型开发也逐步覆盖昇腾、沐曦、寒武纪等。
资金雄厚头部客户: 租赁 B/H 系列大卡,训练与推理混用(训完即用于推理) ,签长协。
预算有限头部及腰部客户: 大卡用于周期性训练,便宜小卡(如 5090)用于常态化推理。
垂直领域差异: 自动驾驶依赖原有生态(CUDA 选 5090,国产生态选国产卡) ;金融行业特殊,国产卡倾向自购(如招商银行) ,NVIDIA 卡倾向租赁以转移合规风险。
高度集中: 60%的需求来自头部大客户(不仅限 BAT,还含智谱等头部 AI 公司) 。市场一半新增订单被字节、阿里、腾讯、百度直接或间接消化,集中度远超 2023-2024 年。
腰部 AI 公司: 融资有限,多采用“少量自建+租赁+云服务”,偏好短期合同和可随时启停的云资源,需求多通过火山云/阿里云/腾讯云间接体现。
三大厂对比: 字节跳动获取算力一直领先;2026 年腾讯需求急增,长协规模已接近字节;阿里积极追赶;百度聚焦自动驾驶扩大算力储备。智谱 AI 上市后需求大增。
下半年预期: 字节、腾讯、阿里将持续争夺领先地位(如阿里千问在金融业爆发) ;自动驾驶或迎技术爆发利好百度; 人形机器人拉动有限, 但工业产线固定机器人将有增长; 国资背景机构明显转向国产算力。
算力获取渠道与成本模式:
拿货渠道: 国内公司均无法直接从 NVIDIA 采购非合规高端 GPU。 H200 属审批制进口难, B系列未入审批制,故拿货能力取决于海外寻源与合规报关能力,与 NVIDIA 直接关系不大。
租赁 vs 云服务: 终端客户直接找算力租赁公司成本更低;云服务商(自建+转租)需叠加平台软件和增值服务利润,定价更高,且算力无法像传统云主机那样资源复用。
云服务商优势: 主流云厂商靠 3-5 年长协和大体量获得极强议价能力。
AI 服务器硬件配置变化CPU: 英特尔占 80%-90%(AMD 适配开源模型不佳) ,热门型号(6530、8558)在销售体系内接近翻倍涨价,交期排至 2027 年。数量上标配 2 颗保持不变。
内存: 因价格急剧飙升,出现降配的逆周期措施(如 H800/A800 服务器内存条从 16 条降至 8 条) ,以此压低单台服务器成本。
“超节点”对市场的影响
市场定位高端: 华为昇腾超节点单价高达 1.2 亿,2025 年数百套销量主要由运营商采购后
转租,直接采购极少,仅限顶尖大厂。中科曙光等基本内循环。超节点不面向中小企业。
国产卡份额与用户: 华为昇腾占国产卡过半份额。主要用户包括:头部互联网大厂(兼顾供应链安全) 、央国企及“中字头” (新项目以国产为主) 、三大运营商(新增以国产为主,联通部分用摩尔线程) 、未使用海外开源模型的企业。使用海外开源模型的中小企业仍首选英伟达。
国产算力适配进展
阿里: 千问模型主打适配国产硬件 (尤其自研平头哥) , 并带动 B 端金融客户采购平头哥硬件。
其他模型公司: 智谱、MiniMax、月之暗面等均在适配,但当前主力仍是英伟达;云从科
技适配昇腾较激进;科大讯飞国产算力占比较高。
特定机构与传统互联网: 中科院、航天科工等必须适配国产;小米、京东、美团等传统互联网转向国产意愿不强,仍主用英伟达。