算力租赁市场基本情况，截止 5 月份

0 1

春节前（需求驱动涨价）：头部大厂训练需求旺盛，主抢 NVIDIA H200/B200/B300；推理端5090 受追捧，价格从 7500-8200 元/月飙升至最高 14000 元/月。国内 H200 存货被炒高至 7.5万-8 万元。字节跳动因文生视频模型成为最大需求方。

春节后（恐慌与供给焦虑）：受“美超威事件”影响，市场担忧高端卡断供，引发第二波抢购潮。京津冀等热点区域资源被扫空，现货服务器价格翻倍，存量租赁涨 20%-30%，新集群报价大涨。此周期延续至 4-5 月。

5 月份后（趋稳与分化）：推理卡 5090 价格稳定在 1.6 万-1.8 万元/月，原因在于价格已达高位平台期，且与腾退出的 A100（2.4 万-3 万+/月）存在性价比博弈。但 B 系列和 H 系列等训练大卡因进口极难，涨势依然最猛。

供需模式：多数国产卡（摩尔线程、燧原等）为定向采购模式；华为昇腾是唯一预先建设的系列，因 2024-2025 年超前建设，2026 年初部分资源池闲置。

价格与趋势：春节前昇腾 910B 未涨价（维持 3 万左右/月，部分低至 2.8 万）。春节后受

NVIDIA 断供担忧影响，大厂开始将业务转向国产算力（如 DeepSeek 全面转向昇腾），新模型开发也逐步覆盖昇腾、沐曦、寒武纪等。

资金雄厚头部客户：租赁 B/H 系列大卡，训练与推理混用（训完即用于推理），签长协。

预算有限头部及腰部客户：大卡用于周期性训练，便宜小卡（如 5090）用于常态化推理。

垂直领域差异：自动驾驶依赖原有生态（CUDA 选 5090，国产生态选国产卡）；金融行业特殊，国产卡倾向自购（如招商银行），NVIDIA 卡倾向租赁以转移合规风险。

高度集中： 60%的需求来自头部大客户（不仅限 BAT，还含智谱等头部 AI 公司）。市场一半新增订单被字节、阿里、腾讯、百度直接或间接消化，集中度远超 2023-2024 年。

腰部 AI 公司：融资有限，多采用“少量自建+租赁+云服务”，偏好短期合同和可随时启停的云资源，需求多通过火山云/阿里云/腾讯云间接体现。

三大厂对比：字节跳动获取算力一直领先；2026 年腾讯需求急增，长协规模已接近字节；阿里积极追赶；百度聚焦自动驾驶扩大算力储备。智谱 AI 上市后需求大增。

下半年预期：字节、腾讯、阿里将持续争夺领先地位（如阿里千问在金融业爆发）；自动驾驶或迎技术爆发利好百度；人形机器人拉动有限，但工业产线固定机器人将有增长；国资背景机构明显转向国产算力。

算力获取渠道与成本模式：

拿货渠道：国内公司均无法直接从 NVIDIA 采购非合规高端 GPU。 H200 属审批制进口难， B系列未入审批制，故拿货能力取决于海外寻源与合规报关能力，与 NVIDIA 直接关系不大。

租赁 vs 云服务： 终端客户直接找算力租赁公司成本更低；云服务商（自建+转租）需叠加平台软件和增值服务利润，定价更高，且算力无法像传统云主机那样资源复用。

云服务商优势：主流云厂商靠 3-5 年长协和大体量获得极强议价能力。

AI 服务器硬件配置变化CPU：英特尔占 80%-90%（AMD 适配开源模型不佳），热门型号（6530、8558）在销售体系内接近翻倍涨价，交期排至 2027 年。数量上标配 2 颗保持不变。

内存：因价格急剧飙升，出现降配的逆周期措施（如 H800/A800 服务器内存条从 16 条降至 8 条），以此压低单台服务器成本。

“超节点”对市场的影响

市场定位高端：华为昇腾超节点单价高达 1.2 亿，2025 年数百套销量主要由运营商采购后

转租，直接采购极少，仅限顶尖大厂。中科曙光等基本内循环。超节点不面向中小企业。

国产卡份额与用户：华为昇腾占国产卡过半份额。主要用户包括：头部互联网大厂（兼顾供应链安全）、央国企及“中字头” （新项目以国产为主）、三大运营商（新增以国产为主，联通部分用摩尔线程）、未使用海外开源模型的企业。使用海外开源模型的中小企业仍首选英伟达。

国产算力适配进展

阿里：千问模型主打适配国产硬件（尤其自研平头哥），并带动 B 端金融客户采购平头哥硬件。

其他模型公司：智谱、MiniMax、月之暗面等均在适配，但当前主力仍是英伟达；云从科

技适配昇腾较激进；科大讯飞国产算力占比较高。

特定机构与传统互联网：中科院、航天科工等必须适配国产；小米、京东、美团等传统互联网转向国产意愿不强，仍主用英伟达。

文章版权归作者所有，未经允许请勿转载。

AI导航网

AI导航网

AI导航网

AI导航网

AI导航网

AI导航网