
随着微软及其他云服务商将GPU储备优先供给内部团队与大型企业客户,AI初创企业正难以获取英伟达显卡资源。中小厂商只能高价争抢剩余算力服务器,处境愈发被动。
多位相关企业创始人和投资人透露,本轮算力短缺已波及多家知名资本加持的头部AI初创公司,投资方包括红杉资本、创始人基金、通用催化剂创投、安德森·霍洛维茨基金等顶级机构。一名知情人士表示,迫于算力紧张,通用催化剂创投合伙人赫曼特·塔内贾已向被投企业创始人发放调研问卷,摸排各家GPU算力获取情况。
塔内贾在问卷中写道:“我们收到大量反馈,算力资源,尤其是GPU使用权,已成为各位今年面临的最大发展瓶颈之一。”
当前市场格局与2023年初高度相似:彼时各大云厂商收回公有云算力,优先保障内部业务与OpenAI等核心大客户。为缓解算力荒,安德森风投、指数创投等机构纷纷自建GPU资源池,为旗下被投企业兜底。
但与AI应用尚处萌芽阶段的2023年不同,如今AI代码开发工具需求爆发,进一步加剧了芯片短缺。云厂商高管与初创企业负责人表示,伴随Anthropic等头部AI开发商、自动化代码工具厂商的算力需求暴涨,云平台正在大幅压缩中小客户的GPU配额。
为应对危机,通用催化剂创投正筹划解决方案,计划通过搭建共享算力池、直接代企业谈判等方式,帮助被投初创公司稳定获取GPU资源。
芯片供不应求的格局,让云服务商得以上调英伟达算力服务器租赁价格。此前不少云厂商在GPU业务上盈利困难,涨价举措显著改善了其利润空间。
但成本上涨严重挤压了AI企业生存空间,图像生成AI模型研发商Krea便是典型案例。这家成立四年的初创公司累计融资8300万美元,投资方涵盖安德森风投、贝恩资本风投。
Krea联合创始人兼首席执行官维克托·佩雷斯介绍,半年前多家云厂商争抢合作,公司以每芯片每小时2.8美元的价格,签下数百颗英伟达布莱克韦尔芯片的半年租赁合约。然而近一个月,企业计划采购更多算力从零训练大模型时,多家云厂商销售拒接沟通、消极应对。
即便后续取得联系,对方也直接大幅涨价,并强制要求签署三年长期合约。
“有的销售直接失联,有的称无资源可用,还有的强行绑定不合理合约。”佩雷斯说道。
他补充,企业评估多款算力集群方案期间,相关资源短短数日就被其他客户抢购一空。
最终,Krea被迫签订一年期新合约,续租数百颗同款芯片,单价涨至每小时3.7美元,涨幅达32%。对比行业其他报价,该价格已相对低廉。
佩雷斯坦言:“无法稳定获取算力、支撑平台运行与模型训练,才是我们最大的隐患。小幅涨价尚可承受,断供才是致命打击。”
另有一位初创企业创始人表示,其计划租赁近千颗高互联集群GPU,英伟达销售直言,头部云厂商算力资源极度紧张,海量客户排队争抢,难以匹配需求。该集群单日租赁成本超7万美元,目前仍在艰难寻找资源。
合约集中到期,供需矛盾加剧
雪上加霜的是,微软、亚马逊、CoreWeave等头部云厂商纷纷敲定数十亿美元长期合作,为Anthropic、OpenAI锁定海量GPU资源。即便如此,伴随业务爆发式增长,Anthropic依旧深陷算力短缺困境。
短缺的另一核心诱因:大量AI初创企业早年签订的两至三年云服务合约集中到期,云厂商借此契机大幅提价,或将存量算力重新分配给高付费客户。
知情人士透露,微软Azure管理层已内部通知员工,算力长期紧缺的现状至少将持续至2026年底。
某AI云服务商CEO透露,曾计划将一家合约到期企业的GPU集群,转让给愿意溢价约30%的新客户;原企业紧急协商挽留后,最终以涨价方式保住算力资源。
GPU云服务商Lightning AI首席执行官威尔·福尔肯表示,公司线上运行约4万颗GPU,但积压了近40家企业的租赁需求,合计缺口高达40万颗芯片。过去六个月算力租赁价格涨幅超25%,单芯片时薪从1.6美元攀升至2美元以上,热门资源溢价更高。该平台主力芯片为英伟达上一代霍珀架构产品。
微软推行“闲置回收”管控政策
据微软内部员工透露,受大客户与内部业务算力需求挤压,Azure已全面收紧中小客户的服务器租赁配额,不少中小企业需要排队数月才能扩容GPU资源。
微软长期将顶级旗舰芯片集群优先供给OpenAI及自身业务,同时持续为Anthropic新建专属算力集群。普通客户的GPU分配权限,完全取决于其在Azure的消费规模,以及新增算力合约的付费承诺。
内部信息显示,近几个月微软硬性要求,想要租用英伟达布莱克韦尔高端芯片的客户,必须承诺至少采购1000颗芯片、签约一年以上,单份合约最低成本达数千万美元。
即便是英伟达老旧款芯片,普通客户在Azure平台的预约周期也长达数周甚至数月。
微软采用分级体系管理客户优先级:一级客户约一千家,为年度高额消费的头部企业,享有算力优先分配权;二级客户消费体量中等,配备专属销售对接;三级客户为中小微企业,由渠道合作代理商负责对接。
未签订大额预留合约、采用按需付费模式的客户,将面临漫长排队周期。同时微软严格监控算力使用率,即便是短期闲置数小时,也会被收回GPU使用权。
此外,微软正在清退初创扶持计划的免费算力权益。通过“微软初创项目”免费申领服务器额度的企业,若无法满负荷使用芯片,将被永久收回GPU访问权限。
自建算力成新出路
面对云厂商层层限制,部分初创企业开始绕开云平台,选择自建算力。
油气行业AI智能体研发企业Collide去年完成1400万美元种子轮融资,创始人科林·麦克莱兰表示,受够了算力排队、合约限制等问题,公司计划投入约50万美元采购英伟达GPU,搭建私有算力集群。企业考虑直接租用数据中心机房,自主部署硬件设备。
麦克莱兰认为,短期自建硬件成本远高于租赁,但能够彻底规避算力断供与价格波动风险。长期来看,多年租赁的综合成本反而更高,自建模式更具性价比。
“关键时期缺算力,对企业是毁灭性打击。多数团队畏惧硬件运维,但我常年运营油井项目,早已适应这类重资产模式。”