微软部署出现摩擦,英伟达希望整机出货
IT之家6月22日消息,媒体TheInformation曝料称,微软计划向英伟达采购最新的BlackwellB200GPU,不过因为服务器机房安装方式而产生摩擦,导致双方合作一度陷入僵局。
英伟达作为AI领域的霸主,不断瓜分数据中心的这块大蛋糕。黄仁勋在公开演讲中多次强调,英伟达公司不再考虑以单个GPU方式出售,而是将整个NVL72机架视为一个GPU推广销售。
DGXGB200系统机柜分三大类,分别是DGXNVL72、NVL32、HGXB200,其中DGXNVL72是该系列中单价最高、算力最强的AI系统,内置72颗B200GPU及36颗GraceCPU,配备9台交换器,整机设计由NVIDIA主导且不能修改,但ODM厂商可以自己设计I/O及以太网连接系统。
NVL72完善提供一体水冷散热方案,可实现总计720petaflops的AI训练性能或1,440petaflops(又称1.4exaflops)的推理性能。它内部使用电缆长度累计接近2英里,共有5000条独立电缆。
根据汇丰银行(HSBC)提供的数据,配备36个GB200超级芯片(18个GraceCPU和36个增强型B200GPU)的NvidiaGB200NVL36平均售价可能为180万美元,而配备72个GB200超级芯片(36个CPU和72个GPU)的NvidiaGB200NVL72售价可能在300万美元(IT之家备注:当前约2172万元人民币)左右。
对于英伟达来说这种销售方式明显更为有利,不仅能获得更高的收入,微软部署出现摩擦,英伟达希望整机出货而且“标准化”用户安装B200GPU的方式。
英伟达表示正在推动客户购买单个机架甚至整个SuperPods,提供“一条龙”全套服务,官方认为这样可以提高GPU性能。
不过在实际部署中,微软并不认可英伟达的部署方式。IT之家援引该媒体报道,英伟达公司副总裁安德鲁・贝尔(AndrewBell)要求微软为其新的B200GPU购买专用的服务器机架设计,其外形尺寸与微软数据中心现有的服务器机架差了几英寸。
微软不认可英伟达的建议,认为如果采用英伟达的服务器机架方案,那么就无法轻松切换英伟达的AIGPU、AMD的MI300XGPU等相关产品。
双方的“摩擦”最终以英伟达的妥协告终,英伟达最终让步,让微软为其B200AIGPU设计自己的定制服务器机架,但这可能不是两家巨头之间的最后一次分歧。