美国似乎在迎来核电的复兴。大模型与AI,算力的尽头是电力,下一个尽头是建立共享能源经济及其带来的智算基础设施大规模建设,正在催生对可持续算力的新的焦虑。核能似乎是它们能找到的短期相对可行的解决方案之一。
亚马逊AWS这两天正在招聘首席核工程师,为其数据中心用电制定核电路线图,招聘要求还特别强调了要在小型模块化(SMR)技术上有丰富经验。微软去年就已经招到了该技术领域的核技术总监,这两天刚和核电巨头星座能源(ConstellationEnergy)达成协议,重启三里岛核电站(ThreeMileIsland)。谷歌和甲骨文都准备建造1GW以上的数据中心,正在考虑的能源解决方案中包括模块化核反应堆。
算力越来越成为AI发展的瓶颈。这些科技巨头正在面临“杰文斯悖论”在智算用电上的再次奏效,先前制定的
,甚至连Sora等先进技术规模落地都遇到了困难。但它们主要还是重启与接入核电,是应急之举。未来智算用电将继续膨胀,最关键是创造“共享能源经济”这样的新型电力系统。
杰文斯悖论下的算力可持续问题
计算就是能源的处理形式。在数据中心这一基础设施里,电力转化成了算力。对于这一基本的“物理原理”,由于涉及因素繁多,不确定性较强,
在不同场景下,测得智算中心用电增长的趋势,差距颇大。但整体而言,到2030年,全球尤其是作为大模型技术主要竞争对手的中国与美国,对智算规模增长带来的用电需求,都达到了空前的水平。
未尽研究此前曾发布预测,届时,中国智算中心的用电需求,最高将达到1.3万亿度;在芯片迭代、算法架构等持续进化下,这一数值可能降低至0.6万亿度。从总量上看,这似乎还不算是过于庞大的数据。年初,中电联预计今年全国全社会用电量就将达到9.8万亿度,明年有望超过10万亿度。但从增量上看,未来,智算用电占整个中国新增用电的比例将非常惊人,至少达到27%。
这对应着全球经济的新一轮“电气化”。最近,荣鼎投资预测,十年后,美国的新增电力需求将被交通电气化、工业电气化与智算中心所分食。其中,电动汽车会吃掉增量的50%,智算中心则会吃掉增量的25%。
长期以来,欧美发达国家的社会经济发展依赖于服务化会与数字化,用电增量处于相当平缓的趋势。在大模型时代到来之前,由于数据中心整体能效不断提升,用电量占比较长一段时间都维持在1%-1.5%的水平。如今,尽管这个趋势仍在持续,黄仁勋就常常
,无论是用于训练还是推理,英伟达芯片的算力性能提升速度都高于能耗提升速度,但目前起主导作用的却是大模型发展所带来的绝对规模的增长。据美国电力研究协会(EPRI)预测,如果智算用电以15%的年复合速度增长,到2030年,它将占美国用电量的9.1%。
拐点已经到来,大模型与AI是最大的变量。随着大模型与生成式AI从文本向视频等多模态落地,智算用电将进一步增长。距离Sora公之于众已经过去了半年多,但它一直没有真正公开发布。其中一个重要的原因是能源。如果它是一款杀手级应用,像tiktok或者youtube那样,那么它所需要。事实上,美国的科技巨头还在探索十万卡的单一集群——公开宣布达成这样记录的马斯克,事实上正在
——到2025年才有望扩展到30万卡集群。
制造这样的智算集群,本身也需要庞大的电力支持。芯片制程节点越先进,它就越耗电。据IMEC分析,从28nm到3nm,它的碳排放翻了一倍。台积电是典型“受害者”,五年来用电量增长了85%,用电量占当地电力市场近13%。考虑到台湾岛内绿电资源与潜力不足,台积电要从如今的11%绿电到2040年实现碳中和,困难重重。中国也发展大模型,半导体制造工艺也在追赶先进制程,同时要求算力来源自主可控,也将面临类似的考验。
算力用能也
。计算效率的提升,不但不会减缓计算用能的增长,反而会加速它进一步增长。算力越是高效低廉,技术创新就越迅速与深入,市场应用范围就越广,规模就越大,带来的能源消耗也就越高。工业革命以来煤炭、电力、石油的利用,都遵循了杰文斯定律。
照明是最典型的案例之一。从1850年到1900年,随着资源价格下降,油气照明的成本下降为原来的1/10,但照明用能规模扩展了近5倍。1920年代,照明进入了电气时代,它的能源消耗规模短期内陡然下降,照明成本也进一步下降。但很快,它就迎来了规模应用爆发,从1945年到2006年的六十年间,它的成本进一步下降为原来的1/10,用能规模则扩展了近10倍。
算力也将如此,无限的算力,可能需要无限的电力。这就是算力可持续问题。整个算力的产业链的每一个环节,都在使得它成为一个迫切问题。
美国科技巨头碳中和目标正在失守
在大模型时代之前,美国科技巨头在碳中和目标上显得非常高调。RE100是一个全球性的倡议,旨在鼓励并支持企业致力于实现100%使用可再生能源电力的目标,目前有400多个成员。美国科技巨头在列,主导了全球绿电采购协议市场。去年,亚马逊的协议采购(PPA)规模最大,接近9吉瓦(GW),Meta达到了3吉瓦,谷歌、特斯拉与微软也在1吉瓦左右。
但是,这还远远不够。美国科技巨头在算力可持续方面的努力,严重滞后于AI的发展。这两年,它们的年化资本支出,从1380亿美元同比增长到2290亿美元,近1000亿元投入到算力基础设施建设上,也就是AI优先。
这导致它们的碳中和的
。谷歌从2019年到2023年,碳排放增加了48%;微软2023年比2020年增加了30%;亚马逊碳排放自从2019年增加了40%。谷歌今年已经破了防,不好意思再提碳中和;微软此前还宣传要在2030年实现负碳,也就是把历史上排放过的碳都收回来,估计也要低调一些。
谷歌与微软希望能以更严格的标准来衡量实际使用的无碳能源,大致可以划入24/7无碳能源派。由于基于地理位置的碳排放与基于市场的碳排放的差异越来越大,谷歌还呼吁要在“在地理和时间上更细致的范围2核算”等。Meta与亚马逊显然不认同这一观点,是典型的“排放优先”派,也就是先排了再说,然后通过其他手段把它抵消掉,包括新建绿电发电厂、采购绿电协议,或者更多绿证。但这种做法遭致越来越多批评,它没有带来直接的绿电的增量效用,而且物理上还是往大气中排放了越来越多的温室气体。
目前,美国科技巨头对碳账户标准的角力还在继续。温室气体核算体系(GreenhouseGasProtocol)预计将于2025年完成调整初稿并征求意见,于2026年下半年正式发布。但这一核算体系目前的资助方是都是美国科技巨头,包括贝索斯地球基金、Meta与微软。中国也应该有一家巨头参与进去,共商共建兼顾全球可持续与中国利益的统计、披露标准。
实现共享能源经济的新型电力系统
美国科技巨头的单打独斗正在碎片化地解决电力尤其是绿电对AI发展带来的束缚。它们的数据中心与当地电力公司进行耦合,以核电为主;建立独立的备用电源,以天然气为主;还在尝试地热与氢能等新的能源储存方式,以及早期投资核聚变等未来的能源应用。
巨头们的最新动向,是结成投资联盟。
,共同成立成千亿美元规模的基金,解决迫在眉睫的数据中心部署和电力“卡脖子”问题。
如果电网不改变自己,或者太慢,美国巨头等不及了,就会自己想办法改变电力系统。数据中心长期有效实现算力可持续,最终需要整个能源电力系统的低碳化,并在此技术上构建出一套称上的“共享能源经济”的新型电力系统。
全球都在推进可再生能源的规模部署,中国各省市电网的碳因子将在未来十年内大幅下降。但伴随着将来电力系统中可再生能源占比的提高,未来的电力系统将变得越来越异构、多元与分散。这对同时保持整个电力系统的弹性与稳定性带来挑战。美国加州为了应对这个炎热的夏季,电网中传输着至少十种不同来源的电子,它在一天的峰谷波动就达到了30%。其中,太阳能就在白天贡献了最多的绿电,但在其他时间段需要储能及大量依靠燃气发电或外部输入。
简言之,这是一个非常动态、碎片化,需要高度协调的新型电力系统。目前,加州已经可以做到每年实现100天的100%绿电供应。这是未来电力系统演变的方向,中国也在抓紧建设。青海目前新能源发电量过半,在2022年时候做到了全年35天的100%绿电。
尽管大模型的
,但美国科技巨头宁愿过度投资,也不愿意错过投资。它必须加快发展AI,但它最大的现实问题是传统电力系统从立项、审批、建设到上网的各个环节推进缓慢。美国已经多年没有新建核电站,新建要经过审批、环评、建设、投产,正常时间下来要十年八年,这也是为什么美国科技巨头此前都是“拆东墙补西墙”,与民争电;即使是风与光发电也需要六七年的时间。中国的速度明显会快一点,但至少也要三四年,这与大模型每个月都在推陈出新的节奏并不协调。
美国科技巨头正在加强游说。上周,美国政府刚刚成立了一个专责小组,促进AI基础设施的建设,包括在联邦政府的权责范围内加速数据中心和电力部署的审批。成效如何,还有待观察。
数据中心既要快速扩张,又要获得稳定和廉价的电源,还要减低碳排放,有望推动共享能源经济模式的出现。美国的电力系统市场化程度相对较高,未来,数据中心与电网可以从当前的“被动负载”模式,转变为协作共赢的模式,电网和数据中心的电力资源将得以完全整合,即电网资源为数据中心供电,而数据中心的备用资源,则为电网的可靠性和灵活性做出贡献。中国则在尝试源网荷储的一体化。
而AI自身将是这一“共享能源经济模式”最重要的加速和使能技术。
(本文主体为作者9月20日在云栖大会上的演讲,略有调整与扩充)