年智能算力产业发展白皮书(智能算力产业报告)

报告共计:71页

智能算力未来将广泛应用于多个领域,包括工业制造中的产品质量检测和生产控制,医疗领域的疾病诊断和新药研发,金融服务的交易决策和风险管理,能源领域的生产与分配管理,交通领域的自动驾驶,科研领域的前沿科技研究,教育领域的教学培训,以及智慧农业、城市管理等。它将为各行业提供强大的计算支持,推动技术创新和发展,助力实现智能化转型,提高生产效率和质量,改善人们的生活和工作方式,对经济和社会的发展产生深远影响。

获取电子版报告:公众号『资源共生库』

资源共生库:收录海量“智能算力”行业专题报告合集

内容仅供参考,不代表我们的任何投资建议。公众号@【资源共生库】整理分享的资料仅推荐阅读,用户获取的资料仅供个人学习,如需使用请参阅报告原文。

《智能算力产业发展白皮书(2024年7月)》由国家信息中心大数据发展部、上海人工智能研究院、东方证券-上海人工智能研究院联合实验室发布,特别鸣谢广州数据集团、广电运通、粤港澳大湾区大数据研究院。

一、AI大模型时代到来,智能计算成为关键引擎

1.AI大模型取得突破,算力需求正从通用计算转向智能计算

通用算力、智能算力和超级算力:算力可分为通用算力、智能算力和超级算力,分别对应基础计算、智能计算和超级计算三种计算模式,不同应用场景所需计算精度不同,目前智能算力规模和占比越来越大。

驱动力:通用大模型的训练迭代极大拉动对智能算力的需求,垂直行业大模型的训练和应用也需要大量智能算力,同时海量数据的增长使得智能算力需求快速增长。

我国智能算力发展现状:我国智能算力占比已超过通用算力,成为整体算力增长的主要驱动力,预计未来智能算力需求将呈现指数级增长。

2.智能算力需求将呈现指数级增长

全球算力结构向智能算力集中:全球范围内智能算力需求激增,我国智能算力规模高速增长,预计2026年智能算力规模突破ZFLOPS量级,增长速度远超通用基础算力。

从智能算力总额和人均智能算力看:美、中智能算力处于全球领先地位,但从人均算力看,中国仍处于全球中等水平。

3.智算产业上升为国家战略竞争点,国家与地方政策加大智算产业支持力度

国家层面制定一系列政策:国家制定一系列政策在全国范围推动信息基础设施建设,智算中心的建设是关键环节,包括明确新型基础设施范围、启动“东数西算”工程、推动公共算力平台建设等。

各地积极布局算力:我国各地智能计算中心加快布局,30余城市落地40余智算中心,建设模式大多数为“政府主导 企业承建”,政府结合业务需求与企业规模等因素选取合适的承建单位。

二、智算产业蓬勃发展,产业生态逐步形成

1.智算中心建设迅速落地,多方主体积极参与

智算中心的作用和影响:智算中心拥有大规模智能算力集群,具有高性能计算能力,能够处理海量数据,为AI计算提供高效的并行计算能力,通常集成了各种优化的AI算法、框架和开发工具,加速了模型开发和训练过程。智算中心对于推动技术创新和区域产业升级具有深远影响,其建设和运营依托于多方参与,包括地方政府、高校和科研院所、云服务商、运营商、行业龙头企业等。

政府在智算中心建设中的角色:政府在智算中心的建设和发展中扮演着至关重要的角色,不仅提供政策支持和资金资助,还负责制定行业标准和监管措施。

企业厂商在智算中心建设中的作用:参与智算中心的企业厂商主要提供关键硬件和软件设备,其产品和服务是智算中心运行的基础。

智算中心建设的意义和影响:智算中心的建设是时代经济发展的需要与技术进步的必然结果,对于企业、政府、公共事业和科研机构都具有重要意义。

2.智算产业链正在形成

产业链上游:主要涉及硬件设备和基础设施的生产和开发,包括GPU、ASIC等芯片制造、高性能服务器与存储设备制造、数据与计算中心建设等。

产业链中游:主要云集多种形式的智算服务,包括云计算平台、边缘计算平台、人工智能服务平台、软件开发和集成服务。

产业链下游:主要涉及智能算力的应用,涵盖了工业制造业、医疗保健、金融服务、能源等多个行业和领域。

三、智算芯片是智算产业核心环节,也是全球科技巨头竞逐热点

1.智算芯片是中美科技博弈重要领域,国产智算芯片发展刻不容缓

智算芯片是智算产业的核心环节:智算芯片是智算产业的关键基础,通过优化硬件设计和架构,提高AI算法的运行速度和处理能力,推动整个智算产业的发展,成为产业融合的纽带。

智算芯片成为中美科技博弈的焦点之一:智算芯片在全球范围内具有巨大的市场和经济价值,成为大国科技博弈的焦点之一。美国陆续推出限制性政策限制中国智算芯片的发展,国内AI芯片和半导体行业面临严峻挑战。

国产智算芯片发展刻不容缓:智算芯片是构筑算力的重要基石,对于推动人工智能等技术的发展具有重要意义。中国智能算力未来发展空间巨大,但目前在智算芯片领域仍存在较大差距,发展国产智算芯片是实现技术自主可控、提升安全和核心技术竞争力的必由之路。

2.海外:英伟达目前独大,AMD、微软、特斯拉、谷歌等开始发力

英伟达目前在智算芯片领域独占鳌头:英伟达强大的GPU产品线在深度学习和高性能计算等领域具有广泛应用,在AI和数据中心市场中占据主导地位,通过硬件创新、平台和软件生态建设、合作伙伴关系建立、开源社区建设和教育与研究支持等策略,构建了强大且持续发展的智算芯片生态系统。

AMD在智算芯片领域不断发力:AMD作为英伟达的主要竞争对手,在智算芯片领域不断发力,具备创新和多样化的产品线,通过收购赛灵思加强在FPGA和自适应计算领域的竞争力,提供优化的软件工具包和开发者资源,与主要的OEM合作伙伴和云服务提供商合作,积极推广其EPYC服务器处理器系列。

微软自研芯片垂直整合Azure软硬件:微软发布了首款自家研发的人工智能芯片MicrosoftAzureMaia100加速器和应用于云端软件服务的芯片MicrosoftAzureCobaltCPU,将由台积电代工,采用5nm制程技术,预计将于明年导入微软Azure数据中心,支持OpenAI、Copilot等服务。微软在智算芯片的生态构建上,年智能算力产业发展白皮书(智能算力产业报告)更侧重于整合AI技术到其广泛的服务和平台中。

特斯拉推出FSD芯片以最大化其自动驾驶技术潜力:特斯拉推出了名为“FSD”的自动驾驶芯片,基于自己的神经网络架构,用于实现高级别的自动驾驶功能。特斯拉的智算芯片与其自动驾驶软件紧密集成,确保了软硬件之间的高效协同工作,特斯拉还积极推进Dojo超算集群的研发及建设进程,旨在更好地推动FSD算法升级迭代。

谷歌TPU持续迭代性能升级:谷歌的TensorFlow框架和TPU(张量处理单元)在AI领域布局,TPU已过数次迭代,2023年8月发布的第五代TPUv5e专为提升大中型模型的训练、推理性能以及成本效益所设计,与TPUv4相比大型语言模型提供的训练性能提高了2倍、推理性能提高了2.5倍。谷歌通过云平台GoogleCloud提供TPU加速的机器学习服务,构建了围绕TPUs的综合性AI生态系统。

3.国内:华为、海光信息等科技大厂积极布局,寒武纪、天数智芯等创业型企业纷纷兴起

华为打造全栈自主AI基础软硬件:华为推出基于昇腾系列处理器构建的全栈AI计算基础设施及应用,通过丰富的产品形态打造面向“端、边、云”的全场景AI基础设施方案,涵盖数据中心解决方案、智能边缘解决方案,覆盖深度学习领域推理和训练全流程。华为构建了全栈全生命周期的模型开发工具链,推出异构计算架构CANN和全场景深度学习框架Mindspore,通过AI开发平台ModelArts为开发者提供高效开发、调试和调优大模型应用和场景化应用的能力。

海光DCU依托开放生态加速推广:海光信息推出的DCU产品采用GPGPU路线,具备全精度算力,性能强悍、生态完善,已实现规模化应用,与百度、阿里等头部互联网厂商推出联合方案,打造全国产软硬件一体全栈AI基础设施。海光信息DCU提供自主开放的完整软件栈,兼容“CUDA”、“ROCm”生态,支持主流深度学习框架与应用软件,已实现对大模型的全面应用。

寒武纪云边端协同发展:寒武纪公司专注于人工智能芯片产品的研发与技术创新,推出了多款智能芯片和加速卡,以及训练整机,其思元370系列加速卡在实测性能和能效方面表现出一定优势,软件层面推出CambriconNeuware基础系统软件,支持各主流人工智能编程框架,打破了不同场景之间的软件开发壁垒。

天数智芯立足高性能通用GPU加速构建AI自主生态:天数智芯是中国第一家通用GPU高端芯片及超级算力系统提供商,致力于开发自主可控、国际领先的通用、标准、高性能的通用GPU芯片,构建起全栈式软硬件体系,打造高端算力解决方案。公司产品已全面支持大模型预训练、微调及推理应用,协助国内首批客户完成了大模型在垂直领域的开发及部署,获得了客户高度认可,在多个行业实现落地应用。

瀚博半导体芯片产品聚焦AI加速和视频处理:瀚博半导体自主开发出核心IP和两代GPU芯片,衍生出AI、渲染、视频三大产品线,推出了多款加速卡和显卡。公司通过构建瀚博VUCA软件架构以及与生态和系统的兼容适配,优化用户体验,降低开发者使用的技术门槛,面向开发者提供完整的SDK接口和软件工具,基于瀚博加速卡硬件配套驱动,提供SDK封装,支持主流深度学习及视频开源框架,实现用户应用生态。瀚博联合生态合作伙伴推出一系列端到端场景应用解决方案,涵盖多个领域,为各行各业提供技术支持,构建了庞大而完整的应用生态系统。

4.国内厂商在产品性能差距上正在缩小,但应用生态差距较大

国产智算芯片在性能方面与英伟达的通用GPU的差距正在缩小:虽然在绝对性能上一些国产智算芯片可能还未完全达到英伟达顶级GPU的水平,但差距正在逐步缩小,且在特定应用场景和性价比方面,国产芯片已开始展现出竞争优势。

国产智算芯片在应用生态方面还有很大发展空间:成熟的智算芯片厂商如英伟达等构建了完善的生态系统,包括软件开发工具、应用程序接口、开发者社区等。而国产智算芯片在软件兼容和生态、开发者社区和资源、第三方应用支持、市场认可度等方面还需要更多的发展时间和资源来提升。

四、智算产业发展趋势

1.多元异构算力融合与国产化是方向与趋势

三种算力的应用场景和精度需求:通用算力主要来源于通用处理器CPU,应用场景广泛;超算算力主要支持高精尖科研领域;智算算力主要应用于AI场景。从精度看,算力可分为双精度(FP64)、单精度(FP32/TF32)、半精度(FP16/BF16)及整型精度(INT8/INT4),AI模型训练及推理以单精度、半精度、整型计算精度为主。

异构算力的发展需求和趋势:产业对多元异构算力融合的需求日益增长,异构算力能够协同工作以满足不同场景中的应用需求,实现计算效力的最大化。异构算力的发展呈现出能力开放和统一管理的趋势,目前面临异构芯片适配标准尚需统一、异构硬件移植适配亟待优化、软件生态技术应用相对薄弱等问题。

多元异构算力的整合要求:多元异构算力的整合要求在“横向”和“纵向”两个方向上实现协同发展。在“横向”方面,通用算力、智能算力以及超算算力正在向多元异构的方向发展,满足多样应用需求,各地各主体在算力中心建设中注重构建融合通用计算、智能计算和超级计算的平台。在“纵向”方面,着眼于开放与协同,通过采用开放架构实现对成熟主流软件生态的兼容,支持主流人工智能框架、算法模型、数据处理技术及广泛的行业应用。

智算算力国产化的发展:美国商务部实施AI芯片出口管制,英伟达推出阉割版芯片,我国AI芯片不断迭代发展,性能不断提升,有望持续获益。政府不断出台相关政策推动智算产业国产化发展,华为、海光信息、寒武纪等巨头产品性能日益提升,我国AI芯片国产化比例有望提升。

2.智算建设与东数西算工程将有效融合

东数西算工程的启动和布局:2022年2月,“东数西算”工程正式全面启动,在京津冀、长三角、粤港澳大湾区、成渝、内蒙古等8地启动建设国家算力枢纽节点,规划了10个国家数据中心集群。

东数西算工程需要深化发展的问题:包括缺乏统筹规划、西部数据中心空置率较高、东中西协同机制不足、西部枢纽节点地区绿色电力使用率较低等。

《实施意见》的指导意见和目标:2023年12月,国家发改委等部门发布《实施意见》,从五方面对全国一体化算力网建设提出指导意见,设立了到2025年底的建设目标,强调将国家枢纽节点打造成为国家算力高地,推动各类新增算力向国家枢纽节点集聚,提升国家算力网络的传输效能。

3.通过算力调度,智算由单个节点向多点融合与协同演变

算力调度的机制和意义:国家鼓励探索算力调度运营的机制,算力调度可以实现跨服务商、跨架构、跨地域的算力任务部署和结果交付,对提高计算机资源的利用率、减少资源浪费、保证任务的高效执行有着深远的意义。

算力调度的关键技术:包括算力感知、算力度量、算力路由、算力编排和算力交易。

算力调度面临的挑战和应对措施:算力调度面临跨服务商、跨架构、跨地域的三大挑战,以及各地自行建设算力调度中心整合难度大调度难统一的问题。国家超算互联网工作启动,多地政府先试先行打造算力调度平台、枢纽城市,诸多主体单位积极投入算力调度平台开发,探索算力调度运营模式。

4.智算中心低碳化发展需要算力-电力协同

国家对数据中心的要求和算电协同的重要性:数据中心已成为电力的消耗大户,在“双碳”目标下,国家对数据中心集群的电能使用效率和可再生能源利用率有更严格的要求,推动算力、电力统筹规划,东数西算、东电西送有机协同是实现双碳目标的重要路径。目前,电是制约算力设施发展的主要矛盾,算力-电力协同的重要性日益显现。

算力-电力协同的概念和层次:算力-电力协同是指通过数据中心的灵活用能,赋能电力系统源网荷深度互动,建立“五力协同”机制,让算力端和电力端都能实现高效协同与融合发展。算电协同可划分为算力节点与区域电网协同、算力网与电力网协同、算力市场与电力市场协同三个层次。

推进算电协同的措施和意义:推进算电协同有助于数据中心节能降耗,解决绿色电力使用率低的问题,是建立全国一体化算力网络的必不可少的举措。国务院印发的《实施意见》就算力与电力的协同问题做出重要指示,河南、甘肃等地方也就算电一体化协同发展先行先试。

五、优秀案例介绍

1.中科曙光

公司概况和产品布局:中科曙光是我国核心信息基础设施领军企业,拥有完整的IT基础架构产品线,包括高端计算机、存储、网络安全等产品,并形成全栈云服务能力。

积极推进5A级智算中心建设:中科曙光5A级智算中心以“开放、融合、绿色、普惠、服务”为特质,构筑全场景智能计算服务体系,引领AI技术与各行各业深度融合。公司承建的智算中心采用众多前沿技术,积极参与智算中心行业标准建设,同时布局建设了“全国一体化算力服务平台”。

深化产业链上下游合作:中科曙光积极在产业链上下游开展生态建设工作,携手合作伙伴开展多方面的合作,构建开放协同的生态体系,推进协同发展模式,加强产学研协同创新,与生态伙伴共建数字经济的标杆项目。

2.广州数字科技集团

公司概况和产业格局:广州数字科技集团以电子信息制造业起家,逐步形成以人工智能和数字经济为核心的多元化产业格局。广电运通是集团培育的A股上市公司,是行业人工智能业务板块的主力军,布局算法、算力、数据、场景四大人工智能要素协同发展,打造“望道”行业大模型。

控股广电五舟,深化国产算力布局:广电运通入股并拟进一步控股广电五舟,广电五舟是智能算力产品和解决方案提供商,受益于国产算力产业推进,整体发展态势良好。广电运通将紧抓国产算力市场机遇,强化市场竞争力。

共建“鲲鹏 昇腾”项目,构筑广东计算产业生态:广州数字科技集团与华为签署合作协议,成立“鲲鹏 昇腾”生态创新中心,广电运通基于华为处理器进行AloT的战略算力布局,实现多行业场景落地,助力计算产业生态发展。

卡位大湾区智算中心建设,部署算力“新基建”:广州数据集团旗下公司建设运营广州人工智能公共算力中心,广电运通中选该中心项目,中心采用公司自主研发的算力运营平台,资源使用率较高。广电运通注重云能力培育,在云服务领域实现重大突破,同时全面布局数据要素业务,构建数据价值化全链条。

六、智算发展展望与政策建议

1.加强智算资源整合与布局优化:加快推动异构、异属、异域智能算力资源整合并网,加强智算中心整体布局优化,结合“东数西算”工程,加强东西部地区智算产业协同建设。

2.加快培育国产软硬件生态:推动国产软硬件厂商开放协同,实现芯片、算法、模型、应用的融合创新,提升人工智能算力供给的国产化率,

免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052

分享:

扫一扫在手机阅读、分享本文

最近发表