专访华为云尚海峰:践行深度用云,打造韧性智能的混合云底座
【环球网科技报道记者张阳】在当前经济发展形势下,数字经济是经济发展中创新最活跃、增长速度最快、影响最广泛的领域,对增强发展新动能、提升发展韧性、畅通发展循环具有重要作用,成为助力高质量发展的核心动力。
根据“中国信通院”发布的《中国数字经济发展研究报告(2024年)》数据显示:我国数字经济规模扩张稳步推进,2023年,我国数字经济规模达到53.9万亿元,较上年增长3.7万亿元。
在这场数字化转型的浪潮中,无论是政府部门还是企业早已发现,要想搭上数字经济这趟高速列车,“深度用云”毫无疑问是“必经之路”。特别是国企改革政策在推动企业上云、优化资源配置方面发挥了重要作用,为数字化转型提供了政策支持和方向指引。近年来,国家层面相继出台了一系列政策文件,如《关于加快推进国有企业数字化转型工作的通知》和《“十四五”数字经济发展规划》等,明确提出要加快推进国有企业数字化转型,推动企业上云、上平台,加快企业数字化转型步伐。这些政策不仅为政企客户提供了明确的转型方向和路径,还通过政策引导、资金扶持、技术支持等多种方式,为企业数字化转型提供了有力保障。
伴随着全行业数字化、智能化进程的不断加速,政企已迈向深度用云新阶段,进一步发挥云的价值、赋能业务创新。当下,混合云已成为政府和大型企业数字化转型的首选底座。
9月19日,华为全联接大会2024期间,以“践行深度用云,跃迁新高度”为主题的全球混合云基础设施峰会2024上,华为主机上云军团CEO、混合云总裁尚海峰正式发布华为云Stack8.5。新版本新增主机上云方案,并重点加强大模型混合云场景化能力。尚海峰认为,“核心业务云化和生产智能化正成为政企深度用云的两大主要路径。华为云Stack将从韧性和智能两个方向创新,引领混合云突破新高度,加速政企数智化跃迁。”
华为主机上云军团CEO、混合云总裁尚海峰
攻克主机上云难题,首先解决系统韧性
随着企业云化的深入,核心业务上云已成为全面云化的最后一块拼图,也是通向全面智能化的必经之路。其中大型机以极致的可靠性、可用性和可维护性,支撑核心业务的稳定运行,也被称作核心中的核心。但是,核心系统整体向云化架构升级演进挑战巨大,涉及硬件、软件、安全、运维、调优和工具等多方因素,是一个软硬协同、端到端的系统工程。
“这也就是为什么华为在今年成立了主机上云军团,聚集计算、存储、网络、云和中央研究院最核心的研发资源开展系统性创新,充分发挥软硬协同的优势,挑战主机上云这一世界级难题。一方面,持续构筑自主创新的技术体系,保障核心技术供应的连续性。另一方面,构建从基础设施、实施工艺到运维体系的端到端系统工程能力,打造云上新核心。”尚海峰解释说。
华为云Stack8.5的特性提升一大重点就是新增主机上云解决方案,解决主机系统改造上云后的可靠性和可用性问题。毕竟如果企业的核心业务发生宕机对企业的业务连续性来说无疑是一场灾难。
在高可用方面,华为基于分布式云底座构建了秒级感知硬件故障的能力,2秒内发现硬件故障;基于弹性负载均衡、金融级调度和事务处理等分布式中间件,支持业务单元化部署和多地多活容灾;结合GaussDB分布式数据库故障6s内无感切换,构筑云上5个9的金融级高可用。
在易运维方面,专访华为云尚海峰:践行深度用云,打造韧性智能的混合云底座方案以1分钟发现、5分钟定界、10分钟恢复为目标,打通软硬件的壁垒,从应用、云服务、云平台到硬件全链路秒级发现故障和分析影响,实现全链路可观测;同时建立数据链、交易链、部署链故障快速智能定界能力,让大规模集群运维更加高效;此外,基于混沌工程挖掘未知风险,识别系统薄弱环节,持续提升系统韧性。
在更敏捷方面,相较于传统集中式架构,主机上云能够实现资源的动态管理和弹性调度,配合华为云软件开发生产线CodeArts,能够大幅提升应用开发效率,让业务更敏捷。特别是在升级技术,尚海峰则笑谈,有客户开玩笑说过去是“两年升一次,一次升两年”,为解决这一难题,华为首创操作系统原地无感升级技术,升级过程无需迁移虚拟机,支持批量并行升级,千级宿主机节点升级时间从数十天缩短到5个小时内,大幅提升平台演进效率。
此外,尚海峰还介绍,华为充分发挥软硬协同优势,通过硬件网卡虚拟化直通技术和多核免锁技术,将负载均衡单次转发时延降低了83%,单集群转发带宽提升到400Gb;其次流量直通容器将两层网络变一层,时延降低40%;并且引入了RoCE网络和NoF 协议的组合,端到端降低50%的存储时延,为客户带来极致的性能体验。在安全方面,结合GaussDB全密态数据库和鲲鹏TEE可信计算空间,在防止数据泄漏的同时将性能损耗降低到20%以内
尚海峰表示,“华为通过根技术创新和经验沉淀,打造主机上云的可信新标准的愿景。希望通过这些努力,将核心系统韧性推向新高度,为世界提供一个更优的选择。”
大模型落地关键:让技术易用,让场景变简单
作为现代科技发展的前沿趋势,AI大模型技术正深刻改变着各行各业的面貌。依托云计算的强大算力与存储能力,从自然语言处理到图像识别,从智能推荐到预测分析,云上应用大模型以其卓越的性能和灵活性,为企业数字化转型、科研创新以及个人生活智能化提供了强有力的支撑。
大模型在行业落地的关键在于让技术易于使用和让场景变得简单。为了实现这一目标,华为在今年6月发布了大模型混合云十大创新技术,这些技术从基础设施、算法架构和工程能力等多个维度进行了创新,旨在降低技术使用门槛,让大模型技术更加普及和易用。
为了进一步推动AI的工程化落地,华为推出了ModelArtsStudio工程工具套件。该套件包含数据、模型和应用三大模块,通过多形态数据获取、智能清洗标注、智能数据配比等技术,将数据开发和标注效率提升了10倍,并显著提高了数据质量。模型工程套件结合了盘古大模型的实践经验,提供了高效的训练方法和0代码开发能力,使得大模型开发变得更加简单。
而面向应用场景,华为云还发布大模型混合云TopN场景。据了解,这些应用场景首批面向5大行业,共计发布20个领域、80多个行业场景基线。尚海峰提到,“本次发布的场景基线都是基于已落地的项目,有方案、有服务、有伙伴,能够广泛推广和复制。未来将保持每年两次的更新频率,持续把更多的场景、更好的方案带给客户。”
“比如在钢铁行业的热轧生产线。从钢坯到钢板的轧制是一个复杂的工艺,需要工程师耗费5天,完成20道工序并调整产线300多个参数。而现在我们基于数据工程套件帮助客户打造包含时序数据、工艺参数在内的高质量数据集,通过盘古预测大模型进行预训练,只需要3-4小时就可以完成参数的精准预测。目该方案已在宝钢上线,将钢板预测精度提高5%,成材率提升0.5%。”尚海峰为记者举例说。
在峰会现场的展示区,记者也看到类似的场景案例在石油、矿山、金融、政务等领域比比皆是。尚海峰说:“我们坚持AIforindustries的理念,希望基于华为云Stack和盘古大模型的强大能力与经验,把智能推向新高度,让每个企业都拥有自己的专属大模型。”
通过这些创新举措和实践成果,华为云Stack为企业提供更高效、智能的解决方案,助力数字化转型和智能化升级。“华为云Stack从场景出发,通过一个混合云底座,就能满足政企用户在数据、容器、AI等多样性算力的需求。”尚海峰如此总结道。