基本信息
文件名称:2024年全国一体化算力网应用优秀案例集.pptx
文件大小:5.92 MB
总页数:55 页
更新时间:2025-06-05
总字数:约6.84千字
文档摘要

3;一、多元算力一体化布局;;算网一体化调度,算力交易等核心功能,通过“算力调度服

务”相关认证,不仅可以促进跨主体、跨地区、跨架构的算力互联互通,而且能够优化算力资源配置效率、增强多场景适应能力。目前,息壤已接入智算算力22EFlops,纳管适配多种智算芯片,支撑北京区域近200家企事业单位数字化、智能化转型升级,产生了良好的经济社会效益。;性工具库、数据集、应用软件库等,实现了连接上游270余

家各类应用服务商、下游100余个行业的软件生态构建,支

撑了1000余个应用场景的算力需求,促进算力供需方的高效对接,推动算力广泛应用。

三是支撑了算力应用领域的标准化体系建设。规范算力的接入、调度、服务和运营等,发布《超算互联网白皮书》,完成多项国家标准、团体标准的立项和研制,积极推动我国算力服务标准化发展。

截至目前,超算互联平台发布算力商品6000余款,服

务用户超10万个,形成算力多元、领域全面、高效运行的服务平台,促进我国算力资源的网络化、普惠化、标准化发展,支撑构建全国一体化算力网建设。;申报单位:临港算力(上海)科技有限公司

针对当前国内算力供给存在多元组合算力交付周期长、算力资源分散难以被集中调用等问题,临港算力(上海)科技有限公司与长三角国家枢纽节点上海青浦集群加强业务协同,通过一系列工程和技术创新实践,提升枢纽节点集约化成效。

一是建设创新型的“两弹一优”基础设施。临港算力网通过弹性供电、弹性供冷、机房气流组织优化的“两弹一优”,实现多元算力组合快速交付。弹性供电方面,通过机柜设备的“小母线+弹性方舱”配电系统,一舱解决不同客户集群部署模式带来的机柜功率变化需求。弹性供冷方面,采用冷冻水系统、热管多联系统、液冷系统等多种数据中心冷却手段,统筹预留基础设施管井及接口,实现制冷技术弹性应用。机房气流组织优化方面,通过流体动力学模拟计算机架和机房的气流组织,精细化设计冷热通道,开展建设性设计和周期性优化,综合提升供冷效率。;图1弹性制冷循环系统与能效分布图

二是通过创新性??究解决行业难点问题。通过使用中距

离跨区RDMA(远程直接内存访问)进行市内算力组网,解决算力资源分散无法被集中调用的问题。通过使用跨区RDMA协议和广域拓扑感知并行策略,对跨数据中心大模型训练提出针对性模型训练策略建议,为客户提供合适的解决方案,提升训练效率。联合国内算力上下游生态合作伙伴为客户提供适配测试服务。

自2023年9月投入运营以来,建设大规模商用液冷资源池,通过“两弹一优”实践创新解决机柜功率的变化需求,支持单列机柜功率密度从8kW到48kW之间灵活适配。目前,跨区RDMA组网已完成128、512卡30KM对比验证,训练效率可达单集群的95%以上,完成5家大模型训练性能测试,支撑星辰115B等基础大模型平稳训练,集群可用率达到90%以上。;一是汇聚三异智算算力资源,实现多元算力协同。智算

算力网AI开发平台汇聚异构异属异域的三异智算算力资源,通过代理与适配两种并网模式构建一个全局可用的智算算力资源域,基于协同调度服务,实现智算算力资源的全局共享,构建了南京、昆山与郑州三地的智算算力网。;用相比成本降低50.96%。;融合一体化发展,打造了覆盖全省的一体化算力网工程,实

现了多元算力的高效汇聚、纳管和服务。

一是突破算网融合技术壁垒,打造高性能算网平台。山东省计算中心加快推进长距无损网络通信、跨域算网资源全局调度等关键技术研发应用,成功推动“山东算网”平台上线,实现5种算力架构、3类12种算力集群、5类存储系统的接入和感知,支持大数据、人工智能、高性能计算等融合计算场景。

二是构建区域一体化算网体系,积极融入国家算力枢纽。建成以济南—青岛超算为两大核心节点、连接山东16市骨

干节点和100余个边缘节点的省域算力网络,接入天津超算、鹏城云脑等国家级算力平台,融入京津冀、粤港澳大湾区、甘肃、宁夏、内蒙古等算力枢纽节点建设,实现与枢纽节点的算力共享。

三是融合跨域异构算力资源,推动算网赋能千行百业。汇聚融合全省16地市及周边省份算力资源,提供多元化算力服务,入网算力中心资源利用率平均提升40%,赋能海洋、空天、环保、教育、数字政府、人工智能等领域1000多个应用场景,打造算力产业链多元协同运营管理模式,构筑算网服务生态。

山东省计算中心“山东算网”平台汇聚了全省高性能算力、智能算力,提供行业数据集9PB、模型算法90种、计算;软件1500余款等全要素算网服务,累计服务各类行业用户

3000余家,直接经济效益10