《Serverless+AI系列》标准解读
报告人:雷昊
2025年6月
目录
01.
标准编制思路及主要内容
下一步工作计划
标准编制背景
03.
02.
PartOne
标准编制背景
2025年5月,工信部发布《算力互联互通行动计划》,该计划提出到2026年建立较为完备的算力互联互通标准、标识和规则体系;到2028年基本实现全国公共算力标准化互联。
2023年12月,国家发改委等5部门联合印发《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,提出到2025年底,普惠易用、绿色安全的综合算力基础设施体系初步成型,东西部算力协同调度机制逐步完善等目标。
政策、市场交织驱动,Serverless标准体系亟需深化完善(1/2)
n与国家政策内涵异曲同工,弹性架构激活普惠算力新范式。
从用户角度看,无论是算力互联互通还是Serverless,在资源测都能够提供“无限”算力,无需担心资源数量的问题。
?算力互联互通是一个巨大的Serverless资源池。
?Serverless平台是一个微观的算力互联互通平台。
算力互联互通通过整合算力资源经过统一调度平台提供算力服务。
Serverless服务提供商为用户屏蔽底层资源限制,按量付费。
Serverless
平台
统一调度
算力
中心A
算力
中心B
算力
中心X
代
码
nAI与Serverless的双向赋能:互为驱动,共创未来
政策、市场交织驱动,Serverless标准体系亟需深化完善(2/2)
《2025中国Serverless用户调查》:是否考虑Serverless方式承载AI任务
当智能无需服务器:AI×Serverless的共生方程式
nServerless内涵愈加丰富:历经数十年发展,Serverless已从早期的函数即服务扩展至容器、边缘计算与AI等全场景能力,成为云原生应用构建的重要基础。
n与AI协同发展的必然趋势:人工智能的发展对弹性算力与事件驱动提出新要求,Serverless天然契合其特性,正成为新一代智能应用的重要承载形态。
Serverless形态逐渐丰富(2018年–2022年)
Serverless拓展至容器、PaaS和边缘计算,服务形态更加多样。例如,阿里云SAE、华为云CCI、GoogleCloudRun等容器化产品发布;Knative成为CNCF孵化项目;各厂商上线
Serverless应用托管与边缘服务,如AWSAppRunner、FastlyCompute@Edge。
Serverless加速融合人工智能(2023年至今)
Serverless加速与大模型、AI推理、异构算力融合,推动智
能化应用部署。例如,AWS、阿里云、百度智能云等推出
AIServerless服务,支持模型弹性推理与自动扩缩,广泛应
用于AIGC、模型服务化等新兴场景。
Serverless概念开始发酵(2006年–2012年)
2006年,Fotango推出Zimki平台提供按需服务;2012年Iron.io副总裁首次提出
“Serverless”概念。Serverless理念初步形成,开始探索将服务器管理抽象化,尝试实现资源的按需使用与自动伸缩。
Serverless进入快速发展期,函数即服务(FaaS)成为主流,开源生态初步形成。例如,2014年AWS推出Lambda,IBM、Google、Microsoft陆续发布FaaS产品;国内云厂商开始布局;AWSFargate、Lambda@Edge等推动Serverless向容器与边缘场景延伸。
Serverless迅猛发展(2014年–2018年)
PartTwo
标准编制思路及主要内容
n“Serverless+AI”系列标准聚焦AI发展对Serverless的影响,梳理AI应用对弹性计算、异构算力支持、模型调用等方面提出的新需求,从计算资源、应用管理、模型管理三大维度切入,明确Serverless平台在支撑AI场景下所需具备的技术能力和服务规范。
n适用于为Serverless平台的设计提供参考,也适用于衡量已有Serverless平台的建设水平。
2025年2月初:
发布“AI+Serverless”体系研究工作启动新闻,正式启动相关研究工作
2025年2月-2025年3月:
针对近10家单位开展点对点调研走访,梳理行业现状