基本信息
文件名称:Serverless+AI系列标准解读.docx
文件大小:8.06 MB
总页数:37 页
更新时间:2025-06-14
总字数:约8.89千字
文档摘要

《Serverless+AI系列》标准解读

报告人:雷昊

2025年6月

目录

01.

标准编制背景

02.

标准编制思路及主要内容

03.

下一步工作计划

PartOne

标准编制背景

政策、市场交织驱动,Serverless标准体系亟需深化完善(1/2)

n与国家政策内涵异曲同工,弹性架构激活普惠算力新范式。

2025年5月,工信部发布《算力互联互通行动计划》,该计划提出到2026年建立较为完备的算力互联互通标准、标识和规则体系;到2028年基本实现全国公共算力标准化互联。

2023年12月,国家发改委等5部门联合印发《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,提出到2025年底,普惠易用、绿色安全的综合算力基础设施体系初步成型,东西部算力协同调度机制逐步完善等目标。

代码统一调度

Serverless

算力算力中心B

算力

算力

中心B

算力

中心X

中心A

算力互联互通通过整合算力资源经过统一调度平台提供算力服务。Serverless服务提供商为用户屏蔽底层资源限

算力互联互通通过整合算力资源经过统一调度平台提供算力服务。

从用户角度看,无论是算力互联互通还是Serverless,在资源测都能够提供“无限”算力,无需担心资源数量的问题。

?算力互联互通是一个巨大的Serverless资源池。

?Serverless平台是一个微观的算力互联互通平台。

政策、市场交织驱动,Serverless标准体系亟需深化完善(2/2)

nAI与Serverless的双向赋能:互为驱动,共创未来

01

01AI驱动下Serverless的刚需

AI应用开发周期长、资源浪费及高运维成本问题, 推动市场依赖Serverless轻量化弹性架构,实现资 源按需分配与自动伸缩,降低开发门槛与闲置损耗。

根据中国信通院发起的2025中国Serverless用户调查数据显示:

超六成调查用户所在团队已经或考虑使用

Serverless架构承载AI任务。

《2025中国Serverless用户调查》:是否考虑Serverless方式承载AI任务

02

02AI增强Serverless能力

AI技术深度参与Serverless资源调度策略,通过动态学习与预测能力优化资源利用率及系统稳定性,形成双向驱动的技术闭环。

某企业自主创新的FoldFormerAI模型可在线持续预测用户业务负载,提前进行实例预热,达到85%~95%准确率,大大降低了冷启动概率。

数据来源:Netty之家

当智能无需服务器:AI×Serverless的共生方程式

nServerless内涵愈加丰富:历经数十年发展,Serverless已从早期的函数即服务扩展至容器、边缘计算与AI等全场景能力,成为云原生应用构建的重要基础。

n与AI协同发展的必然趋势:人工智能的发展对弹性算力与事件驱动提出新要求,Serverless天然契合其特性,正成为新一代智能应用的重要承载形态。

Serverless迅猛发展(2014年–2018年)

Serverless进入快速发展期,

Serverless进入快速发展期,函数即服务(FaaS)成为主流,开源生态初步形成。例如,2014年AWS推出Lambda,IBM、Google、Microsoft陆续发布FaaS产品;国内云厂商开始布局;AWSFargate、Lambda@Edge等推动Serverless向容器与边缘场景延伸。

Serverless加速与大模型、AI推理、异构算力融合,推动智

02能化应用部署。例如,AWS、阿里云、百度智能云等推出

02

AIServerless服务,支持模型弹性推理与自动扩缩,广泛应

01用于AIGC、模型服务化等新兴场景。

01

0304

03

04

Serverless概念开始发酵(2006年–2012年)

2006年,Fotango推出Zimki平台提供按需服务;2012年Iron.io副总裁首次提出

“Serverless”概念。Serverless理念初步形成,开始探索将服务器管理抽象化,尝试实现资源的按需使用与自动伸缩。

Serverless形态逐渐丰富(2018年–2022年)

Serverless拓展至容器、PaaS和边缘计算,服务形态更加多样。例如,阿里云SAE、华为云CCI、GoogleCloudRun等容器化产品发布;Knative成为CNCF孵化项目;各厂商上线

Se