基本信息
文件名称:数据资产全过程管理解锁DeepSeek智能引擎(67页PPT).pptx
文件大小:11.14 MB
总页数:67 页
更新时间:2025-08-19
总字数:约6.31千字
文档摘要
数据资产全过程管理——解锁DeepSeek智能引擎演讲嘉宾:林建兴时间:2025年2月5日
混合专家(MoE)架构DeepSeek-V3拥有6710亿参数,但在实际运行中,每个输入仅激活370亿参数,这种选择性激活的方式大大降低了计算成本,同时保持了高性能↓高效的训练框架多头潜在注意力(MLA)01采用HAI-LLM框架,支持16-wayPipelineParallelism(PP)、64-wayExpertParallelism(EP)和ZeRO-1DataParallelism(DP),并通过多种优化手段降低了训练成本该架构在Deep