基本信息
文件名称:数据资产全过程管理:解锁DeepSeek智能引擎.pptx
文件大小:11.25 MB
总页数:67 页
更新时间:2025-03-14
总字数:约6.38千字
文档摘要
数据资产全过程管理——解锁DeepSeek智能引擎演讲嘉宾:林建兴时间:2025年2月5日
混合专家(MoE)架构DeepSeek-V3拥有6710亿参数,但在实际运行中,每个输入仅激活370亿参数,这种选择性激活的方式大大降低了计算成本,同时保持了高性能↓高效的训练框架多头潜在注意力(MLA)01采用HAI-LLM框架,支持16-wayPipelineParallelism(PP)、64-wayExpertParallelism(EP)和ZeRO-1DataParallelism(DP),并通过多种优化手段降低了训练成本该架构在Deep