基本信息
文件名称:DeepSeek新一代大模型的探讨20260111.pdf
文件大小:250.14 KB
总页数:5 页
更新时间:2026-01-25
总字数:约7.73千字
文档摘要
一、新一代大模型核心技术架构
一、新一代大模型核心技术架构
DeepSeek新一代大模型基于MHC架构,该架构是在字节HC框架基础上的继承性
DeepSeek新一代大模型基于MHC架构,该架构是在字节HC框架基础上的继承性
创新,核心目标是解决国内未来三到五年在算力与数据上限上与美国企业的差距问
创新,核心目标是解决国内未来三到五年在算力与数据上限上与美国企业的差距问
题。其核心优势在于通过更小参数规模实现更强性能,例如可通过千亿参数模型达
题。其核心优势在于通过更小参数规模实现更强性能,例如可通过千亿参数模型达
到五千亿参数模型的效果,体现了算法与基建的联合优化思路。