DeepSeek
消费电子行业大模型新型应用最佳实践分享
陈树荣
腾讯云智能商业化
2025.03
大模型产业生态图
大模型产业链上的生态,根据大模型生态上不同企业的定位,分成了四个等级的企业:
……
?自研大模型结构的企业LEVEL1
研发模型结构
LEVEL2
?研发预训练模型的企业研发预训练模型……
?基于自己数据SFT做自己模型的企业LEVEL3
?基于开源或者基于国内预训练模型结基于模型SFT
合自己数据进行微调的企业……
LEVEL4
?不用训练,直接调
用大模型API的企业直接调用……
国内外大模型百花齐放
国外头部
国内大厂
国内创业明星
全球开源社区
DeepSeek推动国产模型达到新的高度
DeepSeek是“深度求索”开发的一系列人工智能模型。DeepSeek通过持续的技术创新
和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了
广泛认可。其中:
●DeepSeek-V3是在14.8万亿高质量token上完成预训练的一个强大的混合专家(MoE)
语言模型,拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任
务(知识问答、内容生成等)领域表现出色。
●DeepSeek-R1是基于DeepSeek-V3-Base训练生成的强化推理能力模型,在数学、代
码生成和逻辑推断等复杂推理任务上表现优异。
更低的研发成本*更高效资源利用开源模型比肩头部闭源
$5.6Mvs.OpenAI’s使用~2,000GPUs,竞品使用60%+指标优于
$100M+10,000+GPUsLlama3.1Claude-3.5GPT-
4o
打破大模型技术壁垒人工智能的Sputnik时刻
重挫美国科技公司股价,英伟被美国及其盟友列入各种限制
达市值下跌5900亿
大模型时代企业AI项目“烟囱式”建设痛点越发严重
智能化趋势下:多品牌多场景下的重复造车轮,导致模型算法和镜像等AI资产管理分散,无法沉淀复用和统一运用。
投资浪费适应性差项目周期长底层统一上层统一中层异构
业务系统A业务系统B业务系统C
业务系统A业务系统B业务系统C
对外出入口A对外出入口B