基本信息
文件名称:DeepSeek消费电子行业大模型新型应用最佳实践分享.pdf
文件大小:9.12 MB
总页数:28 页
更新时间:2025-03-30
总字数:约1.56万字
文档摘要

DeepSeek

消费电子行业大模型新型应用最佳实践分享

陈树荣

腾讯云智能商业化

2025.03

大模型产业生态图

大模型产业链上的生态,根据大模型生态上不同企业的定位,分成了四个等级的企业:

……

?自研大模型结构的企业LEVEL1

研发模型结构

LEVEL2

?研发预训练模型的企业研发预训练模型……

?基于自己数据SFT做自己模型的企业LEVEL3

?基于开源或者基于国内预训练模型结基于模型SFT

合自己数据进行微调的企业……

LEVEL4

?不用训练,直接调

用大模型API的企业直接调用……

国内外大模型百花齐放

国外头部

国内大厂

国内创业明星

全球开源社区

DeepSeek推动国产模型达到新的高度

DeepSeek是“深度求索”开发的一系列人工智能模型。DeepSeek通过持续的技术创新

和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了

广泛认可。其中:

●DeepSeek-V3是在14.8万亿高质量token上完成预训练的一个强大的混合专家(MoE)

语言模型,拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任

务(知识问答、内容生成等)领域表现出色。

●DeepSeek-R1是基于DeepSeek-V3-Base训练生成的强化推理能力模型,在数学、代

码生成和逻辑推断等复杂推理任务上表现优异。

更低的研发成本*更高效资源利用开源模型比肩头部闭源

$5.6Mvs.OpenAI’s使用~2,000GPUs,竞品使用60%+指标优于

$100M+10,000+GPUsLlama3.1Claude-3.5GPT-

4o

打破大模型技术壁垒人工智能的Sputnik时刻

重挫美国科技公司股价,英伟被美国及其盟友列入各种限制

达市值下跌5900亿

大模型时代企业AI项目“烟囱式”建设痛点越发严重

智能化趋势下:多品牌多场景下的重复造车轮,导致模型算法和镜像等AI资产管理分散,无法沉淀复用和统一运用。

投资浪费适应性差项目周期长底层统一上层统一中层异构

业务系统A业务系统B业务系统C

业务系统A业务系统B业务系统C

对外出入口A对外出入口B