基本信息
文件名称:大模型原生安全构建之路2024.pdf
文件大小:2.27 MB
总页数:35 页
更新时间:2025-05-28
总字数:约1.72万字
文档摘要

百度大模型原生安全

构建之路

演讲人:冯景辉

百度/安全平台副总经理安全风控负责人

你是否也遇到过这样的困扰?

目录

CONTENT

01大模型安全的挑战02大模型安全的演进

S

03开始原生安全之路04关注智能体安全

大模型安全挑战

大模型全生命周期中遇到的不同挑战

大模型安全面临的全生命周期挑战

在构建大模型服务时,百度将大模型全生命周期划分为三个关键阶段:训练阶段、部署阶段、以及业务运营阶段,

在各业务阶段面临的安全风险、以及挑战各有不同:

大模型训练阶段.大模型部署阶段.大模型业务运营阶段.

企业自有数据如何在保障数据大模型部署时如何防止模大模型服务在运营阶段,如何保障接

安全与隐私的前提下,实现大型窃取与泄漏?口安全、投毒反馈等黑产攻击?如保

模型的精、推理、共建?障提问内容、输出内容安全?

010203

大模型训练阶段的安全挑战

训练数据选择与清洗是大模型成败的关键!

数据选择数据清

识别与去除价值观不符、偏见歧视等内

准确性,多样性之间如何平衡?

语料数据的血缘分析,帮助我们厘清数据

归属与知识产权识别个人信息,隐私信息,肖像权等

如何对训练数据做质量评估?

训练数据中商标、著作、专利等识别

大模型训练与部署阶段的安全挑战

数据安全与模型保护

数据型是企业的核心资产和

内部人员恶意删除数据数据未加密导致大量数据泄露

竞争力:互联网公开数据、企业自

某公司员工罗某因对离职待遇不数据删除数据泄露某生物技术有限公司存在数据泄露情

满,利用在公司工作时获知的公司况,其委托的另一软件公司研发的“基有数据(原始语料数据、标注数据、

云服务器账号和密码,私自删除公因外显子数据分析系统”,包含公民信

司存放于云服务器后台的数据,公息、技术等信息,涉及泄露数据总量达精数据)、企业采购数据

司因数据无法恢复向合作方赔付经数据安全