基本信息
文件名称:行业大模型训练实践测试卷及答案.docx
文件大小:29.96 KB
总页数:24 页
更新时间:2025-11-09
总字数:约8.06千字
文档摘要

行业大模型训练实践测试卷及答案

无监督学习语料的规模约为多少?[单选题]*

A.5Btokens

B.10Btokens(正确答案)

C.15Btokens

D.20Btokens

答案解析:

无监督学习语料由书籍、期刊、专利等行业通识信息经处理后形成,规模约10Btokens。

SFT问答对的规模约为多少?[单选题]*

A.几十万

B.几百万(正确答案)

C.几千万

D.几亿

答案解析:

SFT问答对用于强化模型多种能力,规模约百万,即几百万级别。

版面分析区域划分使用什么算法对文档图像元素进行定位和分类?[单选题]*

A.低精度目标检测算法

B