基本信息
文件名称:行业大模型训练实践测试卷及答案.docx
文件大小:29.96 KB
总页数:24 页
更新时间:2025-11-09
总字数:约8.06千字
文档摘要
行业大模型训练实践测试卷及答案
无监督学习语料的规模约为多少?[单选题]*
A.5Btokens
B.10Btokens(正确答案)
C.15Btokens
D.20Btokens
答案解析:
无监督学习语料由书籍、期刊、专利等行业通识信息经处理后形成,规模约10Btokens。
SFT问答对的规模约为多少?[单选题]*
A.几十万
B.几百万(正确答案)
C.几千万
D.几亿
答案解析:
SFT问答对用于强化模型多种能力,规模约百万,即几百万级别。
版面分析区域划分使用什么算法对文档图像元素进行定位和分类?[单选题]*
A.低精度目标检测算法
B