基本信息
文件名称:2025年AITokenizers模拟练习试卷.docx
文件大小:39.76 KB
总页数:7 页
更新时间:2025-10-25
总字数:约4.44千字
文档摘要
2025年AITokenizers模拟练习
考试时间:______分钟总分:______分姓名:______
一、选择题
1.在自然语言处理中,将文本切分成更细粒度单元(如单词、子词)的过程通常称为?
A.分句
B.分词
C.分块
D.标注
2.下列哪一项不是AITokenizers库中常见的特殊标记?
A.[PAD]
B.[CLS]
C.[SUB]
D.[UNK]
3.当输入文本长度超过指定`max_length`时,AITokenizers的`encode`方法默认会执行什么操作?