基本信息
文件名称:2025年AITokenizers模拟练习试卷.docx
文件大小:39.76 KB
总页数:7 页
更新时间:2025-10-25
总字数:约4.44千字
文档摘要

2025年AITokenizers模拟练习

考试时间:______分钟总分:______分姓名:______

一、选择题

1.在自然语言处理中,将文本切分成更细粒度单元(如单词、子词)的过程通常称为?

A.分句

B.分词

C.分块

D.标注

2.下列哪一项不是AITokenizers库中常见的特殊标记?

A.[PAD]

B.[CLS]

C.[SUB]

D.[UNK]

3.当输入文本长度超过指定`max_length`时,AITokenizers的`encode`方法默认会执行什么操作?