基本信息
文件名称:2025年AITokenizers练习模拟试卷.docx
文件大小:40.56 KB
总页数:9 页
更新时间:2025-10-25
总字数:约6.3千字
文档摘要

2025年AITokenizers练习题

考试时间:______分钟总分:______分姓名:______

一、选择题(每题2分,共20分)

1.下列哪一项不是SubwordTokenization的主要优势?

A.能够有效地表示未见过的词汇。

B.通常比全词Tokenization需要的词汇表更小。

C.总是能产生比全词Tokenization更少的Token数量。

D.可以捕获单词内部的语义信息。

2.在HuggingFace`Transformers`库中,`[CLS]`特殊Token通常用于什么目的?

A.