基本信息
文件名称:《自然语言处理:基于预训练模型的方法》 课件03-基础工具集与常用数据集.pptx
文件大小:7.53 MB
总页数:15 页
更新时间:2026-03-02
总字数:约1.72千字
文档摘要
基础工具集与常用数据集
2
HARBININSTITUTEOFTECHNOLOGY
基础工具集与常用数据?
NLTK
LTP
PyTorch
基础工具集
Wikipedia
CommonCrawl
常用数据集
3
HARBININSTITUTEOFTECHNOLOGY
NLTK
NaturalLanguageToolkit
/
多种语料库和词典资源
生文本、PennTreebank样例
WordNet
基本的自然语言处理工具集
分句
标记解析
词性标注
句法分析
更多英文自然语言处理工具集
CoreNLP、spaCy等
4
HARBININSTITUTEOFTECHNO