基本信息
文件名称:《自然语言处理:基于预训练模型的方法》 课件03-基础工具集与常用数据集.pptx
文件大小:7.53 MB
总页数:15 页
更新时间:2026-03-02
总字数:约1.72千字
文档摘要

基础工具集与常用数据集

2

HARBININSTITUTEOFTECHNOLOGY

基础工具集与常用数据?

NLTK

LTP

PyTorch

基础工具集

Wikipedia

CommonCrawl

常用数据集

3

HARBININSTITUTEOFTECHNOLOGY

NLTK

NaturalLanguageToolkit

/

多种语料库和词典资源

生文本、PennTreebank样例

WordNet

基本的自然语言处理工具集

分句

标记解析

词性标注

句法分析

更多英文自然语言处理工具集

CoreNLP、spaCy等

4

HARBININSTITUTEOFTECHNO