基本信息
文件名称:大数据采集与预处理技术(微课版)课件 4.4 图书信息数据采集-自然语言公开数据集.pptx
文件大小:61.16 KB
总页数:9 页
更新时间:2025-12-25
总字数:约4.44千字
文档摘要
大数据采集与预处理技术**
项目二图书信息数据采集与预处理序号软件配置要求1scrapy最新版本2Scripy-redis最新版本一、项目目标:1、完成图书信息数据分布式采集环境安装配置;2、完成图书信息数据采集程序设计和数据采集;3、完成图书信息数据预处理清洗。4、完成图书信息数据文本标注。二、环境要求:
自然语言数据集自然语言处理(Neuro-LinguisticProgramming,NLP)领域有很多公开的标准数据集,用于各种自然语言处理任务,例如文本分类、机器翻译、情感分析、问答系统、命名实体识别等。1、文本分类数据集数据集名称数据集介绍数据集链接IMDB电影