基本信息
文件名称:大数据采集与预处理技术(微课版)课件 6.3图书信息数据标注实施.pptx
文件大小:646.1 KB
总页数:8 页
更新时间:2025-12-25
总字数:约1.02千字
文档摘要
大数据采集及预处理技术
**;项目二图书信息数据采集与预处理;任务三图书信息数据标注;1、图书简介文本分类标注
假设要将图书简介分类为“小说”、“寓言”、“散文”、“诗歌”、“随笔”、“童话”,那么需要创建这几类标签,并依次导入图书简介数据,也可以把图书简介输入到一个txt文档,以换行隔开。这里以部分图书简介为例,使用LabelStudio工具进行标注。创建项目时选择“textclassification”,按照要求输入标签。
进入项目导入数据,对每一段数据进行标注,建议将每本书简介合并为一段,也可以分段,每段具有完整意思表达。对每段选择标签,直到