基本信息
文件名称:数据科学技术与应用——基于Python实现(第3版)课件 7-多模态数据分析.pdf
文件大小:4.39 MB
总页数:58 页
更新时间:2026-03-07
总字数:约4.33万字
文档摘要

多模态数据分析

7.1文本数据分析

?文本处理的常见任务

?中文分词和词性标注

?文本向量化表示

?案例:垃圾邮件识别

文本处理常见任务(1)

?任务1:文本分类(TextClassification)?任务2:信息检索(InformationRetrieval)

?目标?目标

?对文本(或其他实体)按照一定的分类体系?将信息(这里指代文本)按一定的方式组织