基本信息
文件名称:数据科学技术与应用——基于Python实现(第3版)课件 7-多模态数据分析.pdf
文件大小:4.39 MB
总页数:58 页
更新时间:2026-03-07
总字数:约4.33万字
文档摘要
多模态数据分析
7.1文本数据分析
?文本处理的常见任务
?中文分词和词性标注
?文本向量化表示
?案例:垃圾邮件识别
文本处理常见任务(1)
?任务1:文本分类(TextClassification)?任务2:信息检索(InformationRetrieval)
?目标?目标
?对文本(或其他实体)按照一定的分类体系?将信息(这里指代文本)按一定的方式组织