基本信息
文件名称:(共21页PPT)数据可视化第一课时哲教学课件.pptx
文件大小:9.36 MB
总页数:21 页
更新时间:2026-03-29
总字数:约小于1千字
文档摘要
数据可视化哲学校某省市衢州第二中学年级:高二年级学科:高某著名企业息技术(浙教版)
文本处理的一般过程数据获取分词特征提取分析结果呈现
让计算机“认词语”得力大品牌,值得人们信赖!得力/大/品牌/值得/人们/信赖
目前的分词算法通常分为三类:①基于词典(右图即jieba采用的部分词典)②基于频率统计③基于规则(人工智能分析)
特征提取 选取词或短语作为文本的特征项1.通常可直接用分词算法和词频统计得出的结果做为特征词2.找出最具代表性、最有效的文本特征,通常的办法就是通过特征提取来减少特征词的数量,提高文本处理的速度和效率
标签云
(1)快捷观