基本信息
文件名称:财务大数据分析 课件 8.财务报告自然语言处理.pptx
文件大小:12.02 MB
总页数:95 页
更新时间:2025-07-09
总字数:约1.3万字
文档摘要

第8章财务报告自然语言处理——Python中文大数据分词与可视化

上市公司财报PDF文件中的数据是典型的非结构化数据,区别于财务报表那种结构化数据,这种非结构化数据往往更加重要,本章首先讲解如何实现PDF文件文本解析,并通过对上市公司的年报(经营报告)PDF文件解析来巩固相关知识点,掌握了PDF文件解析后,本章还将讲解如何对文本数据进行大数据分词与可视化。”

目录PDF文件文本解析中文大数据分词案例实战——绘制上市公司风险提示词云图

8.1PDF文件文本解析

8.1.1PDF文件文本解析基础——提取文本与表格想要深入对PDF文件正文内容进行分析,就需要