大模型赋能投研之十：基于Deepseek大模型的周报月报全自动生成框架.docx

基本信息

文件名称：大模型赋能投研之十：基于Deepseek大模型的周报月报全自动生成框架.docx

文件大小：1.48 MB

总页数：15 页

更新时间：2025-05-17

总字数：约1.16万字

文档摘要

敬请参阅最后一页特别声明

内容目录

一、通用大语言模型产品难以生成高质量个性化定期报告 4

大模型能力提升，智能投研产品不断涌现 4

通用大模型平台难以生成高质量个性化定期报告 4

二、自动化撰写个性化投研定期报告的整体框架和步骤 6

2.1大语言模型选择 6

自动化生成报告的整体框架 7

信息来源拆解 7

适用场景分析 8

三、使用DeepSeek进行文本写作的案例展示 8

数据点评类文本 8

新闻热点点评类文本 9

观点类文本 11

其他文本生成 12

四、最终效果展示：python自动完成office排版 12

五、总结与展望 14

六、风险提示 15

图表目录

图表1：DeepSeek生成市场宏观报告 5

图表2：WindAlice的资金流向短文生成 6

图表3：DeepSeek在大模型领域的卓越领导者地位 6

图表4：DeepSeek-R1在幻觉测评中表现优异 6

图表5：个性化定期报告自动撰写流程 7

图表6：自动投研报告信息来源分析 8

图表7：市场点评文本撰写案例 8

图表8：基金业绩周度点评示例 9

图表9：定期报告中新闻热点点评撰写流程 10

图表10：新闻热点点评类文本生成示例 10

图表11：从研报中获取观点文本 11

图表12：黄金市场观点整理示例 12

图表13：Python自动排版生成的word周报文档示例 13

图表14：Python自动排版生成的word周报文档示例 13

敬请参阅最后一页特别声明

图表15：Python自动排版生成的PPT周报文档示例 14

敬请参阅最后一页特别声明一、通用大语言模型产品难以生成高质量个性化定期报告

敬请参阅最后一页特别声明

大模型能力提升，智能投研产品不断涌现

伴随大模型能力提升，其功能逐渐从从单纯参数扩张转向深度推理、多模态融合与行业定制化，同时国产化进程和评测治理体系的完善为其可持续发展奠定了基础。大模型的多模态数据整合与结构化处理能力，显著提升了金融资讯服务中研究报告的撰写速度和数据处理效率。例如，智能投研助手可实时抓取全球财经资讯、企业财报、舆情数据等多源异构信息，并自动完成数据清洗、关联分析和趋势预测，将传统人工信息的耗时显著缩短，通过自然语言交互快速提取关键数据点，帮助研究员完成从“信息检索”到“结论生成”的范式跃迁。

而智能投研产品方面，以东方财富的妙想投研助理为例，其依托大模型构建的动态知识引擎，实现市场指标秒级生成，并通过“一稿多版”按要求输出研究报告，自动抽取监管文件、研报、会议纪要等非结构化数据，构建可交互的行业知识图谱。Alice、AlphaEngine等多个平台也有类似的产品。但这类产品撰写的报告效果是否真的符合要求还有待商榷。

通用大模型平台难以生成高质量个性化定期报告1）数据源质量与覆盖度的局限性

通用大模型通常基于全网公开数据训练，多数的模型产品也能实现联网搜索抓取最新信息。但部分通用模型产品无法限定资讯来源，可能会包括论坛、社交媒体等低可信度的来源，研报、公告等专业文本又难以直接接入，这导致大部分通用大模型产品很难满足金融领域报告撰写的可信度要求。

此外，通用大模型也对金融专有名词的理解存在偏差，譬如“中信一级行业分类”等概念，大模型很难识别出一级行业包含具体哪些种类，进而可能在总结时出现错误；对新闻类型

（如政策解读、市场分析、突发事件）的识别能力也较弱，网页检索时可能会错误抓取与主题无关的新闻或企业动态，影响其最终总结的结论。

全网搜索新闻搜索范围难以精确锁定

通用模型在调用搜索引擎时，难以精确限定新闻的时间范围。例如下图中，我们要求“分析2025年4月25日宏观经济数据”，模型虽然能按要求搜索4月25日的信息，但误将午盘点评当作全天收盘点评，导致市场描述出错。

大模型还可能会对时间指令产生误解。若我们只用“本月”、“本年”等词表示时间，模型可能检索出以往的过时信息作为来源，只因为文本中有同样的时间指代词。

敬请参阅最后一页特别声明图表1：DeepSeek生成市场宏观报告

敬请参阅最后一页特别声明

来源：DeepSeek网页，

结构化数据交互任务难以实现

大模型完全基于语义推理，缺乏对结构化数据的理解与计算能力，在我们要求大模型在原始数据上计算差值、涨跌幅等指标时就可能得到错误回答；而数据又是金融报告中的重要组成部分。同时，在生成图文结合的报告、或结合图表与正文进行分析时，也可能出现单位误读（如将“亿元”错判为“百万”）、表格跨页关联断裂等问题。因此，与结构化数