方法经验
大语言模型和数据标签模型在证券公司
分支机构经营情况审计分析中的应用
文
宋弘涛赵康毅陈宇韬
在当今数据驱动的商业环境中,作为证券突破和进展,可以处理各种复杂的文本任务,从
公司管理的重要组成部分,证券公司内部文本摘要到文章生成,甚至图像和语言的交叉处
审计承担着对公司经营活动进行深入分析和独立理等。
评价的任务。根据中国证券监督管理委员会发布目前,大语言模型在内部审计职业中的探索
的《证券经纪业务管理办法》等规定,证券公司与实践仍处于初级阶段,可以应用于审计数据分
需定期对每个分支机构实施内部审计,而这些全析,发挥模型的部分优势,但也因面临一些模型
国性的分支机构分布广泛,会产生数量众多的经的固有劣势无法获得理想结果。
营情况审计分析需求。企业内部审计有标准化的1.大语言模型在审计应用中的优势。
程序,开展工作时须严格遵循程序要求,而在具一是总结与概括能力。大语言模型能够在处
体审计方法的运用上则可以充分创新,通过结合理文本时快速总结关键信息,避免繁琐的逻辑推
所属行业的业务特点,采取适用于本单位的内部理过程。在面临大量文本处理与概括的工作时,
审计方法。随着人工智能和机器学习技术的进可交由大语言模型进行处理。
步,大语言模型已逐渐成为处理复杂文本和数据二是知识积累。由于训练数据的广泛性和丰
任务的新工具,其在内部审计领域应用广泛,包富性,大语言模型可以综合其所掌握的繁复知识,
括辅助制订审计方案、辅助撰写审计底稿、辅助处理多样化文本任务。
查找审计线索等。但同时大语言模型的应用仍存三是小样本学习能力。大语言模型具有非常
在风险,经研究和实践发现,数据标签模型具有强的小样本学习(Few-shotLearning)能力,
和大语言模型优劣互补的特点。即只需要提供少数的几个样例、提示词,就能对
反馈结果进行完善。
一、大语言模型和数据标签模型介绍及其2.大语言模型在审计应用中的劣势。
优劣势一是幻觉问题。大语言模型可能会遇到对数
据解读和分析产生影响的幻觉(Hallucination),
(一)大语言模型应用现状及其优劣势幻觉问题可以分为内在幻觉和外在幻觉。内在幻
大语言模型是指基于机器学习技术,利用大觉指的是输出内容和输入内容不符,如输出了错
规模数据训练的语言模型。近几年,随着计算能误的年份信息、人名信息等;外在幻觉指的是通
力的提升和数据积累的充足,大语言模型取得了过信息源无法判别是否正确的信息,既没有办法
62
方法经验
支持也没有办法否认。构经营策略标签化为“财富转型优秀”“偏重传
二是对数字敏感性较差,计算、逻辑能力薄统业务”等。
弱。大语言模型在数据处理的敏感性及计算逻辑1.数据标签模型优势。
方面存在一定局限性,如果直接输入大量经营数