基本信息
文件名称:数字人文视域下研究方法的演变:基于CNKI数据与大语言模型的量化分析.pdf
文件大小:2.7 MB
总页数:10 页
更新时间:2025-03-14
总字数:约2.15万字
文档摘要

第7卷第1期科技情报研究2025年1月

Vol.7No.1SCIENTIFICINFORMATIONRESEARCHJan.2025

数字人文视域下研究方法的演变:基于CNKI数据与

大语言模型的量化分析?

孙光耀1,2王东波1,2

1.南京农业大学信息管理学院,南京210095

2.南京农业大学人文与社会计算研究中心,南京210095

摘要:[目的/意义]文章旨在利用大语言模型技术,探索数字人文领域研究方法的演变趋势。[方法/过程]文

章主要以CNKI期刊论文数据为研究对象,选取通用中文大语言模型GLM-4,采用提示词工程、思维链,对论

文摘要数据进行抽取、聚类,并通过量化处理分析其演变趋势。[结果/结论]研究表明,GLM-4能够很好地从复

杂的摘要数据中识别并抽取出研究方法。按时序变化分析演变趋势,发现“访谈调研”“扎根理论”等研究方法

逐渐边缘化,机器学习等相关研究方法逐步成为主流。文章揭示了中文数字人文领域研究方法的演变趋势,赋

予数字人文的研究成果更为丰富且全面的文化内涵。

关键词:数字人文;大语言模型;GLM-4;提示词工程;思维链;机器学习

中图分类号:G353.1;TP391.1文献识别码:A文章编号:2096-7144(2025)01-0065-10

DOI:10.19809/ki.kjqbyj.2025.01.006

[2]

发布引起了社会各界广泛关注,其优秀的文本处理

1引言

能力得到大众的极力追捧,并在短短几个月内风靡

随着信息技术的蓬勃发展,数字人文作为一门全球。有赖于产业界和学术界的共同努力,大语言模

新兴的交叉学科,正逐步成为链接传统人文研究与型作为人工智能领域的新兴技术,在法律、医疗、金

现代信息技术的重要桥梁。学者们利用大数据分析、融等多个领域得到了广泛应用。这些进展不仅扩展

文本挖掘、可视化技术等现代信息技术手段,对传统了上述领域的研究边界,也为数字人文领域提供了

人文资料进行深度加工与重构,极大地拓宽了数字新的研究视角和方法。大语言模型通过大量文本数

[1]

人文研究的广度与深度,促进了知识传播方式的创据的预训练处理,掌握了丰富的语言知识和上下文

新和人文知识体系的重构。尤其是近年来,大数据、信息,能够准确地理解文本的深层含义和语义结

[3]

云计算以及人工智能等技术的迅速发展,为数字人构。在数字人文领域中,历史文献、古籍资料、文学

文研究提供了前所未有的技术支撑,为未来数字人作品等作为重要的研究对象,蕴含着丰富的知识信

文研究开辟了广阔前景。息,但往往以非结构化的文本形式存在,难以直接进

2022年底,生成式对话大语言模型ChatGPT的行高效的查询和分析。大语言模型以强大的语言理

收稿日期:2024-08-12修回日期:2024-09-13

基金项目:2021年国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(编号:21ZD331)

作者简介:孙光耀(ORCID:0009-0008-7499-0699),硕士研究生,主要研究方向为自然语言处理与文本挖掘、智能信息处理;王

东波(ORCID:0000-0002-9894-9550),通讯作者,博士,教授,主要研究方向为自然语言处理与文本知识挖掘、信息计量,E-mail

为db.wang@。

65

第7卷第1期科技情报研究

解和生成能力,为数字人文研究提供了更为强大的字人文的主题热点趋势也同样重