刘明,吴忠明,杨箫,郭烁,廖剑
学术教育大语言模型的内涵、构建和挑战
时空现代远程教育研究,2024,36(5)
教育大语言模型的内涵、构建和挑战
□刘明吴忠明杨箫郭烁廖剑
——————————————————————————————————————————
摘要:大语言模型作为新一代人工智能的核心技术,为教育领域带来前所未有的机遇。但由于以ChatGPT为
代表的通用大语言模型仅能提供通用型反馈,难以与复杂的教育场景、育人方式相匹配,因而亟需构建专用的教
育大语言模型。教育大语言模型具有教育知识库的全面性、教学内容生成的安全性、反馈信息的教育价值性、问
题解决的个性化、人机交互的多模态性、用户使用的易用性等特点和优势。其构建流程主要包括6个步骤:一是
制定教育目标,预设模型构建标准与技术范式;二是选择或设计大语言模型基座,对齐教育任务属性;三是构建
教育语料库,实现无序数据的教育价值转向;四是开展模型训练或提示,获得教育任务通用和细粒度知识;五是
链接外部教育知识库,灵活扩展模型知识和学生模型;六是评价教育大语言模型,让模型“懂人理”。当前教育
大语言模型的应用主要聚焦编程、课后阅读和计算机教育三类教学场景,有助于学生计算思维、提问能力和编程
技能等高阶能力和学科基本能力的提升。未来教育大语言模型应由多方合力共建语料库与知识库以统一标准,尝
试应用新技术以破解多模态理解缺陷和计算困境,深入探索人机协同教学机制以实现其与高阶教育目标的匹配。
关键词:教育大语言模型;生成式人工智能;人工智能教育应用;知识增强
中图分类号:G434文献标识码:A文章编号:1009-5195(2024)05-0050-11doi10.3969/j.issn.1009-5195.2024.05.006
——————————————————————————————————————————
基金项目:2024年度国家自然科学基金面上项目“知识增强大语言模型的科学课教学问题智能生成方法研
究”;2024年度重庆市教育委员会科学技术研究计划重点项目“个性化科学教育大语言模型的关键
技术与应用示范研究”(KJZD-K202400208)。
作者简介:刘明,博士,教授,博士生导师,西南大学教育学部(重庆400715);吴忠明,博士研究生,西
南大学教育学部(重庆400715);杨箫,硕士研究生,西南大学教育学部(重庆400715);郭烁,博士研究生,
西南大学教育学部(重庆400715);廖剑,博士,副教授,硕士生导师,西南大学教育学部(重庆400715)。
党的二十大报告提出,要“构建新一代信息技大语言模型。由于教育内容的复杂性、教育场景的
术、人工智能、生物技术、新能源、新材料、高端多样性和教育形式的灵活性,传统通用大语言模型
装备、绿色环保等一批新的增长引擎”,“推进教难以充分理解教育场景和信息的内在关系,其普适
育数字化”(新华社,2022)。教育数字化转型既是化、通用化的生成内容无法与现实教育内容及教育
构建教育新生态、支撑教育高质量发展的必由之路主体高度匹配,也难以实现与教育场景的深度耦
(祝智庭等,2022),也是推进教育公平发展的有效途合,因此教育领域亟需设计、开发和构建专用的教
径。教育部怀进鹏部长在谈及教育、科技、人才、育大语言模型。本研究通过分析当前国内外主流的
创新等领域的改革时亦指出,要“大力推进智慧校教育领域大语言模型的类型、技术特征和优缺点,
园建设,打造中国版人工智能教育大模型”(中华提出了教育大语言模型的主要内涵与特征,描述了
人民共和国教育部,2024)。面对新一轮科技革命和产教育大语言模型的主要构建方法与流程,并探讨了
业变革的深入发展,以生成式人工智能为代表的新当前教育大语言模型开发与建设面临的挑战与应对
一代人工智能技术成为引领教育数字化转型的重要策略,以期为新一代人工智能赋能教育数字化转型
驱动力,将推动教育领域迎来人机协同、跨界融提供参考。
合、共创共享的新时代(戴岭等,2023)。大语言模