2024年2月计算机应用文摘第40卷第3期
高校学生全画像学业成绩预警模型分析
郭召,张子涵,刘艺
(郑州城建职业学院基础教学部,郑州450000)
摘要:基于CatBoost算法,利用高校学生的全面画像数据,建立了学业成绩预警模型,可有效预防学
生学业成绩的严重下滑。文章以江苏连云港一所高校的学生学业成绩数据为对象,采用机器学习算法
CatBoost,并以学生的历史学业成绩数据为基础进行学业成绩的预测,其准确率达到了79.6%。
关键词:数据挖掘;CatBoost算法;回归模型;学生全画像学业成绩预警
中图分类号:TP311文献标识码:A
Analysisofafullpictureacademicperformancewarningmodelfor
collegestudents
GUOZhao,ZHANGZihan,LIUYi
(BasicTeachingDepartment,ZhengzhouUrbanConstructionVocationalCollege,Zhengzhou45ooo0,China)
Abstract:BasedontheCatBoostalgorithmandutilizingcomprehensiveprofiledataofcollege
students,aperformancewarningmodelwasestablished,whichcaneffectivelypreventaserious
declineinstudentacademicperformance.Thearticletakestheacademicperformancedataofstudents
fromauniversityinLianyungang,Jiangsuastheobject,usesthemachinelearningalgorithm
CatBoost,andpredictsacademicperformancebasedonhistoricalacademicperformancedataof
students,withanaccuracyrateof79.6%.
Keywords:datamining,CatBoostalgorithm,regressionmodel,studentportraitacademicperformance
warning
1引言产生海量的教育教学数据,然而这些数据的价值并未
得到充分利用。在这种情况下,本文提出了一种基于
学生学业成绩预测是学校关心和关爱学生的有CatBoost算法的学生全画像学业成绩预警模型。
效工具,也是帮助学生规避学业风险的重要手段。在CatBoost算法是俄罗斯的搜索巨头Yandex在
高校教学中,学生的课程成绩被视为衡量其知识掌握2017年开源的机器学习库,是一种能够有效处理类别
程度和教师教学成果的重要指标。进行学业成绩预型特征的梯度提升算法。它采用了对称决策树
测能够为学生提供课程指引,帮助他们规避潜在的学(ObliviousTrees)算法,具有参数较少、支持类别型变
量、准确性高等特点。CatBoost算法主要解决高效处
业风险[1~4]。然而,高校现有的教务管理系统无法有
效实现学业预警等功能,高校无法及时为学生提供帮理类别型特征的问题,这一点从其名字中的
助。在这种情况下,涌现了越来越多相关的研究文“Catgorical和“Boost就能看出。此外,它还能处理
章。例如,王斌等[5]采用随机森林算法和Apriori算