第36卷第3期齐齐哈尔大学学报(自然科学版)Vol.36,No.3
2020年5月JournalofQiqiharUniversity(NaturalScienceEdition)May,2020
中部地区农村居民购买商业养老保险
的影响因素研究
1112
孙成伟,朱家明,夏胜群,李秦
(1.安徽财经大学统计与应用数学学院,安徽蚌埠233030;2.安徽财经大学金融学院,安徽蚌埠233030)
摘要:针对中部地区农村居民选择商业养老保险的影响因素进行研究,从CFPS数据库中选择农村居民受访者子
女数目,是否持有金融商品,是否选择商业养老保险等10个指标,划分为个人情况、经济情况、家庭情况及行为
特征四大类。其次,利用二元Logistic回归模型的相关理论并通过SPSS求解得出工作性质、学历、人均家庭纯收
入和是否持有金融产品4个变量对农村居民购买商业养老保险意愿影响显著。然后,将原始数据划分为训练集和
测试集,通过Python构建决策树和随机森林模型预测居民是否购买商业养老保险,模型预测准确率可分别达到71%
和77.9%。
关键词:农村商业养老保险;二元Logistic回归;决策树;随机森林;Python
F842.67文献标志码:A文章编号:1007-984X(2020)00-0084-05
中图分类号:
目前我国老龄化趋势明显,且据相关研究表明,我国的养老金将在2035年耗尽,于是国家政策开始转
向普及养老保险。我国农村人口众多,体制较为落后,绝大多数农村人口对商业养老保险解甚微,人口
老龄化的到来,使得农村非正式的养老保障制度面临着巨大挑战。
1数据的来源及处理
本文所用的数据来源于北京大学中国社会科学调查中心的2016年中国家庭追踪调查(ChinaFamily
PanelStudies,CFPS),从中选取山西、河南、安徽、湖北、江西、湖南六个省份的农村居民的相关数据。
其中成人问卷数据中包含年龄、受教育程度等个人信息,家庭问卷数据中包含人均家庭纯收入等信息。首
先,利用Python将两个问卷数据中具有相同个人ID的信息链接在一起。其次,得到2638份有效样本,其
中购买商业养老保险的人数297人,未购买商业养老保险人数2341人。为做到面板数据的平衡,本文
保留购买商业养老保险的297份样本,并从未购买商业养老保险的2341分样本中随机抽取299份样本。
最后保留596份有效样本,涵盖中部地区农村居民的10个方面的指标数据,并将数据导出为Excel,利用
Excel函数对变量进行赋值。
2农村商业养老保险购买影响因素的实证研究
2.1二元Logistic回归模型
(1)模型的建立。建立似然函数,通过最大似然估计法估计Logistic回归模型的参数。假设由N个案
|
例构成的总体,,?,,观测值标注为,,?,,设==1为给的条件下得到结果=1