基本信息
文件名称:中部地区农村居民购买商业养老保险的影响因素研究.pdf
文件大小:455.59 KB
总页数:5 页
更新时间:2025-07-02
总字数:约1.41万字
文档摘要

第36卷第3期齐齐哈尔大学学报(自然科学版)Vol.36,No.3

2020年5月JournalofQiqiharUniversity(NaturalScienceEdition)May,2020

中部地区农村居民购买商业养老保险

的影响因素研究

1112

孙成伟,朱家明,夏胜群,李秦

(1.安徽财经大学统计与应用数学学院,安徽蚌埠233030;2.安徽财经大学金融学院,安徽蚌埠233030)

摘要:针对中部地区农村居民选择商业养老保险的影响因素进行研究,从CFPS数据库中选择农村居民受访者子

女数目,是否持有金融商品,是否选择商业养老保险等10个指标,划分为个人情况、经济情况、家庭情况及行为

特征四大类。其次,利用二元Logistic回归模型的相关理论并通过SPSS求解得出工作性质、学历、人均家庭纯收

入和是否持有金融产品4个变量对农村居民购买商业养老保险意愿影响显著。然后,将原始数据划分为训练集和

测试集,通过Python构建决策树和随机森林模型预测居民是否购买商业养老保险,模型预测准确率可分别达到71%

和77.9%。

关键词:农村商业养老保险;二元Logistic回归;决策树;随机森林;Python

F842.67文献标志码:A文章编号:1007-984X(2020)00-0084-05

中图分类号:

目前我国老龄化趋势明显,且据相关研究表明,我国的养老金将在2035年耗尽,于是国家政策开始转

向普及养老保险。我国农村人口众多,体制较为落后,绝大多数农村人口对商业养老保险解甚微,人口

老龄化的到来,使得农村非正式的养老保障制度面临着巨大挑战。

1数据的来源及处理

本文所用的数据来源于北京大学中国社会科学调查中心的2016年中国家庭追踪调查(ChinaFamily

PanelStudies,CFPS),从中选取山西、河南、安徽、湖北、江西、湖南六个省份的农村居民的相关数据。

其中成人问卷数据中包含年龄、受教育程度等个人信息,家庭问卷数据中包含人均家庭纯收入等信息。首

先,利用Python将两个问卷数据中具有相同个人ID的信息链接在一起。其次,得到2638份有效样本,其

中购买商业养老保险的人数297人,未购买商业养老保险人数2341人。为做到面板数据的平衡,本文

保留购买商业养老保险的297份样本,并从未购买商业养老保险的2341分样本中随机抽取299份样本。

最后保留596份有效样本,涵盖中部地区农村居民的10个方面的指标数据,并将数据导出为Excel,利用

Excel函数对变量进行赋值。

2农村商业养老保险购买影响因素的实证研究

2.1二元Logistic回归模型

(1)模型的建立。建立似然函数,通过最大似然估计法估计Logistic回归模型的参数。假设由N个案

|

例构成的总体,,?,,观测值标注为,,?,,设==1为给的条件下得到结果=1