验证报告:依据营养包队列数据建立营养评分算法及验证
1研究目标
利用早期儿童营养包干预长期健康作用评估项目的儿童营养健康状况监测
数据进行数据库清理、整理,根据数据分类分别进行单项指标熵值计算,将核心
指标纳入指标体系进行个性化营养评分(个体总熵值)计算,研究个体营养状况
量化评分的适宜性,为营养干预提供营养评分界值,并建立个性化营养评估技术
指南。
2研究方法
2.1人群数据来源
早期儿童营养包干预长期健康作用评估项目于2018年启动,在全国共抽取
15个县4500名儿童作为队列研究监测对象,对所抽到的人群样本进行每年一次
15
的跟踪调查,调查内容包括体检、问卷和认知发育评估等内容。在个监测县
2
中选取河南和贵州各个县进行深入监测,即在上述常规监测基础上采集血液、
粪便等生物样本进行机体微量营养素、肠道菌群等方面的检测分析。本研究数据
42023
来源于队列研究个深入监测县年调查数据。
2.2人群数据指标及基本统计量
以儿童群体指标为例,通过调查获取到1078份有效数据,从调查日期和儿
童生日获取儿童月龄并分析可知,调查对象主要为5-7岁儿童群体,分别从基本
情况、血液检测、肠道菌群和认知发育几个方面进行了样本数据的采集,其中基
本情况包括儿童阳历生日、调查日期、性别、民族、身高体重以及血红蛋白检测
等指标项;血液检测指标包括钙、铁、锌、维生素D、维生素A以及叶酸等营
养元素含量指标;认知发育采用发育商指标计算。
1
2.3数据处理方法
2.3.1数据清洗
2.3.1.1异常值处理方法
异常值,也称离群值,是指样本中的个别值,其数值明显偏离所属样本的绝
大部分观测值。如果数据中有异常值,比如常见情况下中年男性身高均介于
1.6~2.0米之间;但有个别数据为1.3,也或者2.2米;显然这种数据较为异常,
很可能会干扰研究;也或者数据本身确定应该介于1~5之间,但是出现数字0;
此时也应该进行异常值处理。不论什么研究数据,如果数据中存在可能的异常值,
均应在分析之前处理,防止异常值带来的干扰,比如异常值会扭曲X和Y之间
的相关关系,回归关系等,异常错误的结论。
针对异常值,常见的步骤有三步:第一步是异常值检测;第二步是异常值
判定;第三步是异常值处理。
2.3.1.1.1异常值检测
异常值的检验有很多种方法,最常见的是图示法,也有使用分析方法进行探
索,如下说明。
?箱线图:实验研究时经常使用,非常直观的展示出异常数据;
?散点图:研究X和Y的关系时,可直观展示查看是否有异常数据;
?描述分析:可通过最大最小值等各类指标大致判断数据是否有异常;
?其它:比如结合正态分布图,频数分析等判断是否有异常值。
2.3.1.1.2异常值判定
首先需要设定异常值的标准,然后再对其进行处理。异常值的判定标准并不
统一,更多是通过人为标准进行设定,包括以下几类:
?缺失数字
?小于设定标准的数字
?大于设定标准的数字
2
?大于3个标准差
2.3.1.1.3异常值处理
完成异常值的判定之后,接着需要进行处理,常用方法有删除和填补。
其中,删除即将该值设置为Null值,此类处理最简单,而且绝大多数情况
下均使用此类处理;本研究直接将异常值删除,相当于没有该异常值。
2.3.1.2空值处理方法
个别指标为缺失值,则直接将缺失值样本去除。
2.4数据指标分类
根据获取数据情况,将指标分为生长情况、血液营养、认知得分三大类。
2.4.1生长情况
儿童营养健康评估是评价儿童是否获得充足营养和健康体质发展状况,身高
和体重是反映儿童获得充足营养的直观体现,通过测量儿童的身高和体重,对比
评估儿童的发育情况是否达到同龄、同性别儿童的平均水平,来判断他们的生长
发育是否正常。因此,月龄、性别、身高和体重指标对与儿童营养健康评估十