[小案例]亚特兰大在SDR公司的数据录入
在佐治亚州一个名叫SDR的数据分析研究机构中,安.莫勒20多年来一直负责数据录入工作。安从弗吉尼亚州Hol—lins学院的统计系毕业后,就加入了这家有创造力的公司。借助公司本身获取专利的对调查结果进行电子图表化的软件.SDR公司在市场调查领域中居于领先地位。安希望能在这个领域发挥才干。
10年后,莫勒在管理项目数据录入需求方面积累了丰富的经验。莫勒认为,要在客户预算允许的范围内如期完成调研工作,重要的是避免问卷中出现过多的开放型问题。这些问题出现的情况为:①问卷中设计了答案“其他”或留出为填写其他详细答案的位置;②在问卷最后请被调查者写出其他看法或意见。对这样的反馈,不能直接输入数字代码,而必须根据项目分类设计编码,或将反馈内容照原样录入电脑。
“编码是数据录入过程中耗资最大且最主要的部分。”莫勒说:“我们读同一文本,对它的编码可能不同。因此,客户与研究机构的项目管理者,必须认真比较问题的结构化的详尽程度和可能引起不一致的编码和记录的个数。如果有太多的答案需要编码,分析过程就会令人厌烦,而且理解详尽答案的花费将是非常之高的。”
“要将结构化与非结构化答案达到合理水平,就必须使问卷中具有标准答案的项目与不具标准答案项目的比例适当。”莫勒说:“在对雇员满意度的调查中,编码或文字录入所需的人力是十分巨大的。一些被访者甚至在问卷中另附纸来表达他们的意见。”
据莫勒讲,关于应答编码的发生率,其变化范围是很大的。在估算项目中数据录入部分的花费时,研究机构的项目经理必须把客户预计的应答编码发生率记录于文件中。莫勒说:“如果你估算无固定答案的应答发生率为30%,而结果却可能是60%,你就必须找到客户重新评估。我们与客户之间出现麻烦总是由于我们不能于调查完成前正确估计应答编码的发生率。”
对因特网熟悉程度的频数分布
变量值标签
变量值
频数
百分比
有效百分比
累计百分比
不太熟悉
1
0
0.0
0.0
0.0
2
2
6.7
6.9
6.9
3
6
20.0
20.7
27.6
4
6
20.0
20.7
48.3
5
3
10.0
10.3
58.6
6
8
26.7
27.6
86.2
非常熟悉
7
4
13.3
13.8
100.0
9
1
3.3
缺失值
合计
30
100.0
100.0