高校大数据教育:基础知识
结构与学位设计
主讲人:艾春荣院长
中国人民大学统计与大数据研究院
-1-
大数据战略统计与大数据研究院
大数据开发与应用被各主要工业国(美国,德国,英国,欧盟、日本)视为战略资源,
希望以此为支柱产业,带动经济增长和人民福利(新产品、新服务、更低成本)的提高,
并将大数据的开发和应用提升至国家意志(高于国家战略)。
我国亦将大数据的开发与应用作为国家意志,并多次发文推进大数据及相关产业的发展。
-2-
大数据价值统计与大数据研究院
这一崇高的地位决定了,大数据的开发与应用必须促进经济的持续增长。也就是说,大
数据的开发与应用最终必须提高生产率和社会福利,否则,用不着以国家意志来推动大
数据的发展。
那么,大数据是如何提升生产率和社会福利的呢?我的理解是,通过解决社会经济中的
信息不对称问题。
-3-
大数据价值统计与大数据研究院
例如,在生产领域,大数据中的信息可以帮助我们识别生产过程中资源错误配置和低效
的地方,帮助我们做出更高效的的决策。在消费领域,大数据中的信息可以帮助我们更
多的了解消费者的偏好和需求,帮助设计新服务、新产品。在流通领域,大数据能帮助
我们更有效的匹配供需双方,减少流通成本。在服务领域,大数据中的信息能帮助我们
更深入的了解经济个体的行为,帮助我们设计对应的服务以及风险控制。大数据中的信
息还是设计人工智能产品的基础。
-4-
大数据价值统计与大数据研究院
因此,大数据的价值取决于对隐含的信息的挖掘、分析与应用程度。它不只是数据的采
集、储存和简单的挖掘与关联分析,而是对隐含的行为信息做深度分析的结果。
数据处理≠数据分析
大数据的特点是量大但所含信息相对(数据量)很小,对信息的挖掘和分析离不开应用
领域的知识指导和统计学工具。
大数据≠总体
最后,分析结果的应用离不开优化与算法。
-5-
大数据知识结构统计与大数据研究院
可见,大数据的开发与应用涉及到数据的采集和储存(计算机科学)、数据的挖掘与分
析(算法、统计学、应用科学)、分析结果的应用(计算科学、应用科学)。表面看,
这一过程是上述领域的简单组合,但简单组合无法达到整体最优。