大数据平台建设方案
(项目需求与技术方案)
一、项目背景
“拾三五”期间,伴随我国現代信息技术的蓬勃发展,信息化建设模式发生主线性转变,一場以雲计算、大数据、物联网、移動应用等技术為关键的“新IT”浪潮風起雲涌,信息化应用進入一种“新常态”。***(某政府部门)為积极应對“互联网+”和大数据時代的机遇和挑战,适应全省經济社會发展与改革规定,大数据平台应运而生。
大数据平台整合省社會經济发展资源,打造集数据采集、数据处理、监测管理、预测预警、应急指挥、可视化平台于一体的大数据平台,以信息化提高数据化管理与服务能力,及時精确掌握社會經济发展状况,做到“用数听說话、用数据管理、用数据决策、用数据创新”,牢牢把握社會經济发展积极权和话語权。
二、建设目的
大数据平台是顺应目前信息化技术水平发展、服务政府职能改革的架构平台。它的重要目的是强化經济运行监测分析,实現企业信用社會化监督,建立规范化共建共享投资项目管理体系,推進政务数据共享和业务协同,為决策提供及時、精确、可靠的信息根据,提高政务工作的前瞻性和针對性,加大宏观调控力度,增進經济持续健康发展。
制定统一信息资源管理规范,拓宽数据获取渠道,整合业务信息系统数据、企业單位数据和互联网抓取数据,构建汇聚式一体化数据库,為平台打下坚实稳固的数据基础。
梳理各有关系统数据资源的关联性,编制数据资源目录,建立信息资源互换管理原则体系,在业务可行性的基础上,实現数据信息共享,推進信息公開,建立跨部门跨领域經济形势分析制度。
在大数据分析监测基础上,為政府把握經济发展趋势、预見經济发展潜在問題、辅助經济决策提供基础支撑。
三、建设原则
大数据平台以信息资源整合為重點,以大数据应用為关键,坚持“统筹规划、分步实行,整合资源、协同共享,突出重點、重视实效,深化应用、创新驱動”的原则,全面提高信息化建设水平,增進全省經济持续健康发展。
1、统筹规划、分步实行。結合本省經济发展与改革领域实际需求,明确总体目的和阶段性任务,科學规划建设项目。先期完毕大数据平台的整体架构建设,後期分步完毕业务系统的整合及互相间数据共享問題。
2、整合资源、协同共享。對信息资源统一梳理,建立經济发展与改革信息原则资源库和数据规范,逐渐消灭“信息孤岛”,加紧推進数据资源整合,建设共享共用的大数据中心,实現业务协同。
3、突出重點、重视实效。以顾客為中心,以需求為导向,以服务為目的,突出重點,重视实效,加强平台可用性和易用性。
4、深化应用、创新驱動。深入理解顾客需求,亲密跟踪信息技术发展趋势,不停深化应用、拓展新技术在应用中的广度和深度,增進跨界融合,丰富管理和服务手段。
四、建设方案
為了保证项目的顺利進行和建设目的的可行性,我們采用如下几种建设方案。
1、数据采集方案。
我們统一信息资源原则规范,建立多维度数据库,拓宽数据来源,通過不一样的方式汇聚数据,增强分析力度,提高监测预警的精确性和時效性。
预留接口,支持其他系统多种数据的上传导入处理。将現存有关經济运行业务系统中的历史数据和時效数据,通過上传数据文献至服务器、分析提取有效数据导入服务器数据库等方式采集起来,在本平台上复用。
支持外接数据的上传导入处理。可以将企业單位或定點监测机构的数据通過同样的方式采集起来,在本平台上复用。
支持非构造化数据,即搜索引擎数据、社交媒体数据、地理空间数据和音视频数据等等。
2、数据分析方案。
大数据之大并不是难點所在,其真正难以對付的挑战来自于数据类型多样、规定及時响应和数据的不确定性,而我們所面临的也正是如此。
我們采用批量数据处理系统,借助于深度學习、知识计算和可视化等大数据分析技术,通過對数据的批量处理挖掘其中的价值来支持决策和发現新的洞察。
3、业务整合方案。
在對社會发展有关业务子系统充足调研基础上,結合项目需求,可對其進行整合或嵌入处理(本方案整合公共信用信息服务平台、投资项目信息管理平台等)。
整合处理。将原有数据通過上传或导入方式進行采集,原有功能模块整合到本平台中,合二為一,完美的将数据汇聚起来。缺陷是耗時较長。
嵌入处理。以單點登录的方式将原有系统链接嵌入到本平台中,作為子系统單独存在。缺陷在于数据共享难以实現。
五、建设内容
1、宏观經济监测预测及可视化平台
政府信息化的最终目的是提高政府的决策水平,其中經济决策是关键内容。為了提高宏观调控决策水平,我們必须從依托老式记录数据向依托互联网非记录数据转变,從监测预测宏观經济总量向监测预测宏观經济先行指標转变,從中長期监测预测向实時监测预测转变。
宏观經济监测预测及可视化平台围绕网络搜索、社交媒体、電子商务、终端定位和业务交易等五個方面全面整合互联网有关数据资源,建设以“容量大、形式多、分类