(一)应用数据化平台建设
应用数据化技术产品的安装部署。通过HTTP协议来模拟PC浏览器从客户系统获取数据以及交互,通过XML-RPC和WebService等方式,实现接口数据转换为可共享服务数据,实现客户系统信息数据化采集。
(二)政务数据资源编目扩充
(1)制定数据资源编目规范
(2)政务数据资源梳理
(3)政务数据资源分类建设
(4)政务信息资源目录编制
(5)共享与开放目录编制
(三)数据清洗比对入库
(1)应用系统可共享数据汇聚到省数据共享平台
(2)数据清洗、比对、入库
(3)建立数据质量持续提升机制
(4)人口库、法人库扩充完善
(一)应用数据化平台建设
应用数据化平台将采用成熟产品,实现应用系统的表示层数据接入,实现非侵入式数据采集,所见即所得。产品支持WebParser的表现层接入技术。通过HTTP协议来模拟PC浏览器从客户系统获取数据以及交互,通过XML-RPC和WebService等方式,实现接口数据转换为可共享服务数据,从而实现客户系统信息数据化。无需制定共享(数据、技术、管理)规范;无需应用系统技术人员对接。
(二)数据清洗比对入库
从各单位采集到的数据往往是不能直接供数据中心以及其他系统使用,一方面系统使用数据方式和格式都可能与源头不一样,一方面原有系统一般是在不同时期、不同体系结构、多个厂商、多种平台的系统。采集系统出来后,面对的是目的端往往是不同时期、不同体系结构、多个厂商、多种平台的系统。为了方便各系统和主题数据库对数据的使用,需要系统提供一些标准的数据处理模块,以实现不同系统间自动的数据格式和内容的转换。用户可以从不同结构的数据源中抽取数据(Extract),对数据进行复杂的加工处理(Transform),最后将数据加载到各种存储结构中(Load)。例如实现从多个异构的数据源(不同数据库、结构化文件等)抽取数据,并加工成统一的数据格式,最后加载到数据中心的各单位数据库表 ,形成各单位标准基础数据库,供其他系统使用。