如何保证环保数据质量?我们不妨听听美国专家的解释,参考一下他们的做法。
美国1970年成立了美国环保署(Environmental Protection Agency,简称EPA,下同),而从19世纪末美国就开始对水质进行监测,从20世纪初开始监测大气。这样算来,美国在环境监测方面已经有百年的历史。
EPA如何进行监测?如何使用这些监测数据进行监管和执法?如何保证监测数据质量?其监测经验是否对我国具有借鉴意义?
3月12日,应环境保护部信息中心程春明主任邀请,美国环保署环境信息办公室高级专家Wayne Davis访问了环境保护部信息中心,为我们答疑解惑。
从源头上重视数据质量
构建环境信息生命周期框架,提升数据可信度
数据质量问题在我国备受诟病,近些年,各地也在不断的完善自动监测网络,建立监控平台。那么,是否建好平台和网络就可以保证数据质量呢?
Davis介绍说,EPA非常重视从源头上保证数据的质量,构建了一套环境信息生命周期框架,目的是为了提高数据质量,提升数据可信度,方便信息化人员、业务人员和社会公众的交流。
环境信息生命周期由美国环保署信息化办公室(简称OEI,下同)管理。OEI由首席信息官领导,除了管理环境信息生命周期框架,还负责保障EPA的信息质量、运作效率,提供信息技术保障、数据搜集、交换、访问服务等。
信息生命周期是一种信息管理模型,不是具体的产品,强调从企业级别的视角,对信息进行更有效的管理、更有效的开发和利用的全过程。
那么,OEI的环境信息的生命周期包括什么内容?框架主要包括7个环节:项目政策规划、信息搜集管理、信息交换和共享、信息管理、信息访问、信息使用、用户反馈。框架的结构虽然简单,但是可以让所有部门参与进来,把所有环节连接起来,形成一个闭合的回路。“我们信息中心不仅仅是让各个业务司的数据进行交换和共享,而是要建立生命周期框架,我们与各个部门在框架下指导下共同工作。” Davis说。
那么环境信息生命周期框架如何保证数据质量呢?虽然7个环节各有侧重,但是数据质量的内容贯穿着生命周期框架的全过程。
在数据搜集和管理中就要制定数据质量保证计划,确定数据的来源,比如哪些数据由企业提供,哪些从流域直接获得;之后进行采样分析,在分析过程中会对比实验分析数据和系统自动生成数据,确保数据质量;被存储的数据经过标准化,在信息管理环节,会被系统自动检查;信息中心在提取数据时,程序员会对数据进行检查,发现一些重要的信息点,都会进行标识。用户反馈环节是非常重要的一环,公众可以通过发送错误报告、提供最新数据进行反馈,从而对信息起到更正的作用。
以水监测为例,在数据收集阶段,就采用了三种数据搜集方法,首先对特定地区进行抽样,比如对水质改善进行投资的地区,其次对水质随机进行抽样,还会通过传感器、遥感、模块等其他工具进行抽样,从根源上对数据质量进行保障。