淘客熙熙

主题:侃侃我对雾霾的研究-1 -- 夕曦

共:💬13 🌺139 新:
全看分页树展 · 主题 跟帖
家园 侃侃我对雾霾的研究-5

我们在第一篇雾霾的研究中,玩出了不少花样儿,对整个领域到现在还有影响。

首先,开创了在环境健康领域使用公开数据进行研究的模式。除了健康数据(现在所谓的医学大数据),我们其它数据都是从公开渠道获得的,很多是可以从网络上下载的,比如气象数据可以从网上获得,卫星数据从美国国家航空航天局获得(NASA,填个申请表,寄过去个硬盘就行)。在这之前,研究人员都是自己去收集所有数据。由于需要跨越不同研究领域(环境检测、气象、健康),这类研究一般都比较简单、规模不大、跨越时间范围小,局限在几个地点,导致相关健康数据的样本非常小。如果时间跨度大、范围大,一般研究比较粗放,使用年平均或月平均值,无法研究具体一轮的雾霾事件。我们使用公众数据,可以绕过这些限制。

其次,从各个政府网站下载空气质量数据成为常规的研究方式。从08年开始,我每天从北京、上海环保局的网站上手工粘贴下载数据,用笨办法收集空气质量数据,再按照标准公式转换为PM10的浓度。开始我哥们、国内外的合作者都笑话我这个“民科”行为:没本事、没资源去收集找到空气质量监控数据,才玩公众数据。后来讨论08年奥运会空气质量控制效果时,我拿出下面的数据说明政府控制手段导致北京地区气象变化,再通过降水改善空气质量。那时研究者只能做两三个点的空气质量监控,我一下子拿出来北京市环保局和国家环保局在北京35个点的监控数据。

点看全图

外链图片需谨慎,可能会被源头改

(注:紫色线代表08奥运和残奥的时间,黑色线代表当时国家日均PM10的标准,那时没有PM2.5的监测标准)

这以后大家就不再笑话了,一般都是让自己的研究生、博士后每日下载数据。自2013年1月1日以后,国家立法建立PM2.5全国监控网络,监控点多了,数据量增加,每日由人工下载已经不可能了,大家就开始找人写程序从各个政府网站抓取几百个站点的数据。过了一段时间,可能政府不太愿意,不断改换网站上发布数据的格式、路径,于是大家又要修改程序,同时彼此心照不宣不再讨论如何下载数据,生怕政府把这个数据源给断绝了。这很有点儿猫抓老鼠的意思。。。这个方法对健康领域的研究人员非常有用,他们一般没有资金和技术去采集空气质量监测数据。到现在,如果没有收集这些数据,估计都不好意思在环境健康领域混了。

还有,促成了国内环境和健康两个领域的研究合作。我们刚开始在国内寻求合作时,要拜山头,搞清楚谁和谁有过节,不然是自找麻烦。当时看到搞环境研究的合作者已经发表的文章中,常常提到环境污染对健康有危害,就随口问“你们知道是什么危害吗?”回答是不知道。继续问与你们合作的搞健康研究的人员没有说过吗?回答是没有合作者。我们再问与我们合作的健康研究人员,回答也是没有国内的环境合作研究,一般都是与国外的人员合作。国内环境和健康两个领域的研究当时是平行的两条线,没有交集;如果有也是私人的合作,没有正式合作。我们的合作,很自然让两条线上的人开始交往,以后共同合作申请大的科研基金做更大的研究。

13年以后,一个与我们合作的健康研究人员成了电视上的常客,有重度雾霾侵袭时,常常会看到采访他的节目;与我们合作的环境研究人员中,有一个成了院士。

通宝推:道可道,西安笨老虎,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河