程序有所改变。发帖如还有问题请报告
【征集】西西河的经济学，及清流措施，需要主动参与者，『稷下学宫』新认证方式，24年网站打算和努力目标

主题：侃侃我对雾霾的研究-1 -- 夕曦

共:💬13 🌺139 新:

老大河待整

侃侃我对雾霾的研究-5

我们在第一篇雾霾的研究中，玩出了不少花样儿，对整个领域到现在还有影响。

首先，开创了在环境健康领域使用公开数据进行研究的模式。除了健康数据（现在所谓的医学大数据），我们其它数据都是从公开渠道获得的，很多是可以从网络上下载的，比如气象数据可以从网上获得，卫星数据从美国国家航空航天局获得（NASA，填个申请表，寄过去个硬盘就行）。在这之前，研究人员都是自己去收集所有数据。由于需要跨越不同研究领域（环境检测、气象、健康），这类研究一般都比较简单、规模不大、跨越时间范围小，局限在几个地点，导致相关健康数据的样本非常小。如果时间跨度大、范围大，一般研究比较粗放，使用年平均或月平均值，无法研究具体一轮的雾霾事件。我们使用公众数据，可以绕过这些限制。

其次，从各个政府网站下载空气质量数据成为常规的研究方式。从08年开始，我每天从北京、上海环保局的网站上手工粘贴下载数据，用笨办法收集空气质量数据，再按照标准公式转换为PM10的浓度。开始我哥们、国内外的合作者都笑话我这个“民科”行为：没本事、没资源去收集找到空气质量监控数据，才玩公众数据。后来讨论08年奥运会空气质量控制效果时，我拿出下面的数据说明政府控制手段导致北京地区气象变化，再通过降水改善空气质量。那时研究者只能做两三个点的空气质量监控，我一下子拿出来北京市环保局和国家环保局在北京35个点的监控数据。

点看全图

外链图片需谨慎，可能会被源头改

（注：紫色线代表08奥运和残奥的时间，黑色线代表当时国家日均PM10的标准，那时没有PM2.5的监测标准）

这以后大家就不再笑话了，一般都是让自己的研究生、博士后每日下载数据。自2013年1月1日以后，国家立法建立PM2.5全国监控网络，监控点多了，数据量增加，每日由人工下载已经不可能了，大家就开始找人写程序从各个政府网站抓取几百个站点的数据。过了一段时间，可能政府不太愿意，不断改换网站上发布数据的格式、路径，于是大家又要修改程序，同时彼此心照不宣不再讨论如何下载数据，生怕政府把这个数据源给断绝了。这很有点儿猫抓老鼠的意思。。。这个方法对健康领域的研究人员非常有用，他们一般没有资金和技术去采集空气质量监测数据。到现在，如果没有收集这些数据，估计都不好意思在环境健康领域混了。

还有，促成了国内环境和健康两个领域的研究合作。我们刚开始在国内寻求合作时，要拜山头，搞清楚谁和谁有过节，不然是自找麻烦。当时看到搞环境研究的合作者已经发表的文章中，常常提到环境污染对健康有危害，就随口问“你们知道是什么危害吗？”回答是不知道。继续问与你们合作的搞健康研究的人员没有说过吗？回答是没有合作者。我们再问与我们合作的健康研究人员，回答也是没有国内的环境合作研究，一般都是与国外的人员合作。国内环境和健康两个领域的研究当时是平行的两条线，没有交集；如果有也是私人的合作，没有正式合作。我们的合作，很自然让两条线上的人开始交往，以后共同合作申请大的科研基金做更大的研究。

13年以后，一个与我们合作的健康研究人员成了电视上的常客，有重度雾霾侵袭时，常常会看到采访他的节目；与我们合作的环境研究人员中，有一个成了院士。

通宝推：道可道,西安笨老虎,

全看分页树展 · 主题跟帖

相关回复上下关系8
- 🙂侃侃我对雾霾的研究-1 48 夕曦字3159 2017-12-21 09:26:33
  - 🙂侃侃我对雾霾的研究-5
  - 🙂侃侃我对雾霾的研究-4 11 夕曦字3044 2018-01-01 13:43:08
    🙂期待你的《三心二意玩科研》西电鲁丁字0 2018-01-01 14:10:27
  - 🙂侃侃我对雾霾的研究-3 21 夕曦字3857 2017-12-30 11:33:44
  - 🙂好贴！支持华北禁煤！请我吃饭字0 2017-12-26 09:59:20
    🙂下面会讨论，禁煤不一定有效果夕曦字84 2017-12-26 10:32:02
    😜快点快点，都不知道该夸你还是说你胡一刀字88 2017-12-30 07:39:19

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明