北京启动空气重污染橙色预警

更新时间:2016-12-06  信息来源:

  近日,北京启动空气重污染橙色预警。雾霾笼罩的城市,是不是又唤起了大家对雾霾中的耐药性基因对人体伤害的关注。而南方周末的袁端端记者引经据典的“人们没有必要有任何恐慌”的结论,似乎在一定程度上解除了人们对此的担忧。知社特邀请佐治亚大学在读环境健康学博士候选人王金承,以严谨的科学态度,从专业与研究方法两个角度,委婉地提出了自己的质疑。

  背景

  首先,Microbiome中文或可翻译为微生物群落学,早在上世纪80年代,已经有众多微生物群落对人体生理作用的研究报告。在2005年前后,随着二代测序技术(Next-Generation Sequencing, NGS)的发展成熟,这门学科有了突破性的发展。现今微生物群落学主要研究的是在某一生态域内(Environmental niche,例如土壤、污水等宏观环境或者人体肠道、皮肤等微环境),微生物群落(Microbial community)与其所生活的环境或宿主的相互关系。目前比较著名的研究案例是,来自Washington University in St。 Louis的Jeffrey Gordon教授课题组揭示了肥胖症与肠道微生物群落结构失调的因果关系。目前,这门学科还在发展的相对早期,大部分研究处于探索阶段,主要是揭示不同生态域内微生物群落的种群结构和基因组结构。

  Microbiome这个杂志在2013年刚刚创刊,根据SCI的影响因子来看,相对较高(~9),刊登较多的是Microbiome这一新兴领域内的方法学、新动向和新概念等方面的文章。Joakim Larsson课题组的这篇文章,利用了公共数据库内,对于不同环境微生物群落进行宏基因组测序(Metagenomic Sequencing)的数据, 分析了不同外在或内源环境里,微生物耐药性基因、可移动基因片段(Mobile genetic element)和微生物种群的分布。作为研究微生物耐药性的专家,Larsson教授的这篇文章研究方法比较新颖,探索了利用公共数据库的数据和Microbiome的概念进行细菌耐药性研究的可能性。

  之所以介绍Microbiome学科,杂志以及原始文献的相关背景,笔者希望说明Larsson教授的这篇论文着重探索而非逻辑完整的实证性研究;它所探讨的是有什么、怎么样、有什么可能性的问题,而非有没有、是什么、是不是的问题;研究目的是希望了解在各种环境中耐药性基因等分布这一科学问题,而不是检验空气颗粒中是否具有耐药性基因等这一科学假设。这也许就是公众产生误读的一个重要原因。

  研究的科学问题

  回过头来,我们探讨一下原始文献所涉及的科学与技术问题。文章作者在介绍研究背景时指出耐药性基因广泛存在于自然环境,但只有当其同时存在于致病菌之中的时候,才会造成健康问题。然而,作者认为如果在某一生态域内耐药性基因的种类和丰度较高的时候,有可能会发生耐药性基因在不同细菌之间的转移,可能导致的结果是耐药性基因由非致病菌向致病菌转移或者向人体内细菌转移。因此,作者想要了解一下在不同生态域中,耐药性基因的种类和丰度究竟是怎样的。为了实现这一目标,作者收集了一些来自印度的收医药污水污染的河流及湖泊样品,利用宏基因组测序的方法获得了一些数据;此外,作者还从两个公共数据库,MG-RAST Server和Human Microbiome Project中,分别获得了一些环境和人体样品的宏基因组测序数据。包括作者自己的数据在内,作者将测序结果与两个耐药性基因数据库Resqu和BacMet进行了比对,获得了耐药性基因等在不同样品中的分布情况。而新京报的新闻着重报道了原始文献中关于北京雾霾样品的分析结果,实际上在其所分析的864个样品中,来自北京雾霾的样品有14个,其它还有土壤、自然水体、底泥、矿井、水处理污泥和人体及动物体内的样品。这也从另一个方面说明,原始文献并不是专门探讨北京雾霾的情况。

  如果不考虑其它样品,仅以原始文献北京样品的分析结果为基础,想要搞清楚空气颗粒中存在的耐药性基因是否对人体产生危害,这里面所涉及的科学问题,南方周末的报道已经谈到了不少。其中,着重谈到了“耐药性并不等于致病性”。这主要是因为原文分析采用了宏基因组测序的数据,技术上无法直接区分耐药性基因是否来自致病菌。然而就如原文背景所强调的那样,环境中可能存在着不同细菌间的基因迁移;虽然耐药性不等于致病性,但仍然存在耐药性基因进入致病菌的可能性。此外存在于空气颗粒中的致病菌(如果还有耐药性基因)是否具有活性,是否能够通过鼻腔进入人体肺泡,进入肺泡的致病菌是否能够抵挡人体自身的免疫反应(与是否耐药无关),以及这些致病菌如何在肺部对人体健康产生作用,这些都是空气中存在的耐药性基因是否会对人体健康产生危害的关键科学问题。

  技术问题

  以上科学问题已经有许多解读,就不一一展开。然而对于Microbiome领域的研究,有一个至关重要的问题往往被很多研究者忽略,即microbiome分析的技术问题。一个完整的Microbiome的研究往往有以下几个阶段:样本采集,微生物DNA(或者RNA)library preparation,DNA测序,测序数据的生物信息学分析,和统计分析。目前大部分主流DNA测序平台的错误率比较低、方法相对可靠,但是在DNA library preparation的过程中,尤其是DNA/RNA extraction的效率或者代表性、以及PCR过程中产生的误差对结果可能产生很大影响。这些问题虽然是普遍共识,但目前尚未有较好的解决办法。虽然Larsson教授的论文大部分数据来自公共数据库,但仍然甚至更加难以量化实验可能产生的误差。

  此外,作为原文数据来源的两个公共数据库其中之一的Human Microbiome Project(HMP),是由美国National Institute of Health资助成立的专门研究人体微生物群落的项目。其数据来自研究Microbiome的顶级实验室,且保守估计有数十篇刊发于顶级刊物的论文采用过其数据,因此相对比较可靠。然而,另一个数据库MG-RAST Server,实际是美国芝加哥大学和Argonne国家实验室共同建设的自动化宏基因组数据分析的平台。来自世界各地的研究者可以将自己测序的数据,提交给MG-RAST进行分析,同时这些数据可以被分享给其他研究者使用。与HMP的数据来源不同,MG-RAST里的数据来自世界各地,相对应的数据质量可能有比较大的差别。

  除了数据来源的可靠性外,根据笔者从事Microbiome数据分析的经验,生物信息学数据分析阶段采用不同方法和参数也可能对分析结果产生比较大的影响,这一点对于宏基因组测序尤为显著。以原始文献为例,在取得测序数据后,作者先采用了一定方法,筛除了质量较差的数据。然后使用Usearch软件与Resqu和BacMet两个数据库进行比对(Global alignment且相似度设为90%),这之后又采用了多种Normalization的方法进行了修正,其中一个修正步骤利用了16S rRNA gene的丰度和长度。此外尽管在论文方法部分,作者原计划每个样品采用10 million的测序序列,在分析空气样品的时候(包括北京的样品),实际是每个样品采用了350,000条序列。以上几乎每一步的参数设置,都有可能对结果有比较大的影响。

  最后,统计分析是另一个常常被忽略但又十分重要的环节。NGS时代的统计分析,与传统的实验性研究有两个显著的不同。

  虽然单一实验往往因经费限制样本数量不大,但每一个样本基因测序的数据量惊人;

  microbiome的本质是群落分析,群落里有不同的物种、不同的基因、不同的转录子、不同的蛋白质,因此microbiome的统计分析往往是多元分析,并且response variable(多元的“元”)的数量可能十分巨大(数百甚至上万)。

  在这种情况下,统计学的显著性判断对于结果就有了十分巨大的影响;如何选择显著性水平、修正方法、采用哪一种分析方法,目前仍然没有一个相对的共识。

  总结

  通过以上的分析,笔者认为因为原文本就是探索性质,对于“耐药性基因是不是致病菌”,“北京雾霾是不是会诱发产生超级细菌并对人体有害”这一问题,我们不能简单地回答是或者不是。本文也不是在肯定或者否定原始文献的任何方面,只是希望指出我们需要注意的科学和技术问题,尤其希望能有更多的学者理解在NGS时代技术问题对于科学结论的重要性有时甚至超越了科学假设本身。最后笔者在阅读文献的过程中感受到,太多探索性的研究止步于探索,在制造一个“大新闻”之后就开始寻找下一个“大新闻”,缺少较为严肃的科学探讨,因此笔者希望Larsson教授能在原文的基础上能有更进一步的实证研究。