导读
在人类繁衍至今的地球上,大多数物种正遭受着气候变化的影响 。微生物支持所有高等营 养生 命形式的存在。为了 了解地球上的人类和其他生命形式(包括那些我们尚未发现的)如何能够抵御人为的气候变化--重要的是纳入对微生物的了解。我们不仅应该了解微生物如何影响气候变化(包括温室气体的生产和消耗),还应该
核心作用以及其在全球范围内的重要性。它提醒人们 ,气候变化的影响将在很大程度上取决于微生物的 响应,而微生物的响应对于实现环境可持续发展的未来至关重要。
论文ID
原名: Scientists’ warning to humanity: microorganisms and climate change
译名: 科学家对人类的警告:微生物与气候变化
期刊: Nature Reviews Microbiology
IF: 34.648
DOI:
发表时间: 2019年
通信作者: Ricardo Cavicchioli
通信作者单位: 新南威尔士大学(The University of New South Wales)
文章上线一年就被引186次,可见期重要性和影响力
综述内容
2 海洋生物群
海洋生物占地球表面的70%,从沿海河口,红树林和珊瑚礁到公海(图1)。 温度 上升不仅会影响 生物过程 ,还会降低水的密度,导致分层和环流现象的发生,从而影响生物的扩散以及营养物质的运输。 降水,盐度和风也影响分层 ,混合以及环流。来自空气、河流和河口流动的养分输入同样会对微生物的组成和功能造成影响,而气候变化会影响所有这些物理因素。
海洋环境中除了数量庞大的海洋微生物外,还发挥着重要的生态系统功能。海洋微生物通过碳和氮的固定,使有机物矿化,形成海洋食物网以及全球碳和氮循环的基础。颗粒有机物中碳的沉积以及其固定到海洋沉积物中过程是大气中螯合CO 2 的关键长期机制。因此,通过矿化和海底储藏碳氮的释放之间的平衡决定了气候变化。除了变暖(由于大气中CO 2 浓度的增加,增强了温室效应),海洋环境自工业化前以来酸化了约0.1个pH单位,预计到本世纪末还会进一步减少0.3-0.4个单位。因此有必要了解海洋生物将做出何种响应。 温室气体浓度升高对海洋温度,酸化,分层,混合,温盐环流,养分供应,辐射和极端天气事件的影响会对海洋微生物菌群产生重大环境影响,这些影响包括生产力,海洋食物网,海底碳排放和固定等方面。
2.1 微生物影响气候变化
海洋浮游植物只占全球植物生物量的1%,但却完成了全球一半的光合作用(CO2 的固定以及OO 2 的产生)。与陆生植物相比,海洋浮游植物分布范围更广,受季节变化的影响较小,周转率更快。因此,浮游植物在全球范围内对气候变化反应迅速。太阳辐射、温度和淡水向地表水输入的增加加强了海洋分层,从而减少了营养物质从深水到地表水的输送,降低了初级生产力。相反,CO 2 含量的升高,在营养成分不受限制的情况下,可以增加浮游植物的初级生产力。一些研究表明,在过去的一个世纪里,全球海洋浮游植物的总体密度有所下降,但由于数据获得的有限性、分析方法的差异等多方面原因,这些结论需要进一步考证。也有研究发现全球海洋浮游植物产量增加以及特定区域或特定浮游植物群的变化。全球海水冰面积的下降,导致更高的光渗透率和潜在的更多初级生产;然而,对于可变混合模式、养分供给变化以及极地地区的生产力趋势影响的预测效应相存在矛盾的现象。这强调了收集关于浮游植物生产和微生物群落组成的 长期数据 的必要性。
除了海洋浮游植物对CO 2 固定的贡献外,化学自养古菌和细菌同样可以在深水黑暗条件下以及极地冬季期间在表层进行CO 2 的固定。海底产甲烷菌和甲烷氧化菌是CH 4 的重要生产者和消费者,但它们对这种温室气体大气通量的影响尚不确定。海洋病毒、嗜细菌细菌以及真核食草动物也是微生物食物网的重要组成部分。气候变化对捕食者-被捕食者的相互作用的影响,包括病毒-宿主的相互作用,可以影响全球生物地球化学循环。
气溶胶影响云的形成,从而影响阳光照射和降水,但它们影响气候的程度和方式仍不确定。海洋气溶胶由海盐、非海盐硫酸盐和有机分子的复杂混合物组成,可以作为云凝结的核,影响辐射平衡,从而影响气候。了解海洋浮游植物对气溶胶的贡献方式,可以更好地预测不断变化的海洋环境将如何影响云层和对气候的反馈。此外,大气本身含有大约10 22 个微生物细胞,确定大气微生物生长和形成聚集体的能力对于评估它们对气候的影响具有重要价值。
植物生长的沿海生境对于碳的固定具有十分重要的意义,人类活动,包括人为的气候变化,在过去的50年里使这些栖息地减少了25-50%,海洋捕食者的数量减少了高达90%。基于微生物活动决定了有多少碳被再矿化并释放为CO2 和CHCH 4 ,同时考虑到如此广泛的环境扰动,因此这些扰动对微生物群落的影响同样需要进一步评估。
2.2 气候变化对微生物的影响
气候变化扰乱了物种之间的相互作用,迫使物种适应、迁移或被其他物种取代或灭绝。 海洋变暖、酸化、富营养化和过度使用(例如捕鱼、 旅游 )共同导致珊瑚礁的衰退,并可能导致生态系统的改变 。一般来说,微生物比宏观生物更容易分散。然而,许多微生物物种存在生物地理差异,扩散、生活方式和环境因素强烈影响群落组成和功能。海洋酸化使海洋微生物的pH条件远远超出其 历史 范围,从而影响到其胞内pH水平。不善于调节体内pH值的物种会受到更大的影响,许多环境和生理因素影响微生物在其本土环境中的反应和整体竞争力。例如, 温度 升高会 增加 真核浮游植物的蛋白质合成 ,同时 降低细胞核糖体浓度 。由于真核浮游植物的生物量为~1 Gt C,核糖体富含磷酸盐,气候变化引起的氮磷比的改变将影响全球海洋的资源分配。海洋变暖被认为有利于较小的浮游生物而不是较大的浮游生物,改变了生物地球化学通量。 海洋温度升高、酸化和营养供应减少预计将增加浮游植物细胞外溶解有机质的释放,微生物食物网络的变化可能导致微生物产量增加,而牺牲更高的营养水平 。温度升高还可以缓解铁对固氮蓝藻的限制,对未来变暖海洋的食物网提供的新氮来源具有潜在的深远影响。需要认真注意如何量化和解释环境微生物对生态系统变化和与气候变化相关的压力的响应。因此,关键问题仍然是关于菌群转移的功能后果,例如碳再矿化与碳固存的变化,以及与养分循环之间的关系。
3 陆生生物
陆地生物量是海洋生物量的100倍,其中陆地植物约占全球一半的净初级生产力。土壤储存了约2万亿吨的有机碳,其数量远高于大气和植被中碳的总和。陆地环境中的微生物总数与海洋环境中的总数相似。土壤微生物调节储藏在土壤中以及释放到大气中的有机碳的数量,并通过提供调节生产力的多种营养元素间接地影响植物和土壤中的碳储存。
植物通过光合作用吸收大气中的CO 2 ,并产生有机质;相反,植物的自养呼吸和微生物的异养呼吸将CO 2 释放回大气中。温度影响这些过程之间的动态平衡,从而影响陆地生物圈捕获、储存人为碳排放的能力(图1)。而气候变暖可能加速碳的排放。森林覆盖陆地面积的30%,占陆地初级生产力的50%,对人为排放的CO 2 的固存率高达25%。永久冻土中的有机物质中碳的积累远超过呼吸所损失的,创造了最大的陆地碳汇。但由于气候变暖预计将使永久冻土减少28-53%,从而使大型碳库可用于微生物呼吸以及温室气体排放。
通过对表层土壤(10cm)和以及深层土壤(100cm)剖面进行对比评估发现,气候变暖会增加碳向大气中的排放。有关不同土壤地点之间碳损失的差异的进一步解释需要更多的预测变量。然而,来自全球对变暖反应的评估的预测表明,气候变暖条件下,陆地碳损失产生了积极的反馈,加速了气候变化的速度,特别是在寒冷和温带地区(这些地区储存全球大部分土壤碳)。
3.1 微生物对气候变化的影响
CO 2 含量的升高,提高了初级生产力,增加了植物凋落物含量,促进了微生物对凋落物的分解从而导致更高的碳排放。温度的影响不仅是微生物反应速率的动力学效应,也是植物输入刺激微生物生长的结果。一些固有的环境因素(如微生物群落组成、枯木密度、氮素可获得性和水分)影响微生物活动,这就需要通过地球系统模型对气候变暖所造成的土壤碳损失进行预测,以纳入对生态系统过程的控制。在这方面,植物养分的可获得性影响森林的净碳平衡,营养贫乏的森林比营养丰富的森林释放更多的碳。植物将约50%的固定的碳释放到土壤中,供微生物生长。分泌物除了被微生物利用作为能源外,还可以破坏矿物-有机体的结合,从微生物呼吸利用的矿物中释放出有机化合物,增加碳排放。这些植物-矿物质相互作用的相关性说明了在评估气候变化的影响时,除了生物相互作用(植物-微生物)之外,生物-非生物相互作用的重要性。
土壤有机质用于微生物降解还是长期储存取决于许多环境因素,包括土壤矿物特征、酸度、氧化还原状态、水的有效性、气候等方面。有机物的性质,特别是基质的复杂性,同样会影响微生物的分解。此外,不同土壤类型中微生物获取有机质的能力具有差异性。如果将可获得性考虑在内,预计大气中CO 2 含量的增加将促进微生物的分解能力,这会使得土壤中有机碳的留存量降低。升高的CO 2 浓度增强了植物和微生物之间对氮的竞争。食草动物会影响土壤中的有机质含量,从而影响微生物的生物量和活性。气候变化可以减少食草动物,导致全球氮和碳循环的总体变化,从而减少陆地碳的固定。有害动物(例如蚯蚓)通过间接影响植物(例如,增加土壤肥力)和土壤微生物来影响温室气体排放。蚯蚓肠道中的厌氧环境含有执行反硝化并产生NO2 的微生物。蚯蚓提高了土壤肥力,它们的存在可以导致温室气体净排放,尽管温度升高和降雨量减少对有害生物摄食和微生物呼吸的综合影响可能会减少排放。
在泥炭地,抗腐烂的枯枝落叶等会抑制微生物分解,同时水饱和度限制了氧的交换,促进了厌氧菌的生长以及CO2 和CHCH 4 的释放。植物凋落物组成和相关微生物过程的变化(例如,减少对氮的固定化和增强的异养呼吸)正在将泥炭地从碳汇转变为碳源。永久冻土的融化使得微生物可以分解先前冻结的碳,释放CO2 和CHCH 4 。永久冻土的融化导致了水饱和土壤的增加,这促进了产甲烷菌和一系列微生物产生CH 4 和CO 2 。据预测,到本世纪末,缺氧环境的碳排放将比好氧环境的排放在更大程度上驱动气候变化。
3.2 气候变化对微生物的影响
气候的改变可以直接(例如季节性和温度)或间接(例如植物组成、植物凋落物和根系分泌物)影响微生物群落的结构和多样性。土壤微生物多样性影响植物多样性,对包括碳循环在内的生态系统功能很重要。短期实验室模拟变暖以及长期(50多年)自然地热变暖最初都促进了土壤微生物的生长和呼吸,导致CO 2 净释放,随着基质的耗尽,导致生物量减少,微生物活性降低。这意味着微生物群落不容易适应高温,由此产生的对反应速率和底物损耗的影响减少了碳的整体损耗。相比之下,一项长达10年的研究发现,土壤群落能够通过改变基质使用的模式以适应升高的温度,从而减少碳的损失。在年平均温度范围超过20 C的森林土壤中也发现了细菌和真菌群落的实质性变化。
微生物生长对温度的响应是复杂多变的。微生物生长效率是衡量微生物如何有效地将有机物转化为生物量的指标,效率较低意味着更多的碳被释放到大气中。一项为期一周的实验室研究发现,温度升高导致微生物周转率增加,但微生物生长效率没有变化,同时该研究预测,气候变暖将促进土壤中的碳积累。一项长达18年的实地研究发现,土壤温度越高,微生物的效率就会降低,在这段时间结束时,不易分解的底物的分解会增加,同时土壤碳的净损失也会增加。
气候变化通过温度、降水、土壤性质和植物输入等几个相互关联的因素直接或间接地影响微生物群落及其功能。由于沙漠中的土壤微生物受到碳的限制,植物增加的碳输入促进了含氮化合物的转化,微生物生物量,多样性,酶活性以及对复杂有机物的利用。虽然这些变化可能会增强呼吸作用和土壤中碳的净损失,但干旱和半干旱地区具有的特点可能意味着它们可以起到碳汇的作用。为了更好地了解地上植物生物量对CO 2 水平和季节性降水的响应,我们仍需增加对微生物群落响应以及功能的了解。
气候变化同样也使湖泊、海水等环境中富营养化的频率、强度和持续时间增加。水华蓝藻能够产生各种神经毒素、肝毒素和皮毒素,危害鸟类和哺乳动物的 健康 。有毒蓝藻目前已造成了包括中国太湖在内的全世界多个地区严重的水质问题。气候变化直接和间接地有利于蓝藻的生长,许多形成水华的蓝藻可以在相对较高的温度下生长。与此同时,湖泊和水库热分层的增加使浮力蓝藻能够向上漂浮并形成密集的表面水华,这使它们能够更好地获得光,更加具有选择性优势。目前实验室和原位实验都证明了有害的蓝藻 Microcystis 属具有适应高CO 2 的能力。因此,气候变化和CO 2 含量的增加预计会影响蓝藻水华的菌株组成。
4 农业
根据世界银行表明(世界银行关于农业用地的数据),近40%的陆地环境专门用于农业。这一比例在未来预计有可能增加,这将导致土壤中碳、氮和磷以及其他养分的循环发生重大变化。此外,这些变化与生物多样性的丧失息息相关。增加对使用植物和动物相关的微生物的了解,以提高农业可持续性发展,减轻气候变化对粮食生产的影响,但这样做需要更好地了解微生物对气候变化的响应。
4.1 微生物对气候变化的影响
甲烷菌在自然和人工厌氧环境中产生甲烷,此外还有与化石燃料相关的人为甲烷的排放(图2)。近年来(2014-2017)大气CH 4 水平显著升高,但其背后的原因尚不清楚。尽管 水稻 仅覆盖了10%的可用耕地,但却养活了全球一半的人口,同样,稻田也贡献了农业20%的CH 4 排放的。据预测,到本世纪末,人为气候变化将使水稻生产产生的CH 4 排放量翻一番。 反刍动物 是人为CH 4 排放的最大单一来源,反刍动物肉类生产所产生的碳排放比植物高蛋白食物生产的碳排放高19-48倍;即使是非反刍动物肉类生产所产生的CH 4 也比植物高蛋白食物生产的碳排放高出3-10倍。 化石燃料 的燃烧和化肥的使用大大增加了环境中可利用氮含量,扰乱了全球生物地球化学过程,威胁到生态系统的可持续发展。农业是温室气体NO2 的最大排放者,NO2 通过微生物氧化和氮的还原而释放。气候变化扰乱了微生物氮转化(分解、矿化、硝化、反硝化和固定)和N 2 O的释放速率。迫切需要了解气候变化和其他人类活动对氮化合物微生物转化的影响。
4.2 气候变化对微生物的影响
升温和干旱强烈地影响着作物的生长。以真菌为基础的土壤食物网在广泛管理的农业(例如牧场)中很常见,而以细菌为基础的食物网通常出现在集约化系统中,但与后者相比,前者更能适应干旱环境。对全球范围内的表层土进行评估发现, 土壤真菌和细菌占据了特定的生态位,并且对降水和土壤pH的响应不同,这表明气候变化将对它们的丰度、多样性和功能产生不同的影响 。预计由于气候变化而增加的干旱会导致全球旱地中细菌和真菌的多样性和丰度的减少,这种减少将进一步降低微生物群落的整体功能,从而限制了它们支持植物生长的能力。
气候变化和富营养化(由于化肥的施用)对微生物竞争力的综合影响存在不可预测的影响。例如,营养丰富通常有利于有害的藻类繁殖,但在相对较深的Zurich湖中观察到了不同的结果。
5 感染性疾病
气候变化影响着海洋和陆地生物群中疾病的发生和传播(图3),这取决于不同的 社会 经济、环境和宿主病原体特有的因素。了解疾病的传播和设计有效的控制策略需要充分了解病原体、及其传播媒介和宿主的生态学,以及扩散和环境因素(表1)。例如,海洋酸化还可能直接导致鱼类等有机体的组织损伤,潜在地导致免疫系统减弱,从而创造细菌入侵的机会。对于农作物来说,当人们考虑对病原体的响应时,包括CO 2 水平、气候变化、植物与病原体的相互作用在内的不同相互作用的因素都是重要的。不同的的微生物能够引起不同的植物疾病,进而影响作物生产,导致饥荒,并威胁粮食安全。病原体的传播和疾病的出现是通过物种的运输和引进来促进的,并受天气对扩散的影响和生长环境条件的影响。
表1 病原体对气候和环境因素的传播响应。
气候变化可以通过改变宿主和寄生虫的适应来增加疾病风险。对于外温动物(如两栖动物),温度可以通过扰乱免疫反应,从而增加感染的易感性。每月和每天不可预测的环境温度波动增加了古巴树蛙对病原菊苣真菌 Batrachochytrium dendrobatidis 的敏感性。温度升高对感染的影响与真菌在纯培养中生长能力下降形成对比,说明在评估气候变化的相关性时,更应该注重于评估宿主-病原体的反应(而不是从分离微生物的生长速率研究中推断)。气候变化预计会增加一些人类病原体对抗生素的耐药率。2013-2015年的数据表明,日最低温度提高10 C,将导致 Escherichia coli , Klebsiella pneumoniae 以及 Staphylococcus aureus 的抗生素耐药率增加2-4%。潜在的潜在机制包括:高温促进抗药性可遗传因子的水平基因转移,以及提高病原体生长率,促进环境的持久性、携带和传播等。
食源性、气源性、水源性和其他环境病原体可能易受气候变化的影响(表1)。对于媒介传播的疾病,气候变化将影响媒介的分布,从而影响疾病传播的范围,以及媒介传播病原体的效率。许多传染病,包括几种媒介传播疾病和水传播疾病,都受到大规模气候现象(如ENSO)造成的气候变化的强烈影响,这种现象每隔几年就会破坏全球约三分之二地区的正常降雨模式和温度变化。据报道,与ENSO有关的疾病有疟疾、登革热、齐卡病毒病、霍乱、鼠疫、非洲马病和许多其他重要的人类和动物性疾病。
尽管已经在自然和实验室条件下,微生物种群的适应机制已有研究,但与动物(包括人类)和植物相比,微生物物种适应当地环境的研究较少。与植物和动物相关的病毒、细菌和真菌病原体以影响生态系统功能、影响人类 健康 和粮食安全的方式适应非生物和生物因素。病原农业真菌的适应模式很好地说明了微生物活动与人类活动之间的循环反馈。“农业适应”病原体引起流行病的可能性比自然产生的菌株更高,这会对作物生产构成更大的威胁。真菌病原体通过进化以适应更高的温度来增强它们入侵新的栖息地的能力,这使真菌病原体对自然和农业生态系统构成的威胁更加复杂。
6 微生物减缓气候变化
增加对微生物相互作用的了解将有助于设计缓解和控制气候变化及其影响的措施。例如,了解蚊子如何对Wolbachia细菌(节肢动物的一种常见共生体)作出反应,通过将Wolbachia引入埃及伊蚊种群并将其释放到环境中,从而减少了寨卡病毒、登革热和基孔肯雅病毒的传播。在农业方面,了解将NO2 还原为无害N 2 的微生物的生态生理学的进展为减少排放提供了选择。生物炭是广泛和间接减轻气候变化微生物影响的农业解决方案的一个例子。生物炭是通过限制氧条件下生物质的热化学转化而产生的,其可以通过减少微生物矿化和减少根系分泌物对矿物释放有机物的影响,从而促进植物的生长,减少碳的释放,从而改善有机质的存留。
微生物生物技术可以为可持续发展提供解决方案,微生物技术同样为实现联合国17个可持续发展目标中的许多目标提供了实用的解决方案(化学品、材料、能源和补救措施),解决贫困、饥饿、 健康 、清洁水、清洁能源、经济增长、产业创新、可持续发展等问题。毫无疑问,通过提高公众对全球变暖中微生物的主要作用的认识,即通过实现 社会 的微生物学素养,无疑会促进对此类行动的支持。
7 总结
微生物对固碳做出了重大贡献,特别是海洋浮游植物,它们固定的净CO 2 与陆地植物一样多。因此,影响海洋微生物光合作用和随后在深水中储存固定碳的环境变化对全球碳循环具有重要意义。微生物还通过异养呼吸(CO 2 )、产甲烷(CH 4 )和反硝化(N 2 O)等作用对温室气体排放做出重大贡献。许多因素影响微生物温室气体捕获与排放的平衡,包括生物群落、当地环境、食物网的相互作用和反应,特别是人为气候变化和其他人类活动。 直接影响微生物的人类活动包括温室气体排放、污染、农业活动以及人口增长,这些活动促进了气候变化、污染、农业活动以及疾病传播 。人类活动改变了碳固定与释放的比率,将加速气候变化的速度。相比之下,微生物也提供了重要的机会,可以通过改善农业、生产生物燃料和修复污染来补救人为问题。
为了理解可控范围内小规模相互作用的微生物多样性和活动如何转化为大系统通量,重要的是将研究结果从个体扩展到群落,再到整个生态系统。为了了解世界各地不同地点的生物地球化学循环和气候变化反馈,我们需要关于推动物质循环的生物(包括人类、植物和微生物)以及调节这些生物活动的环境条件(包括气候、土壤理化特性、地形、海洋温度、光和混合)的定量信息。
现存的生命经过了数十亿年的进化,产生了巨大的生物多样性,而微生物多样性与宏观生命相比实际上是无限的。 由于人类活动的影响,宏观生物的生物多样性正在迅速下降 ,这表明动植物物种的宿主特异性微生物的生物多样性也将减少。然而,与宏观生物相比,人类 对微生物与人为气候变化之间的联系所知甚少 。我们可以认识到微生物对气候变化的影响,以及气候变化对微生物的影响,但我们对生态系统的了解并不全面,因此,在解释人为气候变化对生物系统造成的影响方面仍存在挑战。由于人类的活动,正导致气候变化,这对全球生态系统的正常行驶功能造成影响。在海洋和陆地生物群落中,微生物驱动的温室气体排放的增加,并积极地反馈给气候变化。忽视微生物群落对气候变化的作用、影响和反馈反应可能导致会导致对人类的发展造成威胁。目前迫切需要立即、持续和协调一致的努力,明确将微生物纳入研究、技术开发以及政策和管理决策当中。
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
核心期刊:气象学报、大气科学、热带气象学报、南京信息工程大学学报、气象、气象科技、气象科学、气候与环境研究等
报纸:中国气象报
从Fortran到arXiv.org,这些计算机编码和平台让生物学、气候科学和物理学等学科的发展达到了真正“日新月异”的速度。
2019年,事件视界望远镜团队让世界首次看到了黑洞的样子。不过,研究人员公布的这张发光环形物体的图像并不是传统的图片,而是经过计算获得的。利用位于美国、墨西哥、智利、西班牙和南极地区的射电望远镜所得到的数据,研究人员进行了数学转换,最终合成了这张标志性的图片。研究团队还发布了实现这一壮举所用的编程代码,并撰文记录这一发现,其他研究者也可以在此基础上进一步加以分析。
这种模式正变得越来越普遍。从天文学到动物学,在现代每一项重大科学发现的背后,都有计算机的参与。美国斯坦福大学的计算生物学家迈克尔·莱维特因“为复杂化学系统创造了多尺度模型”与另两位研究者分享了2013年诺贝尔化学奖,他指出,今天的笔记本电脑内存和时钟速度是他在1967年开始获奖工作时实验室制造的计算机的1万倍。“我们今天确实拥有相当可观的计算能力,”他说,“问题在于,我们仍然需要思考。”
如果没有能够解决研究问题的软件,以及知道如何编写并使用软件的研究人员,一台计算机无论再强大,也是毫无用处的。如今的科学研究从根本上已经与计算机软件联系在一起,后者已经渗透到研究工作的各个方面。近日,《自然》(Nature)杂志将目光投向了幕后,着眼于过去几十年来改变科学研究的关键计算机代码,并列出了其中10个关键的计算机项目。
这台CDC 3600型计算机于1963年交付给位于科罗拉多州博尔德的国家大气研究中心,研究者在Fortran编译器的帮助对其进行了编程
语言先驱:Fortran编译器(1957年)
最初的现代计算机并不容易操作。当时的编程实际上是手工将电线连接成一排排电路来实现的。后来出现了机器语言和汇编语言,允许用户用代码为计算机编程,但这两种语言都需要对计算机的架构有深入的了解,使得许多科学家难以掌握。
20世纪50年代,随着符号语言的发展,特别是由约翰·巴克斯及其团队在加州圣何塞的IBM开发的“公式翻译”语言Fortran,这种情况发生了变化。利用Fortran,用户可以用人类可读的指令来编程,例如x = 3 + 5。然后由编译器将这些指令转换成快速、高效的机器代码。
不过,这一过程仍然很不容易。早期的程序员使用打孔卡来输入代码,而复杂的模拟可能需要数万张打孔卡。尽管如此,新泽西州普林斯顿大学的气候学家真锅淑郎(Syukuro Manabe)还是指出,Fortran让非计算机科学家也能编程,“这是我们第一次能够自己给计算机编程”。他和同事们利用这种语言开发的气候模型是最早取得成功的模型之一。
Fortran发展至今已经到了第八个十年,它仍然广泛应用于气候建模、流体动力学、计算化学等学科,这些学科都涉及到复杂线性代数并需要强大的计算机来快速处理数字。Fortran生成的代码速度很快,而且仍然有很多程序员知道如何编写。古早的Fortran代码库仍然活跃在世界各地的实验室和超级计算机上。“以前的程序员知道他们在做什么,”美国海军研究院的应用数学家和气候模型师弗兰克·吉拉尔多说,“他们非常注重内存,因为他们拥有的内存非常少。”
信号处理器:快速傅立叶变换(1965)
当射电天文学家扫描天空时,他们捕捉到的是随时间变化的复杂信号杂音。为了理解这些无线电波的本质,他们需要看到这些信号作为频率的函数时是什么样的。一种名为“傅里叶变换”的数学过程可以帮到研究人员,但它的效率很低,对于一个大小为N的数据集需要N^2次计算。
1965年,美国数学家詹姆斯·库利和约翰·杜基想出了一种加速该过程的方法。快速傅里叶变换(FFT)通过递归(一种通过重复将问题分解为同类的子问题而解决问题的编程方法)将计算傅里叶变换的问题简化为N log2(N)步。随着N的增加,速度也会提高。对于1000个点,速度提升大约是100倍;100万个点则是5万倍。
这个“发现”实际上是一个再发现,因为德国数学家高斯在1805年就对此进行了研究,但他从未发表过。而詹姆斯·库利和约翰·杜基做到了,他们开启了傅里叶变换在数字信号处理、图像分析、结构生物学等领域的应用,成为应用数学和工程领域的重大事件之一。FFT在代码中的应用已有很多次,近年一个流行的方案是FFTW,被认为是世界上最快的FFT。
保罗·亚当斯是加州劳伦斯伯克利国家实验室分子生物物理学和综合生物成像部门的主任,他回忆称,当他在1995年改进细菌蛋白质凝胶的结构时,即使使用FFT和超级计算机,也需要“很多个小时,甚至数天”的计算。“如果在没有FFT的情况下尝试做这些,我不知道在现实中应该如何做到,”他说,“那可能要花很长时间。”
分子编目:生物数据库(1965年)
数据库是当今科学研究中不可或缺的组成部分,以至于人们很容易忘记它们也是由软件驱动的。过去的几十年中,数据库资源的规模急剧膨胀,影响了许多领域,但或许没有哪个领域的变化会比生物学领域更引人注目。
蛋白质数据库Protein Data Bank拥有超过17万个分子结构的档案,包括这种细菌的“表达子”(expressome),其功能是结合RNA和蛋白质合成的过程。
今天,科学家所用的庞大基因组和蛋白质数据库源于美国物理化学家玛格丽特·戴霍夫的工作,她也是生物信息学领域的先驱。20世纪60年代初,当生物学家们致力于梳理蛋白质的氨基酸序列时,戴霍夫开始整理这些信息,以寻找不同物种之间进化关系的线索。她与三位合著者于1965年发表了《蛋白质序列和结构图谱》,描述了当时已知的65种蛋白质的序列、结构和相似性。 历史 学家布鲁诺·斯特拉瑟在2010年写道,这是第一个“与特定研究问题无关”的数据集,它将数据编码在打孔卡中,这使得扩展数据库和搜索成为可能。
其他“计算机化”的生物数据库紧随其后。蛋白质数据库Protein Data Bank于1971年投入使用,如今详细记录了超过17万个大分子结构。加州大学圣地亚哥分校的进化生物学家拉塞尔·杜利特尔在1981年创建了另一个名为Newat的蛋白质数据库。1982年,美国国立卫生研究院(NIH)与多个机构合作,成立了GenBank数据库,这是一个开放获取的DNA序列数据库。
这些数据库资源在1983年7月证明了其存在价值。当时,由伦敦帝国癌症研究基金会蛋白质生物化学家迈克尔·沃特菲尔德领导的团队,与杜利特尔的团队各自独立报道了一个特殊的人类生长因子序列与一种导致猴子出现癌症的病毒蛋白质之间的相似性。观察结果显示了一种病毒诱发肿瘤机制——通过模仿一种生长因子,病毒会诱导细胞不受控制地生长。美国国家生物技术信息中心(NCBI)前主任詹姆斯·奥斯特尔说:“这一结果让一些对计算机和统计学不感兴趣的生物学家头脑里灵光一闪:我们可以通过比较序列来了解有关癌症的一些情况。”
奥斯特尔还表示,这一发现标志着“客观生物学的到来”。除了设计实验来验证特定的假设,研究人员还可以挖掘公共数据集,寻找那些实际收集数据的人可能从未想到的联系。当不同的数据集连接在一起时,这种力量就会急剧增长。例如,NCBI的程序员在1991年通过Entrez实现了这一点;Entrez是一个可以让研究人员在DNA、蛋白质和文献之间自由检索和比对的工具。
预测领先者:大气环流模式(1969年)
在第二次世界大战结束时,计算机先驱约翰·冯·诺伊曼开始将几年前用于计算弹道轨迹和武器设计的计算机转向天气预测问题。真锅淑郎解释道,在那之前,“天气预报只是经验性的”,即利用经验和直觉来预测接下来会发生什么。相比之下,冯·诺伊曼的团队“试图基于物理定律进行数值天气预测”。
新泽西州普林斯顿的美国国家海洋和大气管理局(NOAA)地球物理流体动力学实验室的建模系统部门负责人Venkatramani Balaji表示,几十年来,人们已经熟知这些方程式。但早期的气象学家无法实际解决这些问题。要做到这一点,需要输入当前的条件,计算它们在短时间内会如何变化,并不断重复。这个过程非常耗时,以至于在天气状况实际出现之前还无法完成数学运算。1922年,数学家刘易斯·弗莱·理查森花了几个月时间计算德国慕尼黑的6小时预报。根据一段 历史 记载,他的结果是“极不准确的”,包括“在任何已知的陆地条件下都不可能发生的”预测。计算机使这个问题变得很容易解决。
20世纪40年代末,冯·诺伊曼在普林斯顿高等研究院建立了天气预报团队。1955年,第二个团队——地球物理流体动力学实验室——开始进行他所谓的“无限预测”,也就是气候建模。
真锅淑郎于1958年加入气候建模团队,开始研究大气模型;他的同事柯克·布莱恩将这一模型应用在海洋研究中。1969年,他们成功将二者结合起来,创造了《自然》杂志在2006年所说的科学计算“里程碑”。
今天的模型可以将地球表面划分为一个个25公里 25公里的正方形,并将大气层划分为数十层。相比之下,真锅淑郎和布莱恩的海洋-大气联合模型划分的面积为500平方公里,将大气分为9个层次,只覆盖了地球的六分之一。尽管如此,Venkatramani Balaji表示,“这个模型做得很好”,使研究团队第一次能够通过计算机预测二氧化碳含量上升的影响。
数字运算机:BLAS(1979年)
科学计算通常涉及到使用向量和矩阵进行相对简单的数学运算,但这样的向量和矩阵实在太多了。但在20世纪70年代,还没有一套普遍认可的计算工具来执行这些运算。因此,从事科学工作的程序员会将时间花在设计高效的代码来进行基本的数学运算,而不是专注于科学问题。
加州劳伦斯利弗莫尔国家实验室的Cray-1超级计算机。在BLAS编程工具于1979年问世之前,并没有线性代数标准可供研究人员在Cray-1超级计算机等机器上工作
编程世界需要一个标准。1979年,这样的标准出现了:基本线性代数程序集(Basic Linear Algebra Subprograms,简称BLAS)。这是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库,如矢量或矩阵乘法。该标准一直发展到1990年,为向量数学和后来矩阵数学定义了数十个基本例程。
美国田纳西大学计算机科学家、BLAS开发团队成员杰克·唐加拉表示,事实上,BLAS把矩阵和向量数学简化成了和加法和减法一样基本的计算单元。
美国德克萨斯大学奥斯汀分校的计算机科学家Robert van de Geijn指出,BLAS“可能是为科学计算定义的最重要的接口”。除了为常用函数提供标准化的名称之外,研究人员还可以确保基于BLAS的代码在任何计算机上以相同方式工作。该标准还使计算机制造商能够优化BLAS的安装启用,以实现在其硬件上的快速操作。
40多年来,BLAS代表了科学计算堆栈的核心,也就是使科学软件运转的代码。美国乔治·华盛顿大学的机械和航空航天工程师洛雷娜·巴尔巴称其为“五层代码中的机械”。而杰克·唐加拉说:“它为我们的计算提供了基础结构。”
显微镜必备:NIH Image(1987年)
20世纪80年代初,程序员韦恩·拉斯班德在马里兰州贝塞斯达的美国国立卫生研究院的脑成像实验室工作。该实验室拥有一台扫描仪,可以对X光片进行数字化处理,但无法在电脑上显示或分析。为此,拉斯班德写了一个程序。
这个程序是专门为一台价值15万美元的PDP-11小型计算机设计的,这是一台安装在架子上的计算机,显然不适合个人使用。然后,在1987年,苹果公司发布了Macintosh II,这是一个更友好、更实惠的选择。拉斯班德说:“在我看来,这显然是一种更好的实验室图像分析系统。”他将软件转移到新的平台上,并重新命名,建立了一个图像分析生态系统。
NIH Image及其后续版本使研究人员能在任何计算机上查看和量化几乎任何图像。该软件系列包括ImageJ,一个拉斯班德为Windows和Linux用户编写的基于Java的版本;以及Fiji,这是ImageJ的分发版,由德国德累斯顿的马克斯普朗克分子细胞生物学和遗传学研究所的Pavel Tomancak团队开发,其中包括关键的插件。“ImageJ无疑是我们所拥有的最基础的工具,”布洛德研究所(由麻省理工学院和哈佛大学联合创立)成像平台的计算生物学家贝丝·契米妮说,“我从来没有和一个使用过显微镜,但没有使用过ImageJ或Fiji的生物学家说过话。”
拉斯班德表示,部分原因可能是这些工具是免费的。但威斯康星大学麦迪逊分校的生物医学工程师Kevin Eliceiri指出,另一个原因是用户可以很容易地根据自己的需求定制工具。自拉斯班德退休后,Kevin Eliceiri的团队一直领导着ImageJ的开发。ImageJ提供了一个看似简单、极简主义的用户界面,自20世纪90年代以来基本上没有改变。然而,由于其内置的宏记录器(允许用户通过记录鼠标点击和菜单选择的序列来保存工作流)、广泛的文件格式兼容性和灵活的插件架构,该工具具有无限的可扩展性。该团队的编程主管柯蒂斯·鲁登表示,有“数以百计的人”为ImageJ贡献了插件。这些新添加的功能极大扩展了研究人员的工具集,例如在视频中跟踪对象或自动识别细胞的功能。
Kevin Eliceiri说:“这个程序的目的不是做到一切或终结一切,而是服务于用户的目标。不像Photoshop和其他程序,ImageJ可以成为你想要的任何东西。”
序列搜索器:BLAST (1990年)
可能没有什么能比把软件名称变成动词更能说明文化的相关性了。提到搜索,你会想到谷歌;而提到遗传学,研究者会立刻想到BLAST。
通过诸如替代、删除、缺失和重排等方式,生物将进化中的改变蚀刻在分子序列中。寻找序列之间的相似性——特别是蛋白质之间的相似性——可以让研究人员发现进化关系,并深入了解基因功能。在迅速膨胀的分子信息数据库中,想要快速而准确地做到这一点并不容易。
玛格丽特·戴霍夫在1978年提供了关键的进展。她设计了一种“点接受突变”矩阵,使研究人员不仅可以根据两种蛋白质序列的相似程度,还可以根据进化距离来为评估它们的亲缘关系。
1985年,弗吉尼亚大学的威廉·皮尔森和NCBI的大卫·利普曼引入了FASTP,这是一种结合了戴霍夫矩阵和快速搜索能力的算法。
数年后,利普曼与NCBI的沃伦·吉什和斯蒂芬·阿特舒尔,宾夕法尼亚州立大学的韦伯·米勒,以及亚利桑那大学的吉恩·迈尔斯一起开发了一种更强大的改进技术:BLAST(Basic Local Alignment Search Tool)。BLAST发布于1990年,将处理快速增长的数据库所需的搜索速度,与提取进化上更为遥远的匹配结果的能力结合起来。与此同时,该工具还可以计算出这些匹配发生的概率。
阿特舒尔表示,计算结果出来得非常快,“你可以输入搜索内容,喝一口咖啡,搜索就完成了。”但更重要的是,BLAST很容易使用。在一个通过邮寄更新数据库的时代,沃伦·吉什建立了一个电子邮件系统,后来又建立了一个基于网络的架构,允许用户在NCBI计算机上远程运行搜索,从而确保搜索结果始终是最新的。
哈佛大学的计算生物学家肖恩·艾迪表示,BLAST系统为当时处于萌芽阶段的基因组生物学领域提供了一个变革性的工具,即一种根据相关基因找出未知基因可能功能的方法。对于各地的测序实验室,它还提供了一个新颖的动词。“它是众多由名词变成动词的例子之一,”艾迪说,“你会说,你正准备BLAST一下你的序列。”
预印本平台:arXiv.org (1991年)
20世纪80年代末,高能物理学家经常将他们已投稿的论文手稿副本邮寄给同行,征求他们的意见——但只发给少数人。物理学家保罗·金斯帕格在2017年写道:“处于食物链较低位置的人依赖于一线研究者的成果,而非精英机构中有抱负的研究人员则往往身处特权圈以外。”
1991年,当时在新墨西哥州洛斯阿拉莫斯国家实验室工作的金斯帕格编写了一个电子邮件自动应答程序,希望建立一个公平的竞争环境。订阅者每天都会收到预印本列表,每一篇都与文章标识符相关联。只需通过一封电子邮件,世界各地的用户就可以从实验室的计算机系统中提交或检索论文,并获得新论文的列表,或按作者或标题进行搜索。
金斯帕格的计划是将论文保留三个月,并将内容限制在高能物理学界。但一位同事说服他无限期地保留这些文章。他说:“就在那一刻,它从布告栏变成了档案馆。”于是,论文开始从比各个领域如潮水般涌来。1993年,金斯伯格将这个系统迁移到互联网上,并在1998年将其命名为arXiv.org,沿用至今。
arXiv成立已近30年,拥有约180万份预印本,全部免费提供,而且每月有超过1.5万份论文提交,下载量达3000万次。十年前,《自然-光子学》(Nature Photonics)的编辑在评论arXiv创立20周年时写道:“不难看出为什么arXiv的服务会如此受欢迎,这个系统让研究人员能快速而方便地插上旗帜,显示他们所做的工作,同时避免投稿传统同行评议期刊时的麻烦和时间成本。”
arXiv网站的成功也促进了生物学、医学、 社会 学和其他学科同类预印本网站的繁荣。在如今已出版的数万份关于新冠病毒的预印本中就可以看到这种影响。“很高兴看到30年前在粒子物理学界之外被认为是异端的方法,现在被普遍认为是平淡无奇和自然而然的,”金斯伯格说,“从这个意义上说,它就像一个成功的研究项目。”
数据浏览器:IPython Notebook (2011年)
2001年,费尔南多·佩雷斯还是一位希望“寻找拖延症”的研究生,当时他决定采用Python的一个核心组件。
Python是一种解释型语言,这意味着程序是逐行执行的。程序员可以使用一种称为“读取-评估-打印循环”(read–evaluate–print loop,简称REPL)的计算调用和响应工具,在其中输入代码,然后由解释器执行代码。REPL允许快速 探索 和迭代,但佩雷斯指出,Python的REPL并不是为科学目的而构建的。例如,它不允许用户方便地预加载代码模块,也不允许打开数据可视化。因此,佩雷斯自己编写了另一个版本。
结果就是IPython的诞生,这是一个“交互式”Python解释器,由佩雷斯在2001年12月推出,共有259行代码。十年后,佩雷斯与物理学家布莱恩·格兰杰和数学家埃文·帕特森合作,将该工具迁移到web浏览器上,推出了IPython Notebook,开启了一场数据科学革命。
与其他计算型Notebook一样,IPython Notebook将代码、结果、图形和文本合并在一个文档中。但与其他类似项目不同的是,IPython Notebook是开源的,邀请了大量开发者社区的参与其中。而且它支持Python,一种很受科学家欢迎的语言。2014年,IPython演变为Jupyter,支持大约100种语言,允许用户在远程超级计算机上 探索 数据,就像在自己的笔记本电脑上一样轻松。
《自然》杂志在2018年写道:“对于数据科学家,Jupyter实际上已经成为一个标准。”当时,在GitHub代码共享平台上有250万个Jupyter Notebook;如今,这一数字已经发展到1000万个,在2016年引力波的发现,以及2019年的黑洞成像工作中,它们都发挥了重要的作用。佩雷斯说:“我们对这些项目做出了很小的贡献,这是非常值得的。”
快速学习器:AlexNet(2012年)
人工智能有两种类型。一种是使用编码规则,另一种则通过模拟大脑的神经结构来让计算机“学习”。加拿大多伦多大学的计算机科学家杰弗里•辛顿表示,几十年来,人工智能研究人员一直认为后者是“一派胡言”。但在2012年,他的研究生亚力克斯·克里泽夫斯基和伊尔亚·苏茨克维证明了事实并非如此。
在一年一度的ImageNet比赛中,研究人员被要求在一个包含100万张日常物体图像的数据库中训练人工智能,然后在一个单独图像集上测试生成的算法。辛顿表示,当时最好的算法错误分类了大约四分之一的图像。克里泽夫斯基和苏茨克维的AlexNet是一种基于神经网络的“深度学习”算法,它将错误率降低到了16%。辛顿说:“我们基本上把错误率减半了,或者说几乎减半了。”
辛顿还指出,该团队在2012年的成功反映了足够大的训练数据集与出色的编程,以及新出现的图形处理单元的强大能力的结合。图形处理单元是最初设计用来加速计算机视频性能的处理器。“突然之间,我们可以将(算法)运行速度提高30倍,”他说,“或者说,学习多达30倍的数据。”
真正的算法突破实际上发生在三年前,当时辛顿的实验室创建了一个神经网络,可以比经过几十年改进的传统人工智能更准确地识别语音。“只是稍微好一点,”辛顿说,“但这已经预示了某些东西。”
这些成功预示着深度学习在实验室研究、临床医学和其他领域的崛起。通过人工智能的深度学习,手机能够理解语音查询,图像分析工具能够很容易地在显微照片中识别出细胞;这就是为什么AlexNet会成为众多从根本上改变科学,也改变世界的工具之一。(任天)