Refining the phylum Chlorobi by resolving the phylogeny and metabolic potential of the representative of a deeply branching, uncultivated lineage
Genomische Rekonstruktion von NICIL-2
Analyse der Zusammensetzung der mikrobiellen Gemeinschaft von thermophilen Bakterienkonsortien, die für das Wachstum auf Biomassesubstraten (Cellulose, xylan und Switchgrass) als einzige Kohlenstoffquelle bei 60 °C konsequent eine allgegenwärtige OTU97, das entfernt mit kultivierten Mitgliedern des Stammes Chlorobi verwandt war (Eichorst et al., 2013, 2014). Die metagenomische Sequenzierung eines Konsortiums, das an das Wachstum auf ionisch-flüssigem vorbehandeltem Switchgrass angepasst war, in dem das Chlorobi-verwandte OTU97 reichlich vorhanden war, wurde durchgeführt, um die Phylogenie und das metabolische Potenzial der Population zu verstehen, die durch dieses OTU97 repräsentiert wurde. Montage (siehe Materialien und Methoden) und automatisiertes Binning (Wu et al., 2014) des Metagenoms dieses Konsortiums ergaben 20 genomische Bins (ergänzende Tabelle S3), von denen die am häufigsten vorkommenden Bins eine Population waren, die eng mit dem Chitinophagaceae-Stamm NYFB verwandt war (61,8%), der aus einer verwandten, auf Cellulose gezüchteten Anreicherung isoliert wurde (Eichorst et al., 2013) und der Chlorobi-bezogene Abfall (23,1%). Bins, die bei > 1% vorhanden waren, umfassten mehrere unkultivierte Populationen, die sich mit den Paenibacillaceae (Bins 003 und 006), einer unkultivierten Population, die sich mit Verrucomicrobia subdivision 3 (bin 004) und einer Population, die eng mit der Thermobipora bispora (bin 005), einem actinobacterial Thermophile.
Der Chlorobi-verwandte Behälter wurde NICIL-2 (für Newby Island Compost Ionic Liquid-2nd in abundance) genannt. Die Analyse der aus dem NICIL-2-Genom vorhergesagten Proteine stimmte mit ihrer Identifizierung als Population überein, die entfernt mit Mitgliedern des FCB-Superphylums verwandt ist, wobei die Bacteroidetes (33%) und Ignavibakterien (15,7%) die am engsten verwandten Proteinsequenzen aufweisen (Abbildung 1). Das zurückgewonnene NICIL-25-Genom war relativ klein (2,67 Mbps) und nahezu vollständig (95,3%; 102 von 107 Einzelkopie-Markergenen in 152 Gerüsten). Die N50-Länge für das NICIL-20-Genom betrug 168 929 bp und der größte zusammenhängende war 1.1 MB, was darauf hindeutet, dass die meisten Gerüste eine qualitativ hochwertige Montage darstellten (Tabelle 1).
Phylogenetische Analyse von NICIL-2
Aus dem NICIL-2-Entwurfsgenom wurde ein 16S-rRNA-Gen (1451 bp) gewonnen. Der Ribotyp, der am engsten mit dem 16S-rRNA-Gen von NICIL-2 verwandt ist (> 99% identisch), wurde aus einem Fosmid-Klon (JFF029_06) sequenziert, der aus einem thermischen Strom (70 ° C) in einer japanischen Goldmine gewonnen wurde Sequenz (Nunoura et al., 2005). 16S rRNA Gene aus kultivierten Vertretern der Bacteroidetes und Chlorobi waren <85% identisch mit der NICIL-2 Sequenz. Ein phylogenetischer Baum, der durch Ausrichten von 16S-rRNA-Gensequenzen in Bezug auf NICIL-2 erstellt wurde, zeigte, dass sich die Linie, die NICIL-2 enthielt, von den Bacteroidetes und Chlorobi unterschied (Abbildung 2). Die NICIL-2-Linie enthielt zwei Abstiegslinien basierend auf der Temperatur der Probenahmeumgebung. Der Hochtemperaturcluster (in Abbildung 2 rot dargestellt) umfasste Ribotypen, die hauptsächlich aus Hochtemperaturumgebungen im Bereich von 55 ° C bis 80 ° C gewonnen wurden, wie der Klon OPB56 (Hugenholtz et al., 1998). Der zweite Cluster umfasste Ribotypen, die hauptsächlich aus Umgebungen mit moderaten Temperaturen von 20 ° C bis 32 ° C gewonnen wurden (in Abbildung 2 grün dargestellt). Da OPB56 der erste entdeckte Klon war, der mit diesem phylogenetischen Cluster verbunden ist, wird die Linie, die NICIL-2 enthält, als OPB56-Clade bezeichnet. Eine erweiterte Ansicht des 16S-rRNA-Genbaums ist in der ergänzenden Abbildung S1 dargestellt.
Um die phylogenetische Zugehörigkeit von NICIL-2 und der OPB56-Klade vollständiger festzustellen, wurden zusätzliche ribosomale Proteinsequenzen aus Daten aus natürlichen Proben gewonnen. Homologe von 22 konservierten ribosomalen Genen in NICIL-2 wurden in zwei japanischen Thermalquellen-Fosmid-Klonen (JFF029_C06 und JFF027_B02) gefunden. Dieser Satz von 22 ribosomalen Proteinen wurde verwendet, um metagenomische Datensätze aus Hochtemperaturumgebungen zu durchsuchen. Komplette Sätze dieser konservierten ribosomalen Gene wurden in vier metagenomischen Datensätzen identifiziert, die aus Hochtemperaturumgebungen gewonnen wurden. Das automatisierte Binning dieser Datensätze ergab sechs nahezu vollständige (> 90% vollständige) Entwurfsgenome, die Sequenzen für die konservierten 22 ribosomalen Proteine im NICIL-2-Genom und die japanischen Goldmine Fosmid-Klone enthielten (ergänzende Tabelle S4). Fünf der sechs verketteten Proteinsequenzen gruppierten sich mit in der OPB56-Linie mit NICIL-2, während eine der Sequenzen von Yellowstone Fairy Fällt gruppiert mit den Ignavibakterien (Abbildung 3a). Dieser phylogenetische Baum zeigte, dass Chlorobea, Ignavibakterien und OPB56 mit hoher Sicherheit (97%) eine monophyletische Klade bildeten. Die Bacteroidetes bildeten einen ausgeprägten Cluster und die Familie Rhodothermaceae, deren Zugehörigkeit zu den Bacteroidetes in Frage gestellt wurde (Nolan et al., 2009), wurden mit hohem Vertrauen mit den Bacteroidetes assoziiert (> 80%). Ein zweiter phylogenetischer Baum wurde konstruiert, indem eine Ausrichtung von 86 Einzelkopiegenen verkettet wurde, die zwischen Bacteroidetes, Chlorobi und Fibrobacter geteilt wurden (Abbildung 3b). Dieser Baum reproduzierte die Topologie, die für das Gen beobachtet wurde, das aus den 22 ribosomalen Genen aufgebaut wurde, was die Zugehörigkeit der Chlorobea, Ignavibakterien und OPB56 weiter unterstützt.
Ein komplementärer Ansatz zum Verständnis der evolutionären Beziehungen zwischen Bakteriodeten und Chlorobi bestand darin, Indels in konservierten Proteinen zu identifizieren (Gupta und Lorenzini, 2007). Insertionen in DNA-Polymerase III (28 aa) und Alanyl-tRNA-Synthetase (12-14 aa), die bei den GSB konserviert sind und bei den Bakteriodeten fehlen, wurden als charakteristisch für das Phylum Chlorobi zugeschrieben. Alignments dieser beiden Proteine (ergänzende Abbildungen S2 und S3) zeigen an, dass die Insertion der DNA-Polymerase III in die GSB-Proteinsequenzen in den vorhergesagten Proteinen aus den Ignavibakterien- und NICIL-2-Genomen nicht vorhanden ist, während 2-3 Aminosäuren der Insertion in die GSB-Alanyl-tRNA-Synthetasesequenzen in den Ignavibakterien- und NICIL-2-Proteinsequenzen konserviert sind.
Metabolische Rekonstruktion von NICIL-2
Die Physiologie von NICIL-2 wurde durch metabolische Rekonstruktion und sein metabolisches Potenzial im Vergleich zu Vertretern von GSB (Chlorobaculum tepidum), Bacteroidetes (Rhodothermus marinus und Salinbacter ruber) und Ignavibakterien (Ignavibacterium album und Meliobacter roseus) abgeleitet. Gene, die Photosynthese-verwandte Proteine kodieren, einschließlich Homologe von C. tepidums photosynthetische Reaktionszentrum-Untereinheiten (CT1020, pscB, psC, pscD), Chlorosomen-Hüllproteine (csmABCDEFHIJX) und Bakteriochlorophyll-a-Proteine (fmoA) fehlen in allen anderen Genomen und unterscheiden das GSB in diesem Vergleichssatz (Eisen et al., 2002). Eine visuelle Zusammenfassung der metabolischen Rekonstruktion ist in Abbildung 4 dargestellt. Vollständige Geninformationen, Feldnummern und Abkürzungen finden Sie in den ergänzenden Tabellen S5 und S6.
Kohlenstoffstoffwechsel
Das NICIL-2-Genom kodiert einen vollständigen Satz von Genen für die Glykolyse, den TCA-Zyklus und die Glukoneogenese (Abbildung 4). Gene für den rTCA-Zyklus, die für die autotrophe Kohlenstofffixierung im GSB vorhanden und exprimiert sind, fehlen. Darüber hinaus deutet das Vorhandensein von Genen, die für liponsäurehaltige Cofaktoren in den Pyruvatdehydrogenase- und α-Ketoglutarat-Dehydrogenase-Komplexen kodieren, darauf hin, dass der TCA-Zyklus in oxidativer Richtung funktioniert. Der größte Teil des rTCA-Zyklus wurde in R. marinus und I rekonstruiert. album, einschließlich mehrerer Pyruvat-Ferredoxin-Oxidoreduktasen und α-Ketoglutarat-Ferredoxin-Oxidoreduktasen, zwei erforderliche Enzyme für den rTCA-Zyklus. Den I. album- und R. marinus-Genomen fehlt die ATP-abhängige Citratlyase, ein kritisches Enzym zur Vervollständigung des rTCA-Zyklus (Buchanan und Arnon, 1990). Es wurde vorgeschlagen, dass I. album stattdessen eine ATP-unabhängige Citratlyase verwenden kann, um im rTCA-Zyklus zu funktionieren, obwohl diese Behauptung experimentell nicht getestet wurde und weder I. album noch R. marinus autotroph wachsen (Liu et al., 2012a).
Trotz seiner hohen relativen Häufigkeit in angepassten Kulturen, die auf pflanzlicher Biomasse wachsen, hatte NICIL-2 eine überraschend begrenzte enzymatische Kapazität, komplexe Biomasse zu dekonstruieren. Der Vergleich des metabolischen Potentials für die Polysaccharidhydrolyse unter den 20 Bins, die aus dem Metagenom aus vorbehandelter Switchgrass-Anreicherung extrahiert wurden, zeigte, dass NICIL-2 im Vergleich zu anderen Mitgliedern der mikrobiellen Gemeinschaft relativ weniger Gene für die Zellulose- und Hemicellulose-Dekonstruktion aufweist (Ergänzende Abbildung S4). Insbesondere Stamm NYFB, die verrucomicrobial Population und mehrere grampositive Firmicutes haben umfangreichere Repertorien von Genen für die Polysaccharidhydrolyse. Zusätzliche Inspektion der rekonstruierten OPB56-verbundenen Genome aus natürlichen Hochtemperaturproben zeigte, dass der Mangel an Genen für die Polysaccharidhydrolyse dieser Klade gemeinsam war. Unter den Genomen, die sich mit den Bacteroidetes und Chlorobi gruppieren, R. marinus, M. roseus und Yellowstone Obsidian Pool Bin 062, die Cluster mit den Ignavibakterien besaßen ein umfangreiches Repertoire an Glykosidhydrolasen, um pflanzliche Biomasse zu dekonstruieren. Diese Analysen legen nahe, dass NICIL-2 und verwandte Mitglieder der OPB56-Klasse wahrscheinlich nicht an der primären Dekonstruktion von Biomasse in der angepassten Gemeinschaft und in der natürlichen Umgebung beteiligt sind. Es ist denkbar, dass NICIL-2 auf Zuckermonomeren oder -oligomeren wachsen kann; es wurde jedoch nur ein vorhergesagtes Disaccharidtransportergen im Genom identifiziert.
Obwohl die Selektion für NICIL-2 unter aeroben Bedingungen erfolgte, kann es die Fähigkeit zur Fermentation besitzen. Gene für die fermentative Herstellung von Ethanol sind vorhanden (über Alkoholdehydrogenase, EC 1.1.1.1), während Gene für Formiat (über Pyruvatformiatlyase, EC 2.3.1.54), Lactat (über Lactatdehydrogenase, EC 1.1.1.27) und Propionat (über Methylmalonyl-CoA-Carboxyltransferase, 2.1.3.1) fehlen. Das NICIL-2-Genom kodiert für ein Gen für Phosphotransacetylase (EC 2.3.1.8), aber nicht für Acetatkinase (EC 2.7.2.1), die beide für die fermentative Acetatherstellung benötigt werden. Sowohl I. album als auch M. roseus enthalten Gene für die Produktion von Lactat und Acetat, während C. tepidum dies nicht tut.
Stickstoff- und Schwefelstoffwechsel
Gene für Ammoniumassimilation, Glutaminsynthase (EC 6.3.1.2) und Glutamatsynthase (EC 1.4.1.13) wurden im NICIL-2-Genom nachgewiesen. Es wurden jedoch keine Gene für die dissimilatorische Nitratreduktion, assimilatorische Nitratreduktion, Denitrifikation, Stickstofffixierung und Nitrifikation identifiziert. C. tepidum kodiert für nif-Gene, die für die N2-Fixierung erforderlich sind, während M. roseus (Kadnikov et al., 2013), I. Album (Liu et al., 2012a) und R. marinus (Nolan et al. 2009) nicht. C. tepidum ist ein obligates Schwefeloxidationsmittel und kann daher Sulfid, Thiosulfat, Sulfit und elementaren Schwefel oxidieren. C. tepidum oxidiert bevorzugt Sulfid zu elementarem Schwefel, dann elementaren Schwefel und Thiosulfat zu Sulfat (Chan et al., 2008). Zusätzlich kann Sulfit oxidiert werden, wenn es im Wachstumsmedium zugeführt wird, aber es kann C. tepidum nicht als einzigen Elektronendonor aufrechterhalten (Rodriguez et al., 2011). NICIL-2, I. Album, M. roseus und R. marinus fehlen alle Gene, die für die Oxidation reduzierter Schwefelverbindungen erforderlich sind.
Aminosäure-Biosynthese
Dem NICIL-2-Genom fehlen viele Schlüsselgene für die Biosynthese von Aminosäuren. Vollständige Signalwege sind für Alanin, Arginin, Asparagin, Aspartat, β-Alanin, Glutamat, Glycin, Lysin und Methionin kodiert. NICIL-2 fehlt ilvC und leuABCD und besitzt daher unvollständige Wege für die Valin-, Leucin- und Isoleucinbiosynthese. Ebenso das I. dem Genom fehlten alle Gene, die für die Biosynthese von Valin, Leucin und Isoleucin aus Pyruvat erforderlich sind, mit Ausnahme der verzweigtkettigen Aminotransferase (ilvE), während M. roseus und C. tepidum vollständige Signalwege enthalten. Weder NICIL-2 noch I. album kodieren Gene, die für die Prolinbiosynthese aus Glutamat (proBAC) benötigt werden, während sowohl C. tepidum als auch M. roseus dies tun. Das serB-Gen für die Biosynthese von Serin fehlt in NICIL-2, I. album, M. roseus und wird in einigen GSB, einschließlich C. tepidum gefunden. NICIL-2 kann auch Aminosäuren als Wachstumssubstrate verwenden. Complete degradation pathways are present for branched-chain amino acids (leucine, isoleucine and valine), similar to pathways observed in ‘Candidatus Thermochlorobacter aerophilum’ (Liu et al., 2012b).
Electron transport
The major electron transport chain components were identified in the NICIL-2 genomes including: NADH:ubiquinone oxidoreductase (Complex I, EC 1.6.5.3), membrane-bound succinate dehydrogenase (Complex II, EC 1.3.5.1), quinol-oxidizing alternative Complex III (ACIII) (Yanyushin et al., 2005; Pereira et al., 2007), several cytochrome c oxidases (Complex IV, EC 1.9.3.1) and an F-type H+-transporting ATPase (Complex V, EC 3.6.3.14). NICIL-2 contains one complete set of genes for NADH:ubiquinone oxidoreductase (14 subunits, nuoABCDEFGHIJKLMN), although they are not assembled in one operon (Supplementary Figure S6). Stattdessen sind die meisten Gene unabhängig voneinander im größten NICIL-2-Gerüst angeordnet (nuoGHI, nuoJK, nuoF, nuoD, nuoE und nuoMN), und die verbleibenden Gene befinden sich auf drei kleineren Gerüsten (nuoAB, nuoL und nuoC), was darauf hinweist, dass das Fehlen einer Operonenstruktur kein Artefakt der Montage ist. C. tepidum enthält einen Satz von Genen, die für NADH kodieren: Ubichinonoxidoreduktase, der nuoEFG (11 Untereinheiten) fehlt. I. album und M. roseus enthalten jeweils zwei Sätze nuoABCDHIJKLMN und einen Satz nuoEFG (Ergänzende Abbildung S6). Interessanterweise ist Komplex I aus NICIL-2 am engsten mit denen von Rhodothermus marinus und Salinibacter ruber der Bacteroidetes verwandt, die beide einen vollständigen Satz von Genen für NADH enthalten: Ubichinonoxidoreduktase (Abbildung 5a). Homologe für die 11 Komplex-I-Untereinheiten wurden auch in allen sechs NICIL-2-verwandten Bins identifiziert, die aus Yellowstone und Great Boiling Spring gewonnen wurden, und eine verkettete Anordnung dieser Proteinsequenzen, die mit den Sequenzen aus NICIL-2 gruppiert waren.
Die ACIII ist eine neue Klasse von bakteriellen Membranoxidoreduktasen, die in Organismen vorkommen, denen oft der bc1-Komplex fehlt (Yanyushin et al., 2005). Die ACIII von R. marinus (Pereira et al., 2007; Refojo et al., 2013) und das filamentöse anoxygene phototrophe Bakterium Chloroflexus aurantiacus (Gao et al., 2009, 2013) wurde gereinigt und untersucht. Kürzlich wurde eine große Anzahl von Genclustern, die für ACIII-Untereinheiten kodieren, mit Variationen in Konstitution und Organisation in einer Reihe von Bakteriengenomen gefunden (Refojo et al., 2013). Zum Beispiel enthält R. marinus die Gene actABCDEF in einem Operon, das sechs ACIII-Untereinheiten kodiert; Homologe dieses Genclusters wurden in mehreren Mitgliedern der Bacteroidetes identifiziert (Thiel et al., 2014). Ein phylogenetischer Baum zeigt die Beziehung von ACIII von NICIL-2 zu seinen nächsten Verwandten (Abbildung 5b). Die GSB besitzen kein ACIII und sind daher in diesem Baum nicht vertreten. Candidatus Thermochlorobacter aerophilum, der kein Mitglied des GSB ist, kodiert jedoch ein ACIII, das wahrscheinlich bei der aeroben Atmung funktioniert (Liu et al., 2012b). Es ist wichtig zu beachten, dass sowohl I. album als auch M. roseus unter diesem Satz von ACIII einzigartig sind, da sie fünf Untereinheiten enthalten, wobei die ACTE-Untereinheiten als Fusionsprotein identifiziert werden. Eine vollständige Ergänzung von Genen, die für alle ACIII-Untereinheiten kodieren, die aus zwei NICIL-2-verwandten Genombehältern aus den Yellowstone-Metagenomen gewonnen wurden, enthielt die actDE-Fusion und gruppierte sich mit I. album und M. roseus. NICIL-2 enthält diese Fusion nicht und die Gene für seinen ACIII-Komplex sind enger mit R. marinus und S. ruber verwandt.
NICIL-2-terminale Elektronenakzeptoren umfassen eine Typ-aa3-Cytochrom-c-Oxidase (Komplex IV) und mögliche alternative Cytochrom-c-Oxidasen, die als CoxMOP bezeichnet werden. Es ist unwahrscheinlich, dass NICIL-2 mikroaerophil ist, da Typ-cbb3-Oxidasen im Genom nicht nachgewiesen wurden. Cytochrom bd blieb unentdeckt. Zum Vergleich enthalten sowohl I. album- als auch M. roseus-Genome Gene für Cytochrom-c-Oxidase vom Typ cbb3 und einen Cytochrom-bd-Komplex.
Das NICIL-2-Genom enthält einen unvollständigen Satz von Men-Genen für die Synthese von Menachinon. Ein kompletter Menachinon-Biosyntheseweg enthält menFDHCEBAG (Bentley und Meganathan, 1982) und das NICIL-2-Genom enthält nur menBAG. Zum Vergleich: C. tepidum und I. sie enthalten komplette Men-Pfade, während die M. roseus- und R. marinus-Genome Annotationen für alle erforderlichen Gene außer menB bzw. Homologe von Genen, die Enzyme des alternativen Menachinon-Biosyntheseweges, des Futalosin-Weges, kodieren (Arakawa et al., 2011), wurden in NICIL-2 unentdeckt. Ubichinon-biosynthetische Gene fehlen ebenfalls. Das NICIL-2-Genom kann in diesem Bereich eine unvollständige Abdeckung aufweisen, und zusätzliche Men-Gene können mit einem vollständig zusammengesetzten Genom gefunden werden. Alternativ kann NICIL-2 einen Chinonaustausch mit anderen Community-Mitgliedern durchführen, wie für das phototrophe Konsortium ‘Chlorochromatium aggregatum’ beobachtet (Liu et al., 2013).
Flagellen und Chemotaxis
Gene, die Proteine für die Basalkörper-, Haken- und Filamentanordnung kodieren, sind im NICIL-2-Genom vorhanden. NICIL-2 fehlen jedoch Gene, die für eine Chemotaxis-Maschinerie kodieren, abgesehen von einem regulatorischen Protein, CheY. Die GSB gelten als unbeweglich und haben keine Chemotaxis und Flagellen, während I. album, M. roseus und R. marinus Flagellen- und Chemotaxis-Maschinen haben.