Affiner le phylum Chlorobi en résolvant la phylogénie et le potentiel métabolique du représentant d’une lignée profondément ramifiée et non cultivée
Reconstruction génomique de NICIL-2
Analyse de la composition de la communauté microbienne de consortiums bactériens thermophiles adaptés pour croître sur des substrats de biomasse (cellulose, xylane et herbe à aiguiser) comme leur seule source de carbone à 60 °C ont systématiquement identifié une substance ubiquitaire OTU97 qui était apparenté de loin aux membres cultivés du phylum Chlorobi (Eichorst et al., 2013, 2014). Le séquençage métagénomique d’un consortium adapté à la croissance sur des herbivores prétraités à un liquide ionique, dans lesquels l’OTU97 lié au Chlorobi était abondant, a été effectué pour comprendre la phylogénie et le potentiel métabolique de la population représentée par cet OTU97. Assemblage (voir Matériaux et méthodes) et binning automatisé (Wu et al., 2014) du métagénome de ce consortium ont donné 20 bacs génomiques (Tableau supplémentaire S3), parmi lesquels les bacs les plus abondants étaient une population étroitement apparentée à la souche de Chitinophagaceae NYFB (61,8%), qui a été isolée d’un enrichissement connexe cultivé sur cellulose (Eichorst et al., 2013), et le bac lié au chlorobi (23,1 %). Les bacs présents à > 1% comprenaient de multiples populations non cultivées groupées avec les Paenibacillaceae (bacs 003 et 006), une population non cultivée groupée avec la subdivision 3 de Verrucomicrobia (bin 004) et une population étroitement liée à la Thermobipora bispora (bin 005), un thermophile actinobactérien.
Le bac lié au chlorobi a été nommé NICIL-2 (pour Newby Island Compost Ionic Liquid – 2nd in abundance). L’analyse des protéines prédites à partir du génome de NICIL-2 était cohérente avec son identification en tant que population apparentée de loin aux membres du superphyle FCB, les Bacteroidetes (33 %) et les Ignavibactéries (15,7 %) ayant les séquences protéiques les plus étroitement apparentées (Figure 1). Le projet de génome NICIL-2 récupéré était relativement petit (2,67 Mbps) et presque complet (95,3%; 102 gènes marqueurs sur 107 en une seule copie dans 152 échafaudages). La longueur N50 du génome du projet NICIL-2 était de 168 929 pb et le plus grand contig était de 1.1 MB, suggérant que la plupart des échafaudages représentaient un assemblage de haute qualité (tableau 1).
L’analyse phylogénétique du gène de l’ARNr NICIL-2
A 16S (1451 pb) a été récupérée à partir du génome d’ébauche de NICIL-2. Le ribotype le plus étroitement lié au gène de l’ARNr 16S de NICIL-2 (> identique à 99 %) a été séquencé à partir d’un clone de fosmides (JFF029_06) récupéré à partir d’un flux thermique (70 °C) dans une séquence de mines d’or japonaises (Nunoura et al., 2005). Les gènes de l’ARNr 16S provenant de représentants en culture des Bacteroidetes et des Chlorobi étaient < 85% identiques à la séquence NICIL-2. Un arbre phylogénétique construit en alignant des séquences de gènes de l’ARNr 16S liées au NICIL-2 a démontré que la lignée contenant du NICIL-2 était distincte des Bacteroidetes et des Chlorobi (Figure 2). La lignée NICIL-2 contenait deux lignes de descente basées sur la température de l’environnement d’échantillonnage. Le groupe à haute température (représenté en rouge sur la figure 2) comprenait des ribotypes principalement récupérés dans des environnements à haute température allant de 55 ° C à 80 ° C, comme le clone OPB56 (Hugenholtz et al., 1998). Le deuxième groupe comprenait des ribotypes principalement récupérés dans des environnements à température modérée allant de 20 ° C à 32 ° C (représentés en vert sur la figure 2). Comme OPB56 a été le premier clone découvert affilié à cet amas phylogénétique, la lignée contenant NICIL-2 est appelée clade OPB56. Une vue élargie de l’arbre génétique de l’ARNr 16S est représentée dans la figure supplémentaire S1.
Pour établir plus complètement l’affiliation phylogénétique de NICIL-2 et du clade OPB56, des séquences protéiques ribosomiques supplémentaires ont été obtenues à partir de données récupérées à partir d’échantillons naturels. Des homologues de 22 gènes ribosomiques conservés dans NICIL-2 ont été trouvés dans deux clones de fosmides de sources thermales japonaises (JFF029_C06 et JFF027_B02). Cet ensemble de 22 protéines ribosomiques a été utilisé pour rechercher des ensembles de données métagénomiques provenant d’environnements à haute température. Des ensembles complets de ces gènes ribosomiques conservés ont été identifiés dans quatre ensembles de données métagénomiques obtenus dans des environnements à haute température. Le regroupement automatisé de ces ensembles de données a permis de récupérer six génomes d’ébauche presque complets (> 90 %) contenant des séquences des 22 protéines ribosomiques conservées dans le génome NICIL-2 et les clones de fosmides de la mine d’or japonaise (Tableau supplémentaire S4). Cinq des six séquences protéiques concaténées se regroupaient avec la lignée OPB56 avec NICIL-2, tandis qu’une des séquences de Yellowstone Fairy Falls se regroupait avec les Ignavibactéries (Figure 3a). Cet arbre phylogénétique a démontré que les Chlorobea, Ignavibacteria et OPB56 formaient un clade monophylétique avec une grande confiance (97%). Les Bacteroidetes formaient un groupe distinct, et la famille des Rhodothermaceae, dont l’affiliation avec les Bacteroidetes a été remise en question (Nolan et al., 2009), étaient affiliés aux Bacteroidetes avec une grande confiance (> 80%). Un deuxième arbre phylogénétique a été construit en concaténant un alignement de 86 gènes à copie unique partagés entre Bacteroidetes, Chlorobi et Fibrobacter (Figure 3b). Cet arbre reproduisait la topologie observée pour le gène construit à partir des 22 gènes ribosomiques, soutenant davantage l’affiliation des Chlorobées, des Ignavibactéries et de l’OPB56.
Une approche complémentaire pour comprendre les relations évolutives entre les bactériodètes et les Chlorobi a été d’identifier les indels dans les protéines conservées (Gupta et Lorenzini, 2007). Les insertions dans l’ADN polymérase III (28 aa) et l’alanyl-ARNt synthétase (12-14 aa) qui sont conservées chez les GSB et absentes chez les Bactériodètes ont été attribuées comme caractéristiques du phylum Chlorobi. Les alignements de ces deux protéines (Figures supplémentaires S2 et S3) indiquent que l’insertion de l’ADN polymérase III dans les séquences protéiques GSB n’est pas présente dans les protéines prédites des génomes Ignavibacteriae et NICIL-2, tandis que 2-3 acides aminés de l’insertion dans les séquences d’alanyl-ARNt synthétase de GSB sont conservés dans les séquences protéiques Ignavibactéries et NICIL-2.
Reconstruction métabolique du NICIL-2
La physiologie du NICIL-2 a été déduite par la reconstruction métabolique et son potentiel métabolique par rapport aux représentants du GSB (Chlorobaculum tepidum), des Bacteroidetes (Rhodothermus marinus et Salinbacter ruber) et des Ignavibactéries (Ignavibacterium album et Meliobacter roseus). Gènes codant pour les protéines liées à la photosynthèse, y compris les homologues de C. les sous-unités du centre de réaction photosynthétique de tepidum (CT1020, pscB, psC, pscD), les protéines d’enveloppe du chlorosome (csmABCDEFHIJX) et les protéines de bactériochlorophylle a (fmoA) sont absentes dans tous les autres génomes, ce qui distingue le GSB dans cet ensemble comparatif (Eisen et al., 2002). Un résumé visuel de la reconstruction métabolique est présenté à la figure 4. Pour des informations complètes sur les gènes, les numéros de boîte et les abréviations, voir les tableaux supplémentaires S5 et S6.
Métabolisme du carbone
Le génome NICIL-2 code un ensemble complet de gènes pour la glycolyse, le cycle du TCA et la gluconéogenèse (Figure 4). Les gènes du cycle rTCA, qui sont présents et exprimés pour la fixation du carbone autotrophe dans le GSB, sont absents. De plus, la présence de gènes codant des cofacteurs contenant de l’acide lipoïque dans les complexes pyruvate déshydrogénase et α-cétoglutarate déshydrogénase suggère que le cycle du TCA fonctionne dans le sens oxydatif. La majeure partie du cycle rTCA a été reconstruite dans R. marinus et moi. album, y compris de multiples pyruvate-ferrédoxine oxydoréductases et α-cétoglutarate-ferrédoxine oxydoréductases, deux enzymes nécessaires au cycle rTCA. Les génomes de I. album et de R. marinus sont dépourvus de citrate lyase dépendante de l’ATP, une enzyme essentielle pour compléter le cycle de la rTCA (Buchanan et Arnon, 1990). Il a été proposé que I. album puisse utiliser une citrate lyase indépendante de l’ATP pour fonctionner dans le cycle rTCA à la place, bien que cette affirmation ne soit pas testée expérimentalement et que ni I. album ni R. marinus n’aient montré de croissance autotrophe (Liu et al., 2012a).
Malgré son abondance relative élevée dans des cultures adaptées poussant sur de la biomasse végétale, NICIL-2 avait une capacité enzymatique étonnamment limitée à déconstruire la biomasse complexe. La comparaison du potentiel métabolique pour l’hydrolyse des polysaccharides parmi les 20 bacs extraits du métagénome à partir de l’enrichissement de l’herbe de commutation prétraitée a montré que NICIL-2 a relativement moins de gènes pour la déconstruction de la cellulose et de l’hémicellulose que d’autres membres de la communauté microbienne (Figure supplémentaire S4). En particulier, la souche NYFB, la population verrucomicrobienne et plusieurs Firmicutes à Gram positif ont un répertoire plus étendu de gènes pour l’hydrolyse des polysaccharides. Une inspection supplémentaire des génomes reconstruits affiliés à OPB56 à partir d’échantillons naturels à haute température a démontré que l’absence de gènes pour l’hydrolyse des polysaccharides était commune à ce clade. Parmi les génomes qui se regroupent avec les Bacteroidetes et les Chlorobi, R. marinus, M. le bassin d’obsidienne de Roseus et de Yellowstone 062, qui se regroupe avec les Ignavibactéries, possédait un vaste répertoire d’hydrolases glycosidiques pour déconstruire la biomasse végétale. Ces analyses suggèrent que NICIL-2 et les membres apparentés du clade OPB56 ne sont probablement pas impliqués dans la déconstruction primaire de la biomasse dans les milieux communautaires et naturels adaptés. Il est concevable que le NICIL-2 puisse se développer sur des monomères ou des oligomères de sucre; cependant, un seul gène transporteur de disaccharides prédit a été identifié dans le génome.
Bien que la sélection du NICIL-2 ait eu lieu dans des conditions aérobies, il peut posséder la capacité de fermentation. Les gènes pour la production fermentative d’éthanol sont présents (via l’alcool déshydrogénase, EC 1.1.1.1), tandis que les gènes pour le formiate (via la pyruvate formiate lyase, EC 2.3.1.54), le lactate (via la lactate déshydrogénase, EC 1.1.1.27) et le propionate (via la méthylmalonyl-CoA carboxyl transférase, 2.1.3.1) sont absents. Le génome NICIL-2 code pour un gène de la phosphotransacétylase (EC 2.3.1.8), mais pas pour l’acétate kinase (EC 2.7.2.1), qui sont tous deux nécessaires à la production d’acétate de fermentation. I. album et M. roseus contiennent tous deux des gènes pour la production de lactate et d’acétate, contrairement à C. tepidum.
Métabolisme de l’azote et du soufre
Des gènes d’assimilation de l’ammonium, de la glutamine synthase (EC 6.3.1.2) et de la glutamate synthase (EC 1.4.1.13) ont été détectés dans le génome de NICIL-2. Cependant, aucun gène n’a été identifié pour la réduction dissimilatoire des nitrates, la réduction assimilatoire des nitrates, la dénitrification, la fixation de l’azote et la nitrification. C. tepidum code les gènes nif nécessaires à la fixation du N2, tandis que M. roseus (Kadnikov et al., 2013), I. album (Liu et al., 2012a) et R. marinus (Nolan et al., 2009) ne le font pas. C. tepidum est un oxydant obligatoire du soufre et peut donc oxyder le sulfure, le thiosulfate, le sulfite et le soufre élémentaire. C. tepidum oxyde préférentiellement le sulfure en soufre élémentaire, puis le soufre élémentaire et le thiosulfate en sulfate (Chan et al., 2008). De plus, le sulfite peut être oxydé lorsqu’il est fourni dans le milieu de croissance, mais il ne peut pas soutenir C. tepidum comme seul donneur d’électrons (Rodriguez et al., 2011). NICIL-2, I. album, M. roseus et R. marinus manque de tous les gènes nécessaires à l’oxydation des composés soufrés réduits.
Biosynthèse des acides aminés
Le génome NICIL-2 manque de nombreux gènes clés pour la biosynthèse des acides aminés. Des voies complètes sont codées pour l’alanine, l’arginine, l’asparagine, l’aspartate, la β-alanine, le glutamate, la glycine, la lysine et la méthionine. NICIL-2 manque d’ilvC et de leuABCD et possède donc des voies incomplètes pour la biosynthèse de la valine, de la leucine et de l’isoleucine. De même, le I. le génome de l’album manquait de tous les gènes nécessaires à la biosynthèse de la valine, de la leucine et de l’isoleucine à partir du pyruvate, à l’exception de l’amino transférase à chaîne ramifiée (iLVE), tandis que M. roseus et C. tepidum contiennent des voies complètes. Ni NICIL-2 ni I. album ne codent pour les gènes nécessaires à la biosynthèse de la proline à partir du glutamate (proBAC), contrairement à C. tepidum et M. roseus. Le gène serbe de la biosynthèse de la sérine est absent chez NICIL-2, I. album, M. roseus, et se trouve dans certains GSB, y compris C. tepidum. NICIL-2 peut également utiliser des acides aminés comme substrats de croissance. Complete degradation pathways are present for branched-chain amino acids (leucine, isoleucine and valine), similar to pathways observed in ‘Candidatus Thermochlorobacter aerophilum’ (Liu et al., 2012b).
Electron transport
The major electron transport chain components were identified in the NICIL-2 genomes including: NADH:ubiquinone oxidoreductase (Complex I, EC 1.6.5.3), membrane-bound succinate dehydrogenase (Complex II, EC 1.3.5.1), quinol-oxidizing alternative Complex III (ACIII) (Yanyushin et al., 2005; Pereira et al., 2007), several cytochrome c oxidases (Complex IV, EC 1.9.3.1) and an F-type H+-transporting ATPase (Complex V, EC 3.6.3.14). NICIL-2 contains one complete set of genes for NADH:ubiquinone oxidoreductase (14 subunits, nuoABCDEFGHIJKLMN), although they are not assembled in one operon (Supplementary Figure S6). Au lieu de cela, la majorité des gènes sont disposés indépendamment dans le plus grand échafaudage NICIL-2 (nuoGHI, nuoJK, nuoF, nuoD, nuoE et nuoMN), et les gènes restants se trouvent sur trois échafaudages plus petits (nuoAB, nuoL et nuoC), indiquant que l’absence de structure d’opéron n’est pas un artefact d’assemblage. C. tepidum contient un ensemble de gènes codant pour le NADH : l’ubiquinone oxydoréductase qui manque de nuoEFG (11 sous-unités). I. album et M. roseus contiennent deux ensembles de nuoABCDHIJKLMN et un ensemble de nuoEFG chacun (Figure supplémentaire S6). Fait intéressant, le complexe I de NICIL-2 est le plus étroitement lié à ceux de Rhodothermus marinus et de Salinibacter ruber des Bacteroidetes, qui contiennent tous deux un ensemble complet de gènes pour le NADH: l’ubiquinone oxydoréductase (Figure 5a). Des homologues pour les 11 sous-unités du complexe I ont également été identifiés dans les six bacs liés à NICIL-2 récupérés de Yellowstone et de Great Boiling Spring, et un assemblage concaténé de ces séquences protéiques groupées avec les séquences de NICIL-2.
Les ACIII sont une nouvelle classe d’oxydoréductases membranaires bactériennes que l’on trouve dans les organismes qui manquent souvent du complexe bc1 (Yanyushin et al., 2005). Les ACIII de R. marinus (Pereira et al., 2007; Refojo et coll., 2013) et la bactérie phototrophe anoxygène filamenteuse Chloroflexus aurantiacus (Gao et al., 2009, 2013) a été purifié et étudié. Récemment, un grand nombre d’amas de gènes codant pour des sous-unités ACIII, avec des variations de constitution et d’organisation, ont été trouvés dans une gamme de génomes bactériens (Refojo et al., 2013). Par exemple, R. marinus contient les gènes actABCDEF dans un opéron codant pour six sous-unités ACIII ; des homologues de ce groupe de gènes ont été identifiés chez plusieurs membres des Bacteroidetes (Thiel et al., 2014). Un arbre phylogénétique décrit la relation entre ACIII de NICIL-2 et ses plus proches parents (Figure 5b). Les GSB ne possèdent pas d’ACIII et ne sont donc pas représentés dans cet arbre. Cependant, ‘Candidatus Thermochlorobacter aerophilum, qui n’est pas membre du GSB, code un ACIII qui fonctionne probablement dans la respiration aérobie (Liu et al., 2012b). Il est important de noter que I. album et M. roseus sont uniques parmi cet ensemble d’ACIII car ils contiennent cinq sous-unités, les sous-unités actDE étant identifiées comme une protéine de fusion. Un ensemble complet de gènes codant pour toutes les sous-unités ACIII, qui ont été récupérés à partir de deux bins génomiques liés à NICIL-2 des métagénomes de Yellowstone, ont été trouvés pour contenir la fusion actDE et regroupés avec I. album et M. roseus. NICIL-2 ne contient pas cette fusion et les gènes de son complexe ACIII sont plus étroitement liés à R. marinus et S. ruber.
Les accepteurs d’électrons terminaux NICIL-2 comprennent une cytochrome c oxydase de type aa3 (Complexe IV) et des cytochromes c oxydases alternatives possibles, annotées comme CoxMOP. Il est peu probable que NICIL-2 soit microaérophile car les oxydases de type cbb3 n’ont pas été détectées dans le génome. De plus, le cytochrome bd n’a pas été détecté. À titre de comparaison, les génomes de I. album et de M. roseus contiennent des gènes pour la cytochrome c oxydase de type cbb3 et un complexe cytochrome bd.
Le génome NICIL-2 contient un ensemble incomplet de gènes men pour la synthèse de la ménaquinone. Une voie biosynthétique complète de la ménaquinone contient du menFDHCEBAG (Bentley et Meganathan, 1982) et le génome NICIL-2 ne comprend que du menBAG. À titre de comparaison, C. tepidum et I. l’album contient des voies men complètes, tandis que les génomes de M. roseus et de R. marinus ont des annotations pour tous les gènes requis sauf menB et menH, respectivement. Homologues de gènes codant pour des enzymes de la voie biosynthétique alternative de la ménaquinone, la voie de la futalosine (Arakawa et al., 2011), n’ont pas été détectés dans NICIL-2. Les gènes biosynthétiques de l’ubiquinone sont également absents. Le génome NICIL-2 peut avoir une couverture incomplète dans cette zone et d’autres gènes men peuvent être trouvés avec un génome complètement assemblé. Alternativement, NICIL-2 peut s’engager dans un échange de quinone avec d’autres membres de la communauté, comme observé pour le consortium phototrophe “Chlorochromatium aggregatum” (Liu et al., 2013).Les gènes
Flagelles et chimiotaxie
codant pour les protéines du corps basal, du crochet et de l’assemblage du filament sont présents dans le génome NICIL-2. Cependant, NICIL-2 manque de gènes codant pour la machinerie de la chimiotaxie, à l’exception d’une protéine régulatrice, le CheY. Les GSB sont considérés comme non mobiles et manquent de chimiotaxie et de flagelles, tandis que I. album, M. roseus et R. marinus ont des machines flagellaires et chimiotaxiques.