Séquence génomique complète de la souche ATCC 14501 de Clostridium innocuum
ANNONCE
Nous rapportons la séquence génomique complète de la souche ATCC 14501 de Clostridium innocuum, qui a été identifiée en 1962 après isolement d’un abcès appendiculaire (1). Il a été caractérisé comme une tige à Gram positif avec des spores terminales. Les colonies avaient un diamètre de 1,5 à 2,5 mm, brillantes, blanches, surélevées et non hémolytiques. L’inoculation intrapéritonéale du surnageant de culture chez la souris était non pathogène. Depuis lors, C. innocuum est considéré comme un microorganisme gastro-intestinal bénin (1).
Maintenant, le potentiel pathogène de C. innocuum est en cours de réexamen. Récemment, Chia et ses collègues ont rapporté que C. innocuum est la deuxième espèce de clostridium la plus fréquente causant une infection extra-intestinale (2) et est une cause d’une infection intestinale de type Clostridioides difficile (3). Ces isolats étaient résistants à la vancomycine, cytotoxiques aux cellules Vero et HT-29 et entéropathogènes chez la souris (3). Avec ce réexamen de la pathogénicité de C. innocuum, la séquence génomique complète de la souche ATCC 14501 est nécessaire.
L’ADN génomique (ADNGD) des bibliothèques Illumina et Nanopores a été extrait à l’aide du kit d’isolation de l’ADN de bactériémie BiOstic (Qiagen, Germantown, MD) à partir d’une culture de nuit cultivée de manière anaérobie dans un bouillon de soja tryptique à 37 ° C. Des bibliothèques de séquençage à lecture longue ont été préparées à partir d’ADNGD non cisaillé à l’aide du kit de séquençage de ligature SQK-LSK109 (Oxford Nanopore, UK) et séquencées sur la plate-forme MinION à l’aide d’un flux FLO-MIN106 cellule. Les paramètres par défaut ont été utilisés pour tous les logiciels, sauf indication contraire. Guppy v3.4.5 a été utilisé pour baser les lectures d’appels avec le modèle haute précision R9.4.1 et pour effectuer un filtrage de la qualité de lecture basé sur les scores Q, le démultiplexage et le rognage des codes-barres. La couverture approximative en lecture était de 98 × sur 19 646 lectures totalisant 460,0 Mbp. La valeur de N50 lue était de 22 933 nucléotides et la valeur de L50 était de 7 784 lectures. La qualité de lecture des nanopores a été évaluée à l’aide de pycoQC v2.5.0.21 (4).
Des bibliothèques de séquençage à lecture courte ont été préparées à partir de l’ADNGD à l’aide du kit Nextera XT (Illumina, San Diego, Californie) et séquencées sur la plate-forme Illumina MiSeq à l’aide d’une cellule d’écoulement v3 pour produire 482 327 paires de lectures de 301 pb. Les adaptateurs de séquençage ont été découpés à partir des lectures sur l’instrument pour générer 196,3 Mbp de séquence, avec une couverture génomique approximative de 42 ×. La qualité de lecture d’Illumina a été évaluée à l’aide de FastQC v0.11.2(5). Pour minimiser les appels de variantes faussement positifs dans les alignements, aucun rognage de qualité des lectures Illumina n’a été effectué (6).
Le génome a été assemblé avec des lectures Nanopores passant le filtrage du score Q à l’aide de Flye v2.6 pour générer un seul contig de 4,30 Mo (7). Les lectures Illumina ajustées à l’adaptateur ont été alignées sur l’ensemble à l’aide de la version BWA v0.7.17, et les erreurs d’assemblage ont été corrigées à l’aide de la version Pilon v1.23 avec un réglage –mindepth de 0,1 (8, 9). L’alignement de lecture en série et la correction du Pilon ont été effectuées trois fois jusqu’à ce qu’aucune autre correction d’assemblage n’ait été générée. Un logiciel personnalisé (Outils Pilon v0.1) (https://github.com/egonozer/pilon_tools) a été utilisé pour identifier, évaluer manuellement et corriger les erreurs d’assemblage résiduelles d’homopolymères. Circulateur v1.5.5 a été utilisé pour assurer la circularisation du chromosome en rognant les extrémités qui se chevauchent et en tournant jusqu’au début du gène dnaA (10). L’assemblage final est une séquence chromosomique unique d’une longueur de 4 718 906 pb et d’une teneur en GC de 43,6%. L’annotation a été réalisée à l’aide du Pipeline d’annotation du génome Procaryotique NCBI (PGAP) v4.11 (11, 12).
Disponibilité des données.Ce projet a été déposé à la DDBJ/ENA/GenBank sous le numéro d’adhésion CP048838. Les numéros d’accès aux données brutes sont SRR11552096 et SRR11552095.