Concluir a Sequência do Genoma de Clostridium innocuum Cepa ATCC 14501
EDITAL
relatamos o genoma completo sequência de Clostridium innocuum cepa ATCC 14501, que foi identificado em 1962, depois de isolamento a partir de um abscesso apendicular (1). Foi caracterizada como uma haste Gram-positiva com esporos terminais. As colónias tinham entre 1,5 e 2,5 mm de diâmetro, brilhantes, brancas, elevadas e não-hemolíticas. A inoculação Intraperitoneal do sobrenadante da cultura em ratinhos não foi catogénica. Desde então, C. innocuum tem sido considerado um microorganismo gastrointestinal benigno (1).
Now, the pathogenic potential of C. innocuum is being reconsidered. Recentemente, Chia e colegas relataram que C. innocuum é a segunda espécie clostridiosa mais comum causando infecção extra (2) e é uma causa de uma infecção intestinal tipo clostridioides difficile (3). Estes isolados eram resistentes à vancomicina, citotóxicos para as células Vero e HT-29 e enteropatogénicos em ratinhos (3). Com esta reconsideração da patogenicidade de C. innocuum, é necessária a sequência completa do genoma da estirpe ATCC 14501.
ADN Genómico (gDNA) para ambos os Illumina e Nanopore bibliotecas foi extraído usando o BiOstic bacteremia DNA isolation kit (Qiagen, Germantown, MD) de uma noite de cultura crescido de forma anaeróbia, em tríptico caldo de soja a 37°C. Longa-leitura de sequenciamento de bibliotecas foram preparados a partir de unsheared gDNA usando ligadura sequencing kit SQK-LSK109 (Oxford Nanopore, reino UNIDO) e seqüenciados no MinION plataforma, usando um critério de conformidade FLO-MIN106 célula de fluxo. Parâmetros padrão foram usados para todos os softwares, salvo indicação em contrário. O Guppy v3. 4. 5 foi usado para basear as leituras de chamadas com o modelo de alta precisão R9.4.1 e para executar filtragem de qualidade de leitura com base em pontuações Q, desmultiplexagem e limpeza de código de barras. A cobertura de leitura aproximada foi de 98× de 19.646 leituras totalizando 460.0 Mbp. O valor lido de n50 foi 22.933 nucleótidos, e o valor L50 foi 7.784 leituras. A qualidade de leitura de Nanopore foi avaliada utilizando pycoQC v2.5.0.21 (4).
bibliotecas de sequenciamento de Leitura curta foram preparadas a partir de gDNA usando o Kit Nextera XT (Illumina, San Diego, CA) e sequenciadas na plataforma Illumina MiSeq usando uma célula de fluxo v3 para produzir 482.327 pares de 301-bp reads. Adaptadores de sequenciamento foram aparados a partir de reads on-instrument para gerar 196,3 Mbp de sequência, com uma cobertura aproximada do genoma de 42×. A qualidade de leitura da Illumina foi avaliada usando FastQC v0. 11. 2 (5). Para minimizar as chamadas de variantes falso-positivas em alinhamentos, não foi realizada nenhuma limpeza de qualidade da leitura Illumina (6).
o genoma foi montado com leituras de Nanopore passando a filtragem de pontuação Q usando Flye v2. 6 para gerar um único contig de 4,30-Mb (7). As leituras de ilumina foram alinhadas com a montagem usando BWA v0.7.17, e os erros de montagem foram corrigidos usando Pilon v1. 23 com uma configuração — mindepth de 0.1 (8, 9). Alinhamento de leitura em série e correção de Pilon foram realizadas três vezes até que não foram geradas mais correções de montagem. Software personalizado (Pilon Tools v0. 1) (https://github.com/egonozer/pilon_tools) foi usado para identificar, avaliar manualmente e corrigir quaisquer erros residuais de montagem de homopolímero. Bomba de circulação v1. 5.5 foi usado para assegurar a circularização do cromossoma, cortando extremidades sobrepostas e girando até o início do gene dnaA (10). O conjunto final é uma sequência cromossômica única com um comprimento de 4.718.906 bp e um conteúdo GC de 43,6%. A anotação foi realizada usando o NCBI Prokaryotic Genome Annotation Pipeline (PGAP) v4.11 (11, 12).
disponibilidade de dados.Este projecto foi depositado no DDBJ/ENA/GenBank com o número de adesão CP048838. Os números de adesão de dados brutos são SRR11552096 e SRR11552095.