Secuencia completa del Genoma de la Cepa de Clostridium inocuo ATCC 14501
ANUNCIO
Presentamos la secuencia completa del genoma de la cepa de Clostridium inocuo ATCC 14501, que se identificó en 1962 tras el aislamiento de un absceso apendicular (1). Se caracterizó como una varilla Gram-positiva con esporas terminales. Las colonias eran de 1,5 a 2,5 mm de diámetro, brillantes, blancas, elevadas y no hemolíticas. La inoculación intraperitoneal del sobrenadante de cultivo en ratones no fue patógena. Desde entonces, C. innocuum ha sido considerado un microorganismo gastrointestinal benigno (1).
Ahora se está reconsiderando el potencial patógeno de C. innocuum. Recientemente, Chia y sus colegas informaron que C. innocuum es la segunda especie clostridial más común que causa infección extraintestinal (2) y es una causa de una infección intestinal similar a Clostridioides difficile (3). Estos aislados eran resistentes a la vancomicina, citotóxicos para las células Vero y HT-29 y enteropatógenos en ratones (3). Con esta reconsideración de la patogenicidad de C. innocuum, se necesita la secuencia completa del genoma de la cepa ATCC 14501.
El ADN genómico (gDNA) para bibliotecas Illumina y Nanoporos se extrajo utilizando el kit de aislamiento de ADN bacteriemia bística (Qiagen, Germantown, MD) de un cultivo de noche cultivado anaeróbicamente en caldo de soja triptico a 37°C. Las bibliotecas de secuenciación de larga lectura se prepararon a partir de gDNA sin separar utilizando el kit de secuenciación de ligadura SQK-LSK109 (Oxford Nanopore, Reino Unido) y se secuenciaron en la plataforma MinION utilizando una célula de flujo FLO-MIN106. Se utilizaron parámetros predeterminados para todo el software a menos que se especifique lo contrario. Guppy v3.4.5 se utilizó para basar las lecturas de llamadas con el modelo de alta precisión R9.4. 1 y para realizar filtros de calidad de lectura basados en puntuaciones Q, desmultiplexación y recorte de códigos de barras. La cobertura de lectura aproximada fue de 98× de 19.646 lecturas por un total de 460,0 Mbp. El valor de N50 leído fue de 22.933 nucleótidos, y el valor de L50 fue de 7.784 lecturas. La calidad de lectura de nanoporos se evaluó utilizando pycoQC v2.5.0.21 (4).
Se prepararon bibliotecas de secuenciación de lectura corta a partir de gDNA utilizando el kit Nextera XT (Illumina, San Diego, CA) y se secuenciaron en la plataforma Illumina MiSeq utilizando una celda de flujo v3 para obtener 482.327 pares de lecturas de 301 bp. Los adaptadores de secuenciación se recortaron de lecturas en el instrumento para generar 196,3 Mbp de secuencia, con una cobertura genómica aproximada de 42×. La calidad de lectura de Illumina se evaluó utilizando FastQC v0. 11.2 (5). Para minimizar las llamadas de variantes con falsos positivos en las alineaciones, no se realizó un recorte de calidad de las lecturas de Illumina (6).
El genoma se ensambló con lecturas de nanoporos que pasaron por el filtrado de puntuación Q utilizando Flye v2.6 para generar un solo contig de 4,30 Mb (7). Las lecturas de Illumina recortadas por adaptador se alinearon con el ensamblaje utilizando BWA v0.7.17, y los errores de ensamblaje se corrigieron utilizando Pilon v1. 23 con un ajuste de mind mindepth de 0.1 (8, 9). La alineación de lectura en serie y la corrección de pilones se realizaron tres veces hasta que no se generaron más correcciones de ensamblaje. Se utilizó un software personalizado (Pilon Tools v0.1) (https://github.com/egonozer/pilon_tools) para identificar, evaluar manualmente y corregir cualquier error de ensamblaje de homopolímero residual. Circulador v1. 5.5 se utilizó para asegurar la circularización del cromosoma recortando los extremos superpuestos y rotando hasta el inicio del gen dnaA (10). El ensamblaje final es una secuencia cromosómica única con una longitud de 4.718.906 pa y un contenido de GC del 43,6%. La anotación se realizó utilizando la Tubería de Anotación del Genoma Procariótico NCBI (PGAP) v4. 11 (11, 12).
Disponibilidad de datos.Este proyecto se ha depositado en DDBJ / ENA / GenBank con el número de adhesión CP048838. Los números de acceso de datos sin procesar son SRR11552096 y SRR11552095.