komplet genomsekvens af Clostridium innocuum stamme ATCC 14501
meddelelse
vi rapporterer den komplette genomsekvens af Clostridium innocuum stamme ATCC 14501, som blev identificeret i 1962 efter isolering fra en appendiceal abscess (1). Det blev karakteriseret som en Gram-positiv stang med terminale sporer. Kolonier var 1,5 til 2,5 mm i diameter, blanke, hvide, hævede og ikke-hæmolytiske. Intraperitoneal inokulation af kultur supernatanten i mus var ikke-patogen. Siden da er C. innocuum blevet betragtet som en godartet gastrointestinal mikroorganisme (1).
nu genovervejes det patogene potentiale for C. innocuum. For nylig rapporterede Chia og kolleger, at C. innocuum er den næst mest almindelige clostridiale art, der forårsager ekstraintestinal infektion (2) og er en årsag til en Clostridioides difficile-lignende tarminfektion (3). Disse isolater var vancomycinresistente, cytotoksiske over for VERO-og HT-29-celler og enteropatogene hos mus (3). Med denne genovervejelse af C. innocuum patogenicitet er den komplette genomsekvens af stamme ATCC 14501 nødvendig.
genomisk DNA (gDNA) til både Illumina-og Nanopore-biblioteker blev ekstraheret ved hjælp af BIOSTIC bacteremia DNA-isolationskit (Chiagen, Germanby, MD) fra en kultur natten over dyrket anaerobt i tryptisk sojabuljong ved 37 C. Langlæste sekventeringsbiblioteker blev fremstillet ud fra ikke-skåret gDNA ved hjælp af ligationssekvenseringssæt KVK-LSK109 (Nanopore, UK) og sekventeret på Minionplatformen ved hjælp af en FLO-MIN106 strømningscelle . Standardparametre blev brugt til alle programmer, medmindre andet er angivet. Guppy v3.4.5 blev brugt til at basere opkaldslæsninger med R9.4. 1-modellen med høj nøjagtighed og til at udføre læsekvalitetsfiltrering baseret på K-score, demultipleksering og stregkodetrimning. Den omtrentlige læsedækning var 98 kr. fra 19.646 læsninger på i alt 460,0 Mbp. Den læste N50-værdi var 22.933 nukleotider, og L50-værdien var 7.784 læser. Nanopore læsekvalitet blev evalueret ved hjælp af pycoc v2.5.0.21 (4).
Kortlæste sekventeringsbiblioteker blev udarbejdet fra gDNA ved hjælp af det næste sæt (Illumina, San Diego, CA) og sekventeret på Illumina Misek platform ved hjælp af en v3 strømningscelle for at give 482.327 par 301-bp læser. Sekventeringsadaptere blev trimmet fra læser på instrumentet for at generere 196,3 Mbp sekvens med en omtrentlig genomdækning på 42 liter. Illumina læsekvalitet blev evalueret ved hjælp af v0.11.2 (5). For at minimere falsk-positive variantopkald i justeringer blev der ikke udført nogen kvalitetstrimning af Illumina-aflæsninger (6).
genomet blev samlet med Nanopore læser passerer K score filtrering ved hjælp af Flye v2.6 at generere en enkelt 4.30-Mb contig (7). Adapter-trimmet Illumina læser blev justeret til samlingen ved hjælp af VVA v0.7.17, og monteringsfejl blev korrigeret ved hjælp af Pilon v1. 23 med en –mindepth-indstilling på 0,1 (8, 9). Seriel læsejustering og Pilon-korrektion blev udført tre gange, indtil der ikke blev genereret yderligere monteringskorrektioner. Brugerdefinerede programmer (Pilon Tools v0.1) (https://github.com/egonozer/pilon_tools) blev brugt til at identificere, manuelt vurdere og rette eventuelle resterende homopolymer monteringsfejl. Cirkulator v1. 5.5 blev anvendt til at sikre cirkularisering af kromosomet ved at trimme overlappende ender og rotere til starten af dnaA-genet (10). Den endelige samling er en enkelt kromosomal sekvens med en længde på 4.718.906 bp og et GC-indhold på 43,6%. Annotation blev udført ved hjælp af NCBI prokaryote Genome Annotation Pipeline (PGAP) v4.11 (11, 12).
data tilgængelighed.Dette projekt er blevet deponeret i DDBJ / Ena / GenBank under tiltrædelsesnummer CP048838. Rådatatiltrædelsesnumrene er SRR11552096 og SRR11552095.