cirkulær RNA-differentiel ekspression i blodcellepopulationer og udforskning af circRNA-deregulering i pædiatrisk akut lymfoblastisk leukæmi
- Circrnaomer af B -, T-celle-og monocytpopulationer
- flere cirkulære isoformer og cirkrna ‘er fra nye gener
- sammenligning mellem celletyper beskrevet celletypespecifik circRNA-ekspression og alternative cirkulariseringsmønstre
- ekspression af circrna ‘er i seks cytogenetiske undertyper af B-celleforløber akut lymfoblastisk leukæmi
Circrnaomer af B -, T-celle-og monocytpopulationer
CircRNA-ekspression i B -, T-celle-og monocytpopulationer af raske donorer blev undersøgt ved anvendelse af højdybde ribodepleteret RNA-cellepopulationer i 12 prøver, med 4 replikater for hver population af celler sorteret fra mononukleære perifere blodceller, Pbmc ‘ er (GEO-serie ID: GSE110159; supplerende metoder og supplerende tabel 1).
CircRNA-kvantificering og annotation blev leveret af CirComPara25, som kombinerede 9 circRNA-detekteringsprogramværktøjer (CIRI226 Findcirc27; Circuseksporter228 på VAA29, STAR30, Segemehl31 og TopHat232 aligners; DCC33; circRNA_finder34; og Segemehl31) for at opnå de mest pålidelige backsplices. Faktisk har delt output fra to eller flere algoritmer til circRNA-detektion vist sig at reducere falske positive forudsigelser35,36. CirComPara udfører læse forbehandling kvalitet filtre, såsom adapter trimning, læse gennemsnitlige kvalitet udvælgelse og filtrering af læse længde. Desuden tæller CirComPara de lineært splejsede læsninger, der er justeret til backsplice-krydsene for hvert circRNA for at estimere ekspressionen af lineære transkripter udtrykt fra circrnas værtsgen. Disse værdier blev kombineret med de bagsplittede læsetællinger, der måler det cirkulære udtryk, for at beregne andelen af udtryk mellem de cirkulære og lineære isoformer (cirkulær til lineær ekspressionsproportion, CLP; se metoder). Endvidere integrerer CLP begrebet cirkulær til lineær ekspressionskorrelation, således at CLP-variation på tværs af betingelser formidler uafhængighedshastigheden mellem et circRNA og dets værtsgenets lineære udtryk33.
samlet set blev 68.007 circrna ‘ er fra 10.148 individuelle gener påvist ved mindst to metoder. Som rapporteret af Hansen et al.36 var algoritmerne for det meste enige om stærkt udtrykte cirkrna ‘ er, hvorimod de, der kun blev opdaget af en algoritme, generelt havde lave læsetællinger (supplerende Fig. 1).
endvidere blev et undersæt på 6.228 circrna ‘ er (fra 3.323 gener), der viser ekspression i alle biologiske replikater af mindst en celletype, hentet og omtalt som “high confidence” (HC) circrna ‘ er (supplerende tabel 2). Sammenligning af circrna ‘ er rapporteret i denne undersøgelse med resultaterne af Nicolet et al.17 bekræftet overensstemmelse for 83% af de 489 HC-cirkrna ‘er, der blev hentet i den forrige undersøgelse og afslørede 5.824 yderligere HC-cirkrna’ er, der endnu ikke var undersøgt for ekspressionsvariation i blodcellepopulationer (supplerende Fig. 2A).
af de 6.228 HC – cirkrna ‘ er blev 5.970 og 5.821 udtrykt i B-og T-celler og 5.144 i monocytter (Fig. 1a). Størstedelen af circrna ‘er (4.763; 80%) blev påvist i alle tre celletyper, herunder allestedsnærværende circrnf60937, circHIPK338 og nye circrna’ er. Nye circrna ‘ er (f.eks. circPICALM) er sandsynligvis specifikke for det hæmatopoietiske rum. Circrna ‘ er deles af to celletyper, hvor de for det meste er almindelige mellem lymfocytter.
ikke-overvåget hovedkomponentanalyse viste relativt lille variation af circRNA-ekspressionsprofiler inden for replikater af den samme cellepopulation og pegede på circRNAome-forskelle, der klart diskriminerede celletyperne (Fig. 1b).
ekspression af 21 HC circrna ‘er blev valideret ved RT-PCR i Pbmc’ er fra forskellige raske donorer (supplerende tabel 3; Tabel 1; Fig. 1c). Denne Validering omfattede eksoniske cirkrna ‘ er fra 15 forskellige gener, to alternative isoformer af IKF1 og af den mandlige specifikke FFY fra Y-kromosomet, en circRNA (18:63280887-63281214: -) afledt af cirkularisering af 328 bp af den unikke store BCL2 intron og en circRNA fra et formodet nyt gen (“intergenisk”, se nedenfor). Den cirkulære struktur af circrna ‘er blev bekræftet ved den observerede berigelse af circrna’ er efter RNase r-behandling og påvist ved krt-PCR med divergerende primere, der er specifikke for backsplice-krydset14,27. Desuden blev alle forudsagte backsplice-kryds bekræftet af Sanger-sekventering.
flere cirkulære isoformer og cirkrna ‘er fra nye gener
næsten alle cirkrna’ er (99,4%) stammer fra annoterede gener, hovedsageligt med backsplice-kryds, der overlapper kendte eksoner (98,9%). Af de 71 circrna ‘ er med begge ender i introniske regioner omfattede de mest rigelige de lymfocytspecifikke circBCL2, som blev valideret, circHLA-E, circRASSF3 og flere circMBL1 isoformer.
næsten halvdelen af circRNA-værtsgenerne udtrykte flere (op til 20) cirkulære isoformer hver (Fig. 1d). Præference backsplice junction brug og ekspression af en eller få udbredte isoformer blev observeret. Det højeste antal isoformer blev udtrykt i monocytter ved hjælp af AGTPBP1 (20) og PICALM (15) og i lymfocytter ved hjælp af UBAP2 (19) og ATM (17).
fireogtredive cirkrna ‘ er afledt af intergeniske regioner. Intergeniske cirkrna ‘ er ved hjælp af samme backsplice ender i forskellige kombinationer identificeret tre loci, der udtrykker flere isoformer. Fem” intergeniske “cirkrna’ er afledt af et formodet nyt gen i 11.2-regionen (kr:65051462-65113813) (supplerende Fig. 3). 65051462-65075912:+), der tidligere blev påvist i blod også af Memcsak og kolleger12, blev valideret (Fig. 1c).
dernæst undersøgte vi, i hvilket omfang udtrykket er til fordel for cirkulære med hensyn til lineære udskrifter, der overlapper backsplice-krydsene. CLP-værdier spænder fra 0 til 1: 0 kommer, når der ikke registreres noget cirkulært udtryk, 0 < CLP < 0,5 repræsenterer cirkrna ‘ er udtrykt mindre rigeligt end de respektive lineære isoformer, 0,5 betyder, at cirkulære og lineære udskrifter har tilsvarende overflod, 0.5 < CLP kurst1 angiver cirkulære isoformer udtrykt mere rigeligt end de respektive lineære udskrifter. Især CLP = 1, når det lineære udtryk i forhold til circRNA ikke detekteres. Interessant nok blev der for 10 cirkrna ‘ er ikke påvist nogen lineær ekspression. Desuden var CLP bemærkelsesværdigt høj (> 0,95) for 14 circrna ‘ er (supplerende Tabel 4), inklusive circGUSBP2 og circNBPF10, med median CLP i området fra 0,99 til 1 i alle cellepopulationer (supplerende Tabel 4) og circAFF2, som viste høj CLP i monocytter (0,97). Præferentiel transkriptcirkularisering i modne blodlegemer af specifikke gener5,39 og/eller højere stabilitet af cirkulær sammenlignet med lineær RNA ‘ er16,40 kunne forklare disse fund.
sammenligning mellem celletyper beskrevet celletypespecifik circRNA-ekspression og alternative cirkulariseringsmønstre
dernæst havde vi til formål at definere forskelle mellem B -, T-celle-og monocytpopulation circrnaomer. Parvise sammenligninger af de tre populationer identificerede i alt 1.369 signifikant differentielt udtrykte circrna ‘er (Dec’ er) mellem celletyper (supplerende tabel 5), der stammer fra 880 gener. Hierarkisk klyngedannelse af DEC-ekspressionsprofiler afspejlede sæt af cirkrna ‘ er, der er opreguleret i hver celletype (Fig. 2a). DECs udelukkende eller overudtrykt i en celletype indikerede populationsspecifikke circrna ‘ er (Fig. 2b): 622 var karakteristiske for B-celler, 183 af T-celler og 438 af monocytter (1.243 i alt; supplerende tabel 5). Desuden blev 72 Dec ‘ er opreguleret i begge lymfocytpopulationer (Fig. 2b-d). Ingen signifikant beriget KEGG veje af Gen ontologi vilkår resulterede for gener af B-celle-karakteristiske circrna ‘ er, som ikke desto mindre omfattede gener involveret i B-celle receptor signalering vej, såsom SOS2 og NFKB1, eller knyttet til B-celle funktioner. Tværtimod blev gener, der udtrykte T-celle karakteristiske cirkrna ‘ er, signifikant beriget T-celle receptor signalvejen. Desuden berigede gener af monocyt-karakteristiske cirkrna ‘ er signifikant flere biologiske processer og veje relateret til monocytfunktioner. Andre celletype-karakteristiske værtsgener havde i stedet cellefunktioner, der ikke var direkte knyttet til oprindelsescellen (supplerende Tabel 6).
selvom celletypekarakteristika circRNA-sæt var uensartede, overlapningen af gensæt, der udtrykte specifikke isoformer, indikerede alternative celletypespecifikke cirkulariseringsmønstre. Det bemærkes, at 37 gener udtrykte cirkrna ‘er, der er karakteristiske for to celletyper, og tegnede sig for 14,7% af generne med multiple celletypespecifikke cirkrna’ er (Fig. 2c). Fire cirkakt3-isoformer viste celletypespecifik ekspression, tre for B-og en for T-celler; også fire circMBNL1 var celletypespecifikke, 3 for B-celler og en for monocytter. Desuden blev seks forskellige grk3 cirkulære isoformer specifikt overudtrykt i B-celler, mens to andre kun blev overudtrykt i monocytter.
kvantificering ved KVRT-PCR i B-celler, T-celler og monocytter sorteret fra 5 uafhængige raske donorer bekræftede RNA-sekv-resultater for alle 15 testede cirkrna ‘ er, der understøtter datarobusthed og reproducerbarhed (Fig. 2D og supplerende Fig. 4).
signifikant opregulering i B-celler på 5 cirkrna ‘ er, inklusive cirkaff3 (eksoner 4-6), cirkil4r (eksoner 6-7), cirksetbp1 (ekson 2) blev bekræftet. Desuden høj circRNA-ekspression fra det genomiske område 9p13.2 inklusive PAKS5 (supplerende Fig. 5) blev valideret: circpaks5 (eksoner 2-5) og circcchc7 (ekson 2) var begge b-cellespecifikke, mens en tendens mod opregulering af circGRHPR i B-celler var i overensstemmelse med estimatet fra RNA-sekv-data. B-celler41 og co-ekspression af pak5 og CKC7 lineære transkripter blev beskrevet under progressionen fra almindelige lymfocytprecursorer til præ-pro-B-celler42. Forslag til samregulering af 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 fandt 102 circrna ‘ er forskelligt udtrykt på tværs af blodcelletyper og stadier, hvoraf 98 blev påvist i vores data. I særdeleshed, 42 circrna ‘ er resulterede differentielt udtrykt også i vores sammenligning, hvoraf 31 var celletypespecifikke. Samlet set var vores data i overensstemmelse med circRNA-klynger, der tidligere var forbundet med modne cellepopulationer (supplerende Fig. 2b). Circrna ‘ er, der tidligere var tildelt lymfoide cellespecifikke klynger, viste det højeste udtryk i B-celler eller T-celler, inklusive circcchc7 og circfbh7, som vi eksperimentelt validerede. Ni ud af 10 circrna ‘ er, der tidligere blev betragtet som monocytspecifikke, blev tilbagekaldt ved, at vores Analyse blev mere udtrykt i monocytter, inklusive circAFF2. Imidlertid er størstedelen af de 1.243 cirkrna ‘er defineret som celletypespecifikke i denne undersøgelse, inklusive 11 ud af 15 cirkrna’ er, for hvilke celletypespecifik overekspression blev bekræftet af krt-PCR i denne undersøgelse (Fig. 2d), var ikke repræsenteret i klyngerne defineret af Nicolet et al.
dernæst inspicerede vi, om overfloden af cirkulære isoformer med hensyn til lineær ekspression blev ændret mellem celletyperne. CLP-variationer på tværs af prøvebetingelser indikerer uafhængighedshastigheden mellem et circRNA og værtsgenets lineære ekspression. For det første observerede vi, at antallet af circrna ‘ er med mere rigelig cirkulær ekspressionsandel (CLP > 0,5) var højest i lymfoide celler (185 i monocytter, 333 og 364 i henholdsvis B-celler og T-celler), hvilket er i overensstemmelse med tidligere observationer på et mindre sæt circRNAs17. Derefter identificerede vi 687 circrna ‘er (fra 495 gener) med værtsgenuafhængig ekspression (supplerende Tabel 7). Blandt Dec ‘ er havde 163 signifikant variation i cirkulær ekspressionsandel mellem celletyper i overensstemmelse med den differentielle absolutte ekspression, hvilket indikerer, at observerede variationer af disse circRNA-ekspressionsniveau på tværs af cellepopulationer ikke skyldes en tilsvarende variation af lineær ekspression. 1, for hvilken opregulering i T-celler blev valideret, blev også udtrykt med høj CLP i T-celler. Især viste 25 cirkrna ‘ er høj og signifikant varieret cirkulær ekspressionsandel (supplerende Fig. 6), herunder den validerede cirkks (intergen) og yderligere tre intergeniske cirkrna ‘ er, alle overudtrykt i B – og T-celler. CircSMARCA5 havde den Højeste Absolutte og relative cirkulære ekspression i B-celler, mens den var signifikant lavere i T-celle og lavest i monocytter (supplerende Fig. 7).
ekspression af circrna ‘er i seks cytogenetiske undertyper af B-celleforløber akut lymfoblastisk leukæmi
ud fra den ovenfor beskrevne transkriptom-brede circRNA-ressource blev ekspressionen og mulig deregulering af circrna’ er i BCP-ALL undersøgt for et målsæt af circrna ‘ er. De valgte circrna ‘ er viste lymfocytspecificitet og / eller afledt af leukæmi-associerede loci. Efter disse kriterier er ti af cirkrna ‘ erne med valideret opregulering i B-celler, T-celler eller i begge lymfocytpopulationer (Fig. 2d) blev udvalgt til kvantificering i BCP-ALL, INKLUSIVE circrna ‘ er fra kendte gener (AFF2, AFF3, BCL2, FBH7, IKSF1, IL4R, PAKS5, SETBP1 og HCCHC7) og den nyligt identificerede circc(intergen) stærkt udtrykt i lymfocytter. Derudover er circrna udtrykt på et højt niveau i blodceller hos mandlige forsøgspersoner; circHIPK3, for hvilke onkogene egenskaber er kendt i faste kræft43; og circPVT1, for nylig forbundet med akut lymfoblastisk leukæmi22, blev inkluderet.
ekspression af de 13 udvalgte cirkrna ‘ er blev målt ved KVRT-PCR i 32 BCP-alle patientafledte prøver (supplerende tabel 8).
alle leukæmiske prøver sammen blev først sammenlignet med B-celler fra raske donorer (supplerende Fig. 8 og Fig. 3a) for at kontrollere for dereguleret circRNA-ekspression i leukæmiske celler. For syv circrna ‘ er var udtrykket signifikant anderledes i alle prøver sammenlignet med B-celler. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
yderligere undersøgte vi ekspression af målsættet af circrna ‘ er på tværs af de vigtigste BCP-alle cytogenetiske undertyper (Fig. 3a). Cytogenetiske subtyper er karakteriseret ved specifikke genetiske læsioner, herunder tilbagevendende translokationer (MLL-omlejringer, BCR/ABL, ETV6-RUNKS1 og tcf3-PBKS1 fusioner) og hyperdiploid karyotype. Cytogenetisk subtype karakterisering er medvirkende til risiko prognose og behandling stratificering af leukæmi patienter. Leukæmiske celler af forskellige undertyper har forskellige biologiske egenskaber, genekspressionsprofiler og specifikke miRNA-signaturer44,45. I denne sammenhæng blev nye oplysninger om den heterogene karakter af akutte leukæmier tilføjet af de observerede signifikante circRNA-ekspressionsforskelle mellem cytogenetiske undertyper (Fig. 3a). CircAFF2 var stærkt udtrykt i TCF3-PBKS1 BCP-ALL og i mindre grad i ETV6-RUNKS1 BCP-ALL sammenlignet med B-celler og andre cytogenetiske BCP-ALL-undergrupper. CircBCL2 (intronic) blev opreguleret i alt med ETV6-RUNKS1 fusioner. CircSETBP1 og intergen(intergen) blev begge meget reduceret i MLL-omarrangerede prøver. 1 var lavere i BCR-ABL og hyperdiploide leukæmier sammenlignet med undertypen ETV6-RUNKS1, hvor udtrykket blev konserveret på niveauer, der var sammenlignelige med B-celler.