Sirkulær rna-differensialuttrykk I blodcellepopulasjoner og utforskning av circRNA-deregulering i pediatrisk akutt lymfoblastisk leukemi
- Circrna-Ekspresjon i b -, T-celle-og monocyttpopulasjoner
- Flere sirkulære isoformer og circrna fra nye gener
- Sammenligning mellom celletyper avslørt celletypespesifikke circRNA uttrykk og alternative sirkulasjonsmønstre
- ekspresjon av circrna i seks cytogenetiske subtyper av b-celle forløper akutt lymfoblastisk leukemi
Circrna-Ekspresjon i b -, T-celle-og monocyttpopulasjoner
CircRNA-ekspresjon i b -, T-celle-og monocyttpopulasjoner av friske donorer ble undersøkt ved bruk av høy dybde ribodepletert rna-seq data av 12 prøver, med 4 replikater for hver populasjon av celler sortert fra mononukleære celler i perifert blod, Pbmc (GEO-serie ID: GSE110159; Supplerende Metoder og Supplerende Tabell 1).
CircRNA kvantifisering og merknad ble levert Av CirComPara25, som kombinerte 9 circRNA deteksjon programvareverktøy (CIRI226 Findcirc27; CIRCexplorer228 på bwa29, STAR30, Segemehl31 og TopHat232 aligners; DCC33; circRNA_finder34; Og Segemehl31) for å få de mest pålitelige backsplices. Faktisk har delt utgang fra to eller flere algoritmer for circRNA-deteksjon vist seg å redusere falske positive prediksjoner35, 36. CirComPara utfører lese pre-prosessering kvalitet filtre, for eksempel adapter trimming, lese gjennomsnittlig kvalitet utvalg og filtrering av lese lengde. Dess, CirComPara teller lineært skjøtes leser justert til backsplice veikryss av hver circRNA å anslå uttrykket av lineære transkripsjoner uttrykt fra circRNA vert-genet. Disse verdiene ble kombinert med backspliced lese teller, som måler det sirkulære uttrykket, for å beregne andelen av uttrykket mellom de sirkulære og lineære isoformer (Sirkulær Til Lineær uttrykk Andel, CLP; se Metoder). VIDERE bygger CLP begrepet sirkulær til lineær uttrykkskorrelasjon, slik AT clp-variasjon på tvers av forhold formidler uavhengighetsgraden mellom et circRNA og dets vert-genets lineære uttrykk33.
Totalt ble 68 007 sirkrna fra 10 148 individuelle gener påvist ved minst to metoder. Som rapportert Av Hansen et al.36, algoritmene stort sett enige om svært uttrykt circRNAs, mens de oppdaget av bare en algoritme hadde generelt lav lese teller (Supplerende Fig. 1).
videre ble et undersett av 6228 sirkrna (fra 3323 gener) som viste uttrykk i alle biologiske replikater av minst en celletype hentet og referert til som” høy konfidens ” (hc) sirkrna (Supplerende Tabell 2). Sammenligning av circRNAs rapportert i denne studien med resultatene Av Nicolet et al.17 bekreftet samsvar for 83% av DE 489 HC-kretsene som ble hentet i den forrige studien, og avslørte 5824 ekstra hc-kretsene som ennå ikke var undersøkt for ekspresjonsvariasjon i blodcellepopulasjoner (Supplerende Fig. 2A).
av de 6228 HC-kretsene ble 5970 og 5821 uttrykt I B – og T-celler, og 5144 i monocytter (Fig. 1a). Flertallet av circrna (4763; 80%) ble påvist i alle tre celletyper, inkludert allestedsnærværende circZNF60937, circHIPK338 og nye circrna. Nye sirkrnaer (f. eks. sirkpicalm) er sannsynligvis spesifikke for det hematopoietiske kompartmentet. CircRNAs deles av to celletyper der det meste vanlig mellom lymfocytter.
Unsupervised hovedkomponentanalyse viste relativt liten variasjon av circRNA uttrykksprofiler innenfor replikater av samme cellepopulasjon, og pekte på circRNAome forskjeller som klart diskriminerte celletyper (Fig. 1b).
Uttrykk for 21 HC circrna ble validert AV RT-PCR i Pbmcer av forskjellige friske donorer (Supplerende Tabell 3; Tabell 1; Fig. 1c). Denne valideringen inkluderte eksoniske circrna fra 15 forskjellige gener, to alternative isoformer AV IKZF1 og av den hannspesifikke ZFY fra Y-kromosomet, en circRNA (18:63280887-63281214:−) avledet fra sirkularisering av 328 bp av den unike store bcl2 intron, og en circRNA fra et antatt nytt gen (“intergenisk”, se nedenfor). Den sirkulære strukturen til circrna ble bekreftet av den observerte anrikningen av circrna etter rnase r-behandling, og detektert av qRT-PCR med divergerende primere spesifikke for backsplice junction14, 27. Dess, alle spådd backsplice veikryss ble bekreftet Av Sanger sekvensering.
Flere sirkulære isoformer og circrna fra nye gener
Nesten Alle circrna (99,4%) avledet fra annoterte gener, prevalently med backsplice veikryss overlappende kjente eksoner (98,9%). Av de 71 sirkrnaene med begge ender i introniske regioner, inkluderte de mest omfattende de lymfocyttspesifikke circBCL2, som ble validert, circHLA-E, circRASSF3 og flere circMBL1 isoformer.
Nesten halvparten av circRNA-vertsgenene uttrykte flere (opptil 20) sirkulære isoformer hver (Fig. 1d). Foretrukket backsplice junction bruk og uttrykk for en eller få utbredte isoformer ble observert. Det høyeste antallet isoformer ble uttrykt i monocytter AV AGTPBP1 (20) OG PICALM (15), og i lymfocytter av UBAP2 (19) og ATM (17).
trettifire sirkrnaer avledet fra intergeniske regioner. Intergenic circrna bruker samme backsplice ender i ulike kombinasjoner identifisert tre loci uttrykke flere isoformer. Fem” intergeniske ” sirkrna avledet fra et antatt nytt gen I Xq11 .2-regionen (chrX:65051462-65113813) (Supplerende Fig. 3). Den mest omfattende circRNA av locus, circX (intergenic) (x:65051462-65075912:+), tidligere påvist i blod Også Av Memczak og kolleger12, ble validert (Fig. 1c).
deretter undersøkte Vi i hvilken grad uttrykket er til fordel for sirkulære med hensyn til lineære transkripsjoner som overlapper backsplice-kryssene. CLP-verdier varierer fra 0 til 1: 0 kommer når det ikke oppdages noe sirkulært uttrykk, 0 < CLP < 0,5 representerer sirkrna uttrykt mindre rikelig enn de respektive lineære isoformene, 0,5 betyr at sirkulære og lineære transkripsjoner har tilsvarende overflod, 0.5 < CLP ≤ 1 indikerer sirkulære isoformer uttrykt mer rikelig enn de respektive lineære transkripsjonene. SPESIELT CLP = 1 når det lineære uttrykket i forhold til circRNA ikke oppdages. Interessant, for 10 circRNAs ble det ikke oppdaget noe lineært uttrykk. VIDERE VAR CLP bemerkelsesverdig høy (>0,95) for 14 circrna (Supplerende Tabell 4), inkludert circGUSBP2 og circNBPF10, med median CLP fra 0,99 til 1 i alle cellepopulasjoner (Supplerende Tabell 4), og circAFF2, som viste høy CLP i monocytter (0,97). Fortrinn transkript sirkularisering i modne blodceller av spesifikke gener5, 39 og / eller høyere stabilitet av sirkulær sammenlignet med lineær RNAs16, 40 kan forklare disse funnene.
Sammenligning mellom celletyper avslørt celletypespesifikke circRNA uttrykk og alternative sirkulasjonsmønstre
Deretter forsøkte vi å definere forskjeller I b -, T-celle-og monocyttpopulasjonen circRNAomes. Parvise sammenligninger av de tre populasjonene identifiserte totalt 1369 signifikant differensielt uttrykte circrna (DECs) mellom celletyper (Supplerende Tabell 5), som stammer fra 880 gener. Hierarkisk clustering AV DEC uttrykksprofiler reflekterte settene av circRNAs oppregulert i hver celletype(Fig. 2a). DECs utelukkende eller over-uttrykt i en celletype indikerte populasjonsspesifikke circRNAs (Fig. 2b): 622 var karakteristiske For B-celler, 183 Av T-celler og 438 av monocytter (1243 totalt; Supplerende Tabell 5). Videre ble 72 Des oppregulert i begge lymfocyttpopulasjoner (Fig. 2b-d). Ingen signifikant beriket kegg veier av genet ontologi vilkår resulterte for gener Av B-celle-karakteristiske circrna, som likevel, inkludert gener involvert I b-celle reseptor signalveien, slik SOM SOS2 OG NFKB1, eller knyttet Til b-celle funksjoner. Tvert imot, gener som uttrykker t-celle karakteristiske circrna ble betydelig beriket T-celle reseptor signalveien. Videre beriket gener av monocytt-karakteristiske sirkrna betydelig flere biologiske prosesser og veier relatert til monocyttfunksjoner. Andre celletypekarakteristiske vertsgener hadde i stedet cellefunksjoner som ikke var direkte knyttet til opprinnelsescellen (Supplerende Tabell 6).
selv om celletypekarakteristiske circRNA-sett var usammenhengende, indikerte overlappingen av gensett som uttrykte spesifikke isoformer alternative celletypespesifikke sirkulasjonsmønstre. Av notatet, 37 gener uttrykt circRNAs karakteristisk for to celletyper og utgjorde 14,7% av gener med flere celletypespesifikke circRNAs (Fig. 2c). Fire circAKT3-isoformer viste celletypespesifikt uttrykk, tre For B – og en For T-celler; også fire circMBNL1 var celletypespesifikke, 3 for B-celler og en for monocytter. Videre ble seks FORSKJELLIGE grk3 sirkulære isoformer spesifikt overuttrykt I B-celler, mens to andre kun ble overuttrykt i monocytter.
Kvantifisering med qRT-PCR i b-celler, T-celler og monocytter sortert fra 5 uavhengige friske donorer bekreftet rna-seq-resultater for alle 15 testede sirkrna, som støtter data robusthet og reproduserbarhet (Fig. 2d Og Utfyllende Fig. 4).
Signifikant oppregulering i B-celler med 5 sirkrna, inkludert circAFF3 (eksoner 4-6), circIL4R (eksoner 6-7), circSETBP1 (ekson 2) ble bekreftet. Videre høy circRNA uttrykk fra den genomiske regionen 9p13.2 inkludert PAX5 (Supplerende Fig. 5) ble validert: circPAX5 (exons 2-5) og circZCCHC7 (exon 2) var Begge b-cellespesifikke, mens en trend mot oppregulering av circGRHPR i B-celler var i samsvar med estimatet fra RNA-seq-dataene. PAX5 utøver en slående rolle i bindingen Av b-celler41 og koekspresjon av pax5 og ZCCHC7 lineære transkripsjoner ble beskrevet under progresjonen fra vanlige lymfocyttforløpere til pre-pro-b-celler42. Forslag til samregulering av 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 fant 102 sirkrna differensielt uttrykt på tvers av blodcelletyper og stadier, hvorav 98 ble påvist i våre data. Spesielt resulterte 42 circRNAs differensielt uttrykt også i vår sammenligning, hvorav 31 var celletypespesifikke. Samlet våre data der i samråd med circRNA klynger tidligere knyttet til modne cellepopulasjoner (Supplerende Fig. 2b). CircRNAs tidligere tildelt lymfoide celle – spesifikke klynger viste det høyeste uttrykket I B-celler eller T-celler, inkludert circZCCHC7 og circFBXW7 som vi eksperimentelt validert. Ni av 10 circRNAs tidligere ansett som monocyte-spesifikke ble tilbakekalt av vår analyse blir mer uttrykt i monocytter, inkludert circAFF2. De fleste av de 1243 sirkrna definert som celletypespesifikke i den foreliggende studien, inkludert 11 av 15 sirkrna hvor celletypespesifikk overuttrykk ble bekreftet av qRT-PCR i denne studien (Fig . 2d), var ikke representert i klyngene definert av Nicolet et al.
deretter inspiserte vi om overflod av sirkulære isoformer med hensyn til lineært uttrykk ble endret mellom celletypene. Clp-variasjoner på tvers av prøvebetingelser indikerer uavhengighetsgraden mellom et circRNA og vert-gen-lineært uttrykk. For det første observerte vi at antall sirkrna med mer rikelig sirkulær uttrykksandel (CLP > 0,5) var høyest i lymfoide celler (185 i monocytter, henholdsvis 333 og 364 i b-celler og T-celler), som er i samsvar med tidligere observasjoner på et mindre sett med sirkrnas17. Deretter identifiserte vi 687 circrna (fra 495 gener) med vertsgenuavhengig uttrykk (Supplerende Tabell 7). Blant DECs hadde 163 signifikant variasjon av sirkulær uttrykksandel mellom celletyper i samsvar med differensial absolutt uttrykk, noe som indikerer at observerte variasjoner av disse circRNA-uttrykksnivået over cellepopulasjoner ikke skyldes en tilsvarende variasjon av lineær uttrykk. CircIKZF1, hvor oppregulering i T-celler ble validert, ble også uttrykt med høy CLP i T-celler. Spesielt viste 25 sirkrna høy og signifikant variert sirkulær uttrykksandel (Supplerende Fig. 6), inkludert den validerte circX (intergenic) og tre ekstra intergenic circrna, alle overuttrykt I B-og T-celler. CircSMARCA5 hadde det høyeste absolutte og relative sirkulære uttrykket I B-celler, mens det var signifikant lavere I T-celle og lavest i monocytter (Supplerende Fig. 7).
ekspresjon av circrna i seks cytogenetiske subtyper av b-celle forløper akutt lymfoblastisk leukemi
med utgangspunkt i den ovenfor beskrevne transcriptome-brede circRNA-ressursen ble uttrykket og mulig deregulering av circrna i BCP-ALL undersøkt for et målsett med circrna. De valgte sirkrna viste lymfocyttspesifisitet og / eller avledet fra leukemiassosiert loci. Etter disse kriteriene, ti av sirkrna med validert oppregulering I B-celler, T-celler eller i begge lymfocyttpopulasjoner (Fig. 2d) ble valgt for kvantifisering I BCP-ALL, inkludert circrna fra kjente gener (AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 OG ZCCHC7) og den nylig identifiserte circX(intergenic) sterkt uttrykt i lymfocytter. I tillegg circZFY, en circRNA uttrykt på et høyt nivå i blodceller av mannlige fag; circHIPK3, hvor onkogene egenskaper er kjent i faste krefter43; og circPVT1, nylig knyttet til akutt lymfoblastisk leukemi22, ble inkludert.
Ekspresjon av de 13 utvalgte circrnaene ble målt ved qRT-PCR i 32 BCP-all pasientderivert xenograft (PDX)-prøver (Supplerende Tabell 8).
Alle leukemiske prøver sammen ble først sammenlignet Med b-celler fra friske donorer (Supplerende Fig. 8 Og Fig. 3a) for å se etter deregulert sirkrna-uttrykk i leukemiske celler. For syv sirkrnaer var uttrykket signifikant forskjellig I ALLE prøver sammenlignet Med B-celler. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
Videre, vi utforsket uttrykk for målet sett circrna over de viktigste bcp-alle cytogenetiske subtyper (Fig. 3a). Cytogenetiske subtyper kjennetegnes av spesifikke genetiske lesjoner, inkludert tilbakevendende translokasjoner (MLL-omarrangementer, BCR/ABL, ETV6-RUNX1 og TCF3-PBX1-fusjoner) og hyperdiploid karyotype. Cytogenetisk subtype karakterisering er instrumental for risiko prognose og behandling stratifisering av leukemi pasienter. Leukemiske celler av forskjellige subtyper har forskjellige biologiske egenskaper, genuttrykksprofiler og spesifikke miRNA-signaturer44,45. I denne sammenheng ble ny informasjon om den heterogene arten av akutte leukemier tilsatt av de observerte signifikante sirkrna-uttrykksforskjellene mellom cytogenetiske subtyper(Fig . 3a). CircAFF2 ble sterkt uttrykt I TCF3-PBX1 BCP-ALL og, i mindre grad, i ETV6-RUNX1 BCP-ALL, sammenlignet med B-celler og andre cytogenetiske bcp-ALL undergrupper. CircBCL2 (intronic) ble oppregulert I ALL MED ETV6-RUNX1-fusjoner. CircSETBP1 og circX (intergenic) ble begge svært redusert I MLL omorganiserte prøver. CircIKZF1 var lavere I BCR-ABL og hyperdiploide leukemier sammenlignet med ETV6-RUNX1 subtype, hvor uttrykket ble konservert på nivåer sammenlignbare Med B-celler.