cirkulärt RNA-differentialuttryck i blodcellspopulationer och utforskning av circRNA-avreglering i pediatrisk akut lymfoblastisk leukemi
- Circrnaomer av B -, T-cell-och monocytpopulationer
- flera cirkulära isoformer och circRNAs från nya gener
- jämförelse mellan celltyper avslöjade celltypsspecifika circRNA-uttryck och alternativa cirkulariseringsmönster
- Expression av circRNAs i sex cytogenetiska subtyper av B-cellprekursor akut lymfoblastisk leukemi
Circrnaomer av B -, T-cell-och monocytpopulationer
CircRNA-uttryck i b -, T-cell-och monocytpopulationer av friska givare undersöktes med användning av högdjup ribodepleted RNA-seq-data om 12 prover, med 4 replikat för varje population av celler sorterade från perifera blodmononukleära celler, Pbmc (GEO series ID: GSE110159; kompletterande metoder och kompletterande Tabell 1).
CircRNA kvantifiering och annotering tillhandahölls av CirComPara25, som kombinerade 9 circRNA-detekteringsprogramverktyg (CIRI226 Findcirc27; CIRCexplorer228 på bwa29, STAR30, Segemehl31 och TopHat232 aligners; DCC33; circRNA_finder34; och Segemehl31) för att få de mest tillförlitliga backsplices. Faktum är att delad produktion från två eller flera algoritmer för circRNA-detektering har visats minska falska positiva förutsägelser35,36. CirComPara utför läs Pre-bearbetning kvalitet filter, såsom adapter trimning, läs medelvärde kvalitet val och filtrering av läslängd. Dessutom räknar CirComPara de linjärt skarvade läsningarna i linje med backsplice-korsningarna för varje circRNA för att uppskatta uttrycket av linjära transkript uttryckta från circrnas värdgen. Dessa värden kombinerades med backspliced read counts, som mäter det cirkulära uttrycket, för att beräkna andelen uttryck mellan de cirkulära och linjära isoformerna (cirkulär till linjär uttrycksproportion, CLP; se metoder). Vidare bäddar CLP in begreppet cirkulär till linjär expressionskorrelation, så att CLP-variation över förhållanden förmedlar självständighetsgraden mellan en circRNA och dess värdgenens linjära expression33.
sammantaget detekterades 68 007 circRNAs från 10 148 enskilda gener med minst två metoder. Som rapporterats av Hansen et al.36, algoritmerna kom mest överens om mycket uttryckta circRNAs, medan de som detekterades av endast en algoritm i allmänhet hade låga läsantal (kompletterande Fig. 1).
vidare hämtades en delmängd av 6 228 circRNAs (från 3 323 gener) som visar uttryck i alla biologiska replikat av minst en celltyp och kallades “high confidence” (HC) circRNAs (kompletterande Tabell 2). Jämförelse av circRNAs rapporterade i denna studie med resultaten från Nicolet et al.17 bekräftade överensstämmelse för 83% av de 489 HC circrna som hämtades i den tidigare studien och avslöjade 5 824 ytterligare HC circrna som ännu inte undersöktes för uttrycksvariation i blodcellspopulationer (kompletterande Fig. 2A).
av de 6 228 HC-cirkrarna uttrycktes 5 970 och 5 821 i B – och T-celler och 5 144 i monocyter (Fig. 1a). Majoriteten av circRNAs (4,763; 80%) detekterades i alla tre celltyper, inklusive allestädes närvarande circZNF60937, circHIPK338 och nya circRNAs. Nya circrna (t.ex. circPICALM) är sannolikt specifika för det hematopoietiska facket. CircRNAs delas av två celltyper där mestadels vanligt mellan lymfocyter.
oövervakad huvudkomponentanalys visade relativt liten variation av circRNA-uttrycksprofiler inom replikat av samma cellpopulation och pekade på circRNAome-skillnader som tydligt diskriminerade celltyperna (Fig. 1b).
uttryck av 21 HC circRNAs validerades av RT-PCR i Pbmc av olika friska givare (kompletterande tabell 3; Tabell 1; Fig. 1c). Denna validering inkluderade exoniska circRNAs från 15 olika gener, två alternativa isoformer av IKZF1 och av den manliga specifika ZFY från Y-kromosomen, en circRNA (18:63280887-63281214: -) härledd från cirkularisering av 328 bp av den unika stora bcl2 intron, och en circRNA från en förmodad ny gen (“intergenic”, se nedan). CircRNAs cirkulära struktur bekräftades av den observerade anrikningen av circRNAs efter RNAs r-behandling och detekterades med qRT-PCR med divergerande primers specifika för backsplice-korsningen14,27. Dessutom bekräftades alla förutsagda backsplice-korsningar genom Sanger-sekvensering.
flera cirkulära isoformer och circRNAs från nya gener
nästan alla circRNAs (99.4%) härledda från kommenterade gener, prevalently med backsplice korsningar överlappande kända exoner (98.9%). Av de 71 circrna med båda ändarna i introniska regioner inkluderade de vanligaste lymfocytspecifika circBCL2, som validerades, circHLA-e, circRASSF3 och flera circMBL1-isoformer.
nästan hälften av circRNA-värdgenerna uttryckte flera (upp till 20) cirkulära isoformer vardera (Fig. 1d). Preferentiell backsplice-korsningsanvändning och uttryck av en eller få vanliga isoformer observerades. Det högsta antalet isoformer uttrycktes i monocyter av AGTPBP1 (20) och PICALM (15) och i lymfocyter av UBAP2 (19) och ATM (17).
trettiofyra circRNAs härledda från intergena regioner. Intergena circRNAs använder samma backsplice slutar i olika kombinationer identifierade tre loci som uttrycker flera isoformer. Fem” intergena ” circRNAs härledda från en förmodad ny gen i xq11.2-regionen (chrX:65051462-65113813) (kompletterande Fig. 3). Den vanligaste circRNA av locus, circX (intergenic) (X:65051462-65075912:+), som tidigare detekterats i blod också av Memczak och colleagues12, validerades (Fig. 1c).
därefter undersökte vi i vilken utsträckning uttrycket är för cirkulär med avseende på linjära transkript som överlappar backsplice-korsningarna. CLP-värden varierar från 0 till 1: 0 kommer när inget cirkulärt uttryck detekteras, 0 < CLP < 0.5 representerar circRNAs uttryckta mindre rikligt än respektive linjära isoformer, 0.5 betyder att cirkulära och linjära transkript har ekvivalent överflöd, 0.5 < CLP-1 indikerar cirkulära isoformer som uttrycks mer rikligt än respektive linjära transkript. I synnerhet CLP = 1 när det linjära uttrycket i förhållande till circRNA inte detekteras. Intressant, för 10 circRNAs detekterades inget linjärt uttryck. Dessutom var CLP anmärkningsvärt hög (> 0,95) för 14 circRNAs (kompletterande Tabell 4), inklusive circGUSBP2 och circNBPF10, med median CLP från 0,99 till 1 i alla cellpopulationer (kompletterande Tabell 4) och circAFF2, som visade hög CLP i monocyter (0,97). Preferentiell transkriptcirkularisering i mogna blodceller av specifika gener5,39 och/eller högre stabilitet av cirkulär jämfört med linjär RNAs16,40 kan förklara dessa resultat.
jämförelse mellan celltyper avslöjade celltypsspecifika circRNA-uttryck och alternativa cirkulariseringsmönster
därefter syftade vi till att definiera skillnader i b -, T-cell-och monocytpopulationen circRNAomes. Parvisa jämförelser av de tre populationerna identifierade totalt 1 369 signifikant differentiellt uttryckta circRNAs (DECs) mellan celltyper (kompletterande Tabell 5), som härrör från 880 gener. Hierarkisk gruppering av DEC-uttrycksprofiler återspeglade uppsättningarna av circRNAs uppreglerade i varje celltyp (Fig. 2a). DECs uteslutande eller överuttryckt i en celltyp indikerade populationsspecifika circRNAs (Fig. 2b): 622 var karakteristiska för B-celler, 183 av T-celler och 438 av monocyter (1 243 totalt; kompletterande Tabell 5). Dessutom uppreglerades 72 Dec i båda lymfocytpopulationerna (Fig. 2b-d). Inga signifikant berikade KEGGVÄGAR av Gen ontologitermer resulterade för gener av B-cellkarakteristiska circRNAs, som ändå inkluderade gener involverade i B-cellreceptorsignaleringsvägen, såsom SOS2 och NFKB1, eller kopplade till B-cellfunktioner. Tvärtom berikades gener som uttryckte t-cellkarakteristiska circRNAs signifikant t-cellreceptorsignaleringsvägen. Dessutom berikade gener av monocytkarakteristiska circRNAs signifikant flera biologiska processer och vägar relaterade till monocytfunktioner. Andra celltypskarakteristiska värdgener hade istället cellfunktioner som inte var direkt kopplade till ursprungscellen (kompletterande Tabell 6).
även om celltypskarakteristiska circRNA-uppsättningar var åtskilda, indikerade överlappningen av genuppsättningar som uttryckte specifika isoformer alternativa celltypspecifika cirkulariseringsmönster. Observera att 37 gener uttryckte circRNAs som är karakteristiska för två celltyper och stod för 14,7% av generna med flera celltypspecifika circRNAs (Fig. 2c). Fyra circAKT3-isoformer visade celltypspecifikt uttryck, tre för B-och en för T-celler; också fyra circMBNL1 var celltypsspecifika, 3 för B-celler och en för monocyter. Dessutom överuttrycktes sex olika GRK3-cirkulära isoformer specifikt i B-celler, medan två andra endast överuttrycktes i monocyter.
kvantifiering med qRT-PCR i B-celler, T-celler och monocyter sorterade från 5 oberoende friska givare bekräftade RNA-seq-resultat för alla 15 testade circrna, stödjande data robusthet och reproducerbarhet (Fig. 2D och kompletterande Fig. 4).
signifikant uppreglering i B-celler med 5 circrna, inklusive circAFF3 (exons 4-6), circIL4R (exons 6-7), circSETBP1 (exon 2) bekräftades. Dessutom högt circRNA-uttryck från den genomiska regionen 9p13.2 inklusive PAX5 (kompletterande Fig. 5) validerades: circPAX5 (exons 2-5) och circZCCHC7 (exon 2) var båda B-cellspecifika, medan en trend mot uppreglering av circGRHPR i B-celler överensstämde med uppskattningen från RNA-seq-data. PAX5 utövar en slående roll i engagemanget för B-celler41 och co-expression av PAX5 och ZCCHC7 linjära transkript beskrevs under progressionen från vanliga lymfocytprekursorer till pre-pro-B-celler42. Som tyder på samreglering av 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 hittade 102 circRNAs differentiellt uttryckta över blodcellstyper och stadier, varav 98 upptäcktes i våra data. I synnerhet resulterade 42 circRNAs differentiellt uttryckt också i vår jämförelse, varav 31 var celltypspecifika. Sammantaget var våra data i överensstämmelse med circRNA-kluster som tidigare associerats med mogna cellpopulationer (kompletterande Fig. 2b). Circrna som tidigare tilldelats lymfoidcellspecifika kluster visade det högsta uttrycket i B-celler eller T-celler, inklusive circZCCHC7 och circFBXW7 som vi experimentellt validerade. Nio av 10 circRNAs som tidigare bedömts som monocytspecifika återkallades genom att vår analys var mer uttryckt i monocyter, inklusive circAFF2. Majoriteten av de 1 243 circrna definierades emellertid som celltypspecifika i den aktuella studien, inklusive 11 av 15 circrna för vilka celltypspecifik överuttryck bekräftades av qRT-PCR i denna studie (Fig. 2D), representerades inte i de kluster som definierades av Nicolet et al.
därefter inspekterade vi om överflödet av cirkulära isoformer med avseende på linjärt uttryck ändrades mellan celltyperna. CLP-variationer över provbetingelser indikerar graden av oberoende mellan ett circRNA och värd-gen linjärt uttryck. Först observerade vi att antalet circRNAs med mer riklig cirkulär uttrycksproportion (CLP > 0.5) var högst i lymfoida celler (185 i monocyter, 333 och 364 i B-celler respektive T-celler), vilket är i enlighet med tidigare observationer på en mindre uppsättning circRNAs17. Sedan identifierade vi 687 circRNAs (från 495 gener) med värd-genoberoende uttryck (kompletterande Tabell 7). Bland DECs hade 163 signifikant variation av cirkulär uttrycksfördelning mellan celltyper i överensstämmelse med det differentiella absoluta uttrycket, vilket indikerar att observerade variationer av dessa circRNA-uttrycksnivå över cellpopulationer inte beror på en motsvarande variation av linjärt uttryck. CircIKZF1, för vilken uppreglering i T-celler validerades, uttrycktes också med hög CLP i T-celler. I synnerhet visade 25 circRNAs hög och signifikant varierad cirkulär uttrycksproportion (kompletterande Fig. 6), inklusive validerad circX (intergenic) och tre ytterligare intergenic circRNAs, alla överuttryckta i B – och T-celler. CircSMARCA5 hade det högsta absoluta och relativa cirkulära uttrycket i B-celler, medan det var signifikant lägre i T-cell och lägst i monocyter (kompletterande Fig. 7).
Expression av circRNAs i sex cytogenetiska subtyper av B-cellprekursor akut lymfoblastisk leukemi
utgående från den ovan beskrivna transkriptomomfattande circRNA-resursen undersöktes uttrycket och möjlig avreglering av circRNAs i BCP-ALL för en Måluppsättning av circRNAs. De valda circrna visade lymfocytspecificitet och / eller härledda från leukemiassocierade loci. Efter dessa kriterier, tio av circrna med validerad uppreglering i B-celler, T-celler eller i båda lymfocytpopulationerna (Fig. 2D) valdes för kvantifiering i BCP-ALL, inklusive circRNAs från kända gener(AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 och ZCCHC7) och den nyligen identifierade circX (intergenic) starkt uttryckt i lymfocyter. Dessutom circZFY, ett circRNA uttryckt på en hög nivå i blodceller hos manliga personer; circHIPK3, för vilka onkogena egenskaper är kända i fasta cancerer43; och circPVT1, nyligen kopplad till akut lymfoblastisk leukemi22, inkluderades.
uttryck av de 13 utvalda circrna mättes med qRT-PCR i 32 BCP-ALL patient-derived xenograft (PDX) – prover (kompletterande Tabell 8).
alla leukemiska prover tillsammans jämfördes först med B-celler från friska givare (kompletterande Fig. 8 och Fig. 3a) för att kontrollera om avreglerat circRNA-uttryck i leukemiska celler. För sju circrna var uttrycket signifikant olika i alla prover jämfört med B-celler. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
vidare undersökte vi uttryck för måluppsättningen av circRNAs över de viktigaste BCP-alla cytogenetiska subtyperna (Fig. 3a). Cytogenetiska subtyper kännetecknas av specifika genetiska lesioner, inklusive återkommande translokationer (mll-omarrangemang, BCR/ABL, ETV6-RUNX1 och tcf3-PBX1-fusioner) och hyperdiploid karyotyp. Cytogenetisk subtypkarakterisering är avgörande för riskprognos och behandlingsstratifiering av leukemipatienter. Leukemiska celler av olika subtyper har distinkta biologiska egenskaper, genuttrycksprofiler och specifika miRNA-signaturer44,45. I detta sammanhang, ny information om den heterogena naturen hos akuta leukemier tillsattes av de observerade signifikanta circRNA-uttrycksskillnaderna mellan cytogenetiska subtyper (Fig. 3a). CircAFF2 uttrycktes starkt i TCF3-PBX1 BCP-ALL och i mindre utsträckning i ETV6-RUNX1 BCP-ALL jämfört med B-celler och andra cytogenetiska BCP-ALL-subgrupper. CircBCL2 (intronic) uppreglerades i alla med ETV6-RUNX1 fusioner. CircSETBP1 och circX(intergenic) var båda mycket reducerade i mll omarrangerade prover. CircIKZF1 var lägre i BCR-ABL och hyperdiploida leukemier jämfört med ETV6-RUNX1-subtypen, där uttrycket bevarades vid nivåer jämförbara med B-celler.