expresia diferențială a ARN-ului Circular în populațiile de celule sanguine și explorarea dereglementării ARN-ului circular în leucemia limfoblastică acută pediatrică
- Circrnaomii populațiilor de celule B, T și monocite
- mai multe izoforme circulare și circRNAs din gene noi
- comparația dintre tipurile de celule a dezvăluit expresia circRNA specifică tipului de celule și modelele alternative de circularizare
- expresia circrna în șase subtipuri citogenetice ale leucemiei limfoblastice acute precursoare a celulelor B
Circrnaomii populațiilor de celule B, T și monocite
expresia ARN-ului circular în populațiile de celule date seq de 12 probe, cu 4 duplicate pentru fiecare populație de celule sortate din celulele mononucleare din sângele periferic, Pbmc (seria GEO id: GSE110159; metode suplimentare și tabelul suplimentar 1).
cuantificarea și adnotarea CircRNA au fost furnizate de CirComPara25, care a combinat 9 instrumente software de detectare a circRNA (CIRI226 findcrc27; CIRCexplorer228 pe aliniatoarele BWA29, STAR30, Segemehl31 și TopHat232; DCC33; circRNA_finder34; și Segemehl31) pentru a obține cele mai fiabile backsplices. Într-adevăr,ieșirea partajată de la doi sau mai mulți algoritmi pentru detectarea arnc a fost demonstrată pentru a reduce predicțiile fals pozitive35, 36. CirComPara efectuează filtre de calitate de pre-procesare a citirii, cum ar fi tunderea adaptorului, selectarea medie a calității citirii și filtrarea după lungimea citirii. Mai mult, CirComPara numără citirile îmbinate liniar aliniate la joncțiunile din spate ale fiecărui circRNA pentru a estima expresia transcrierilor liniare exprimate din gena gazdă a circRNA. Aceste valori au fost combinate cu numărul de citire din spate, care măsoară expresia circulară, pentru a calcula proporția de Expresie dintre izoformele circulare și liniare (proporția de Expresie circulară la liniară, CLP; vezi metode). Mai mult, CLP încorporează conceptul de corelație de Expresie circulară la liniară, astfel încât variația CLP între condiții transmite rata de Independență între un circRNA și expresia liniară a genei sale gazdă33.
în general, 68.007 circrna din 10.148 de gene individuale au fost detectate prin cel puțin două metode. După cum a raportat Hansen și colab.36, algoritmii au convenit în cea mai mare parte asupra circrn-urilor foarte exprimate, în timp ce cei detectați de un singur algoritm au avut în general un număr redus de citire (Fig suplimentar. 1).
mai mult, un sub-set de 6.228 circRNAs (din 3.323 gene) care prezintă expresie în toate replicatele biologice de cel puțin un tip de celulă a fost recuperat și denumit circRNAs “high confidence” (HC) (tabelul suplimentar 2). Comparația circrna raportate în acest studiu cu rezultatele lui Nicolet și colab.17 concordanța confirmată pentru 83% din cele 489 circrn HC recuperate în studiul anterior și au dezvăluit 5.824 circrn HC suplimentare care nu au fost încă investigate pentru variația expresiei în populațiile de celule sanguine (Fig suplimentar. 2A).
din cele 6.228 circrn HC, 5.970 și 5.821 au fost exprimate în celule B și T și 5.144 în monocite (Fig. 1a). Majoritatea circRNAs (4.763; 80%) au fost detectate în toate cele trei tipuri de celule, inclusiv circznf60937 omniprezente, circHIPK338 și circRNAs noi. Este probabil ca noile arnc (de exemplu circPICALM) să fie specifice pentru compartimentul hematopoietic. CircRNAs împărtășite de două tipuri de celule în cazul în care cea mai mare parte comune între limfocite.
analiza nesupravegheată a componentelor principale a arătat o variație relativ mică a profilurilor de expresie a arnc în replicile aceleiași populații de celule și a indicat diferențe circnaome care au discriminat în mod clar tipurile de celule (Fig. 1b).
exprimarea a 21 de arnc HC a fost validată prin RT-PCR în CMSP la diferiți donatori sănătoși (tabelul suplimentar 3; Tabelul 1; Fig. 1c). Această validare a inclus circrn-uri exonice din 15 gene diferite, două izoforme alternative ale IKZF1 și ale ZFY specific masculin din cromozomul Y, un circRNA (18:63280887-63281214: -) derivat din circularizarea a 328 bp a intronului unic Bcl2 mare și un circRNA dintr-o genă nouă presupusă (“intergenică”, vezi mai jos). Structura circulară a arnc a fost coroborată de îmbogățirea observată a arnc după tratamentul cu RNase R și detectată prin qRT-PCR cu primeri Divergenți specifici joncțiunii backsplice 14, 27. Mai mult, toate joncțiunile prezise de backsplice au fost confirmate prin secvențierea Sanger.
mai multe izoforme circulare și circRNAs din gene noi
aproape toate circRNAs (99,4%) derivate din gene adnotate, predominant cu joncțiuni backsplice care se suprapun exonilor cunoscuți (98,9%). Dintre cele 71 de circrna cu ambele capete în regiunile intronice, cele mai abundente au inclus circBCL2 specific limfocitelor, care a fost validat, circchla-E, circRASSF3 și mai multe izoforme circMBL1.
aproape jumătate din genele gazdei circRNA au exprimat izoforme circulare multiple (până la 20) fiecare (Fig. 1d). S-au observat utilizarea preferențială a joncțiunii backsplice și exprimarea uneia sau a câtorva izoforme predominante. Cel mai mare număr de izoforme a fost exprimat în monocite de AGTPBP1 (20) și PICALM (15), iar în limfocite de UBAP2 (19) și ATM (17).
treizeci și patru de arnc derivate din regiuni intergenice. Circrna intergenice folosind aceleași capete backsplice în diferite combinații au identificat trei loci care exprimă izoforme multiple. Cinci circrna” intergenice ” derivate dintr-o genă nouă presupusă în regiunea Xq11.2 (chrX:65051462-65113813) (suplimentar Fig. 3). Cel mai abundent circRNA al locusului, circX(intergenic) (X:65051462-65075912:+), detectat anterior în sânge și de Memczak și colegi12, a fost validat (Fig. 1c).
în continuare, am investigat în ce măsură expresia este în favoarea circulară în ceea ce privește transcrierile liniare care se suprapun joncțiunilor din spate. Valorile CLP variază de la 0 la 1: 0 vine atunci când nu este detectată nicio Expresie circulară, 0 < CLP < 0,5 reprezintă circRNAs exprimate mai puțin abundent decât izoformele liniare respective, 0,5 înseamnă că transcrierile circulare și liniare au abundență echivalentă, 0.5 < CLP 1 indică izoformele circulare exprimate mai abundent decât transcrierile liniare respective. În special, CLP = 1 atunci când expresia liniară relativă la circRNA nu este detectată. Interesant este că pentru 10 circrna nu a fost detectată nicio Expresie liniară. În plus, CLP a fost remarcabil de mare (>0,95) pentru 14 circrna (tabelul suplimentar 4), incluzând circGUSBP2 și circNBPF10, CLP mediană variind de la 0,99 la 1 în toate populațiile de celule (tabelul suplimentar 4) și circAFF2, care a prezentat CLP ridicat în monocite (0,97). Circularizarea preferențială a transcrierii în celulele sanguine mature ale genurilor specifice5, 39 și / sau stabilitatea circulară mai mare comparativ cu ARN-urile liniare16,40 ar putea explica aceste constatări.
comparația dintre tipurile de celule a dezvăluit expresia circRNA specifică tipului de celule și modelele alternative de circularizare
în continuare, ne-am propus să definim diferențele dintre circrnaomii populației de celule B, T și monocite. Comparațiile în perechi ale celor trei populații au identificat în total 1.369 de circrn-uri exprimate semnificativ diferențiat (Dec) între tipurile de celule (tabelul suplimentar 5), care au derivat din 880 de gene. Gruparea ierarhică a profilurilor de Expresie DEC a reflectat seturile de circrn-uri reglate în sus în fiecare tip de celulă (Fig. 2a). DECs exclusiv sau supraexprimate într-un singur tip de celulă au indicat circrn-uri specifice populației (Fig. 2b): 622 au fost caracteristice celulelor B, 183 de celule T și 438 de monocite (1.243 în total; tabelul suplimentar 5). Mai mult, 72 Dec au fost reglate în sus la ambele populații de limfocite (Fig. 2b-d). Nu au rezultat căi KEGG semnificativ îmbogățite ale termenilor de Ontologie genică pentru genele circrn-urilor caracteristice celulelor B, care totuși includeau gene implicate în calea de semnalizare a receptorului celulelor B, cum ar fi SOS2 și NFKB1, sau legate de funcțiile celulelor B. Dimpotrivă, genele care exprimă circrn-urile caracteristice celulelor T au fost îmbogățite semnificativ calea de semnalizare a receptorului celulelor T. Mai mult, genele circrn caracteristice monocitelor au îmbogățit semnificativ mai multe procese biologice și căi legate de funcțiile monocitelor. În schimb, alte gene gazdă caracteristice tipului de celule aveau funcții celulare care nu erau direct legate de celula de origine (tabelul suplimentar 6).
deși seturile circRNA caracteristice tipului de celule au fost disjuncte, suprapunerea seturilor de gene care au exprimat izoforme specifice a indicat modele alternative de circularizare specifice tipului de celule. De remarcat, 37 de gene au exprimat circrn-uri caracteristice a două tipuri de celule și au reprezentat 14,7% din genele cu circrn-uri multiple specifice tipului de celule (Fig. 2c). Patru izoforme circAKT3 au prezentat expresie specifică tipului de celule, trei pentru B – și una pentru celulele T; de asemenea, patru circMBNL1 au fost specifice tipului de celule, 3 pentru celulele B și una pentru monocite. Mai mult, șase izoforme circulare GRK3 diferite au fost supraexprimate în mod specific în celulele B, în timp ce alte două au fost supraexprimate numai în monocite.
cuantificarea prin qRT-PCR în celule B, celule T și monocite sortate de la 5 donatori sănătoși independenți a confirmat rezultatele ARN-seq pentru toate cele 15 circrna testate, susținând robustețea și reproductibilitatea datelor (Fig. 2D și suplimentare Fig. 4).
s-a confirmat reglarea semnificativă a creșterii în celulele B A 5 circRNAs, incluzând circAFF3 (exonii 4-6), circIL4R (exonii 6-7), circSETBP1 (exonul 2). Mai mult, expresia circRNA ridicată din regiunea genomică 9p13.2 inclusiv PAX5 (suplimentar Fig. 5) a fost validat: circPAX5 (exonii 2-5) și circZCCHC7 (exonul 2) au fost ambele celule B specifice, în timp ce o tendință spre reglarea ascendentă a circGRHPR în celulele B a fost în acord cu estimarea din datele ARN-seq. PAX5 exercită un rol izbitor în angajamentul celulelor B41 și coexprimarea transcrierilor liniare PAX5 și ZCCHC7 a fost descrisă în timpul progresiei de la precursorii obișnuiți ai limfocitelor la celulele pre-pro-B42. Sugestiv pentru coreglementarea 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 au găsit 102 circrna exprimate diferențiat în funcție de tipurile și etapele celulelor sanguine, dintre care 98 au fost detectate în datele noastre. În special, 42 de circrna-uri au rezultat diferit exprimate și în comparația noastră, dintre care 31 au fost specifice tipului de celule. În general, datele noastre au fost în acord cu clusterele de arnc asociate anterior populațiilor de celule mature (Fig suplimentar. 2b). CircRNAs atribuite anterior clusterelor specifice celulelor limfoide au arătat cea mai mare expresie în celulele B sau celulele T, inclusiv circZCCHC7 și circFBXW7 pe care le-am validat experimental. Nouă din 10 circrna considerate anterior ca fiind specifice monocitelor au fost amintite prin analiza noastră fiind mai exprimate în monocite, inclusiv circAFF2. Cu toate acestea, majoritatea celor 1243 de arnc definite ca fiind specifice tipului de celule în studiul de față, incluzând 11 din 15 arnc pentru care supraexprimarea specifică tipului de celule a fost confirmată prin qRT-PCR în acest studiu (Fig. 2d), nu au fost reprezentate în clusterele definite de Nicolet și colab.
apoi, am inspectat dacă abundența izoformelor circulare în ceea ce privește expresia liniară a fost modificată între tipurile de celule. Variațiile CLP în condițiile eșantionului indică rata de Independență între un circRNA și expresia liniară a genei gazdă. În primul rând, am observat că numărul de circRNAs cu proporție de Expresie circulară mai abundentă (CLP > 0,5) a fost cel mai mare în celulele limfoide (185 în monocite, 333 și 364 în celulele B și respectiv celulele T), ceea ce este în conformitate cu observațiile anterioare pe un set mai mic de circRNAs17. Apoi, am identificat 687 circRNAs (din 495 gene) cu expresie independentă de gena gazdă (tabelul suplimentar 7). Dintre Dec, 163 a avut variații semnificative ale proporției de Expresie circulară între tipurile de celule în acord cu expresia absolută diferențială, indicând faptul că variațiile observate ale acestor niveluri de Expresie circRNA la populațiile de celule nu se datorează unei variații corespunzătoare a expresiei liniare. CircIKZF1, pentru care a fost validată reglarea în celulele T, a fost exprimată și cu CLP ridicat în celulele T. În special, 25 de circrna au prezentat o proporție de Expresie Circulară ridicată și semnificativ variată(Fig suplimentar. 6), inclusiv circX – ul validat(intergenic) și trei circrn-uri intergenice suplimentare, toate supraexprimate în celulele B și T. CircSMARCA5 a avut cea mai mare expresie circulară absolută și relativă în celulele B, în timp ce a fost semnificativ mai mică în celula T și cea mai mică în monocite (Fig suplimentar. 7).
expresia circrna în șase subtipuri citogenetice ale leucemiei limfoblastice acute precursoare a celulelor B
pornind de la resursa circRNA la nivel transcriptomic descrisă mai sus, expresia și posibila dereglare a circrna în BCP-ALL au fost examinate pentru un set țintă de circrna. Circrn-urile selectate au prezentat specificitate limfocitară și/sau derivate din loci asociați leucemiei. În urma acestor criterii, zece dintre circrna-urile cu reglare ascendentă validată în celulele B, celulele T sau în ambele populații de limfocite (Fig. 2D) au fost selectate pentru cuantificare în BCP-ALL, inclusiv circRNAs din gene cunoscute (AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 și ZCCHC7) și circX nou identificat(intergenic) foarte exprimat în limfocite. În plus, circZFY, un circRNA exprimat la un nivel ridicat în celulele sanguine ale subiecților de sex masculin; circHIPK3, pentru care proprietățile oncogene sunt cunoscute în cancerele solide43; și circPVT1, recent legat de leucemia limfoblastică acută22, au fost incluse.
expresia celor 13 circrna selectate a fost măsurată prin qRT-PCR în 32 BCP-toate probele de xenogrefă (PDX) derivate din pacienți (tabelul suplimentar 8).
toate probele leucemice împreună au fost mai întâi comparate cu celulele B de la donatori sănătoși (Fig suplimentar. 8 și Fig. 3a) pentru a verifica expresia circRNA dereglată în celulele leucemice. Pentru șapte circrna expresia a fost semnificativ diferită în toate probele comparativ cu celulele B. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
mai mult, am explorat expresia setului țintă de circrna pe principalele BCP-toate subtipurile citogenetice (Fig. 3a). Subtipurile citogenetice se caracterizează prin leziuni genetice specifice, incluzând translocații recurente (rearanjări MLL, BCR/ABL, etv6-RUNX1 și fuziuni TCF3-PBX1) și cariotip hiperdiploid. Caracterizarea subtipului citogenetic este esențială pentru prognosticul riscului și stratificarea tratamentului pacienților cu leucemie. Celulele leucemice de diferite subtipuri au caracteristici biologice distincte,profiluri de expresie genetică și semnale specifice miarn44, 45. În acest context, informații noi despre natura eterogenă a leucemiilor acute au fost adăugate de diferențele semnificative de Expresie circRNA observate între subtipurile citogenetice (Fig. 3a). CircAFF2 a fost foarte exprimat în TCF3-PBX1 BCP-ALL și, într-o măsură mai mică, în ETV6-RUNX1 BCP-ALL, comparativ cu celulele B și alte subgrupuri citogenetice BCP-ALL. CircBCL2 (intronic) a fost reglat în sus în toate cu fuziuni ETV6-RUNX1. CircSETBP1 și circX (intergenice) au fost ambele foarte reduse în probele rearanjate MLL. CircIKZF1 a fost mai mic în leucemiile BCR-ABL și hiperdiploide comparativ cu subtipul ETV6-RUNX1, în care expresia a fost conservată la niveluri comparabile cu celulele B.