Circolare RNA espressione differenziale in popolazioni di cellule del sangue, e l’esplorazione di circRNA deregolamentazione nella leucemia linfoblastica acuta pediatrica
- CircRNAomes di B, cellule T e monociti popolazioni
- Isoforme circolari multiple e CIRCRNA da nuovi geni
- Confronto tra tipi di cellule divulgate espressione circRNA specifica per tipo di cellula e modelli di circolarizzazione alternativi
- Espressione di CIRCRNA in sei sottotipi citogenetici di leucemia linfoblastica acuta precursore delle cellule B
CircRNAomes di B, cellule T e monociti popolazioni
CircRNA espressione in B, cellule T e monociti popolazioni di donatori sani è stato studiato utilizzando ad alta profondità ribodepleted dati di RNA-seq di 12 campioni, con 4 repliche per ogni popolazione di cellule ordinati da cellule mononucleate del sangue periferico, PBMC (GEO series ID: GSE110159; Metodi Integrativi e Tabella Integrativa 1).
CircRNA quantificazione e di annotazione sono stati forniti da CirComPara25, che combinato 9 circRNA software di rilevamento strumenti (CIRI226 Findcirc27; CIRCexplorer228 su BWA29, STAR30, Segemehl31 e TopHat232 allineatori; DCC33; circRNA_finder34; e Segemehl31) per ottenere il più affidabile backsplices. In effetti,è stato dimostrato che l’output condiviso da due o più algoritmi per il rilevamento del circRNA riduce le previsioni di falsi positivi35, 36. CirComPara esegue filtri di qualità di pre-elaborazione in lettura, come il taglio dell’adattatore, la selezione della qualità media in lettura e il filtraggio in base alla lunghezza di lettura. Inoltre, CirComPara conta le letture linearmente giuntate allineate alle giunzioni backsplice di ciascun circRNA per stimare l’espressione di trascritti lineari espressi dal gene ospite del circRNA. Questi valori sono stati combinati con i conteggi di lettura backspliced, che misurano l’espressione circolare, per calcolare la proporzione di espressione tra le isoforme circolari e lineari (Proporzione di espressione circolare a lineare, CLP; vedere Metodi). Inoltre, il CLP incorpora il concetto di correlazione tra espressione circolare e lineare, in modo che la variazione CLP tra le condizioni trasmetta il tasso di indipendenza tra un circRNA e l’espressione lineare del suo gene ospite33.
Complessivamente, 68.007 CIRCRNA da 10.148 geni individuali sono stati rilevati con almeno due metodi. Come riportato da Hansen et al.36, gli algoritmi per lo più concordavano su circRNAs altamente espressi, mentre quelli rilevati da un solo algoritmo avevano generalmente conteggi di lettura bassi (Fig. 1).
Inoltre, è stato recuperato un sottoinsieme di 6.228 CIRCRNA (da 3.323 geni) che mostra l’espressione in tutte le repliche biologiche di almeno un tipo di cellula e indicato come CIRCRNA “ad alta fiducia” (HC) (Tabella supplementare 2). Confronto dei CIRCRNA riportati in questo studio con i risultati di Nicolet et al.17 concordanza confermata per l ‘ 83% dei 489 CIRCRNA di HC recuperati nello studio precedente e divulgati 5.824 CIRCRNA di HC aggiuntivi che non erano ancora stati studiati per la variazione dell’espressione nelle popolazioni di cellule del sangue (Fig. 2 BIS).
Dei 6.228 CIRCRNA HC, 5.970 e 5.821 sono stati espressi in cellule B e T e 5.144 in monociti (Fig. 1 bis). La maggior parte delle CIRCRNA (4.763; 80%) è stata rilevata in tutti e tre i tipi di cellule, tra cui circZNF60937 onnipresente, circHIPK338 e CIRCRNA novelle. È probabile che i nuovi CIRCRNA (ad es. circPICALM) siano specifici per il compartimento ematopoietico. CircRNAs condiviso da due tipi di cellule dove per lo più comune tra i linfociti.
L’analisi della componente principale non supervisionata ha mostrato una variazione relativamente piccola dei profili di espressione del circRNA all’interno di repliche della stessa popolazione cellulare e ha indicato le differenze del circRNAome che discriminavano chiaramente i tipi di cellule (Fig. 1 ter).
L’espressione di 21 CIRCRNA HC è stata convalidata mediante RT-PCR in PBMC di diversi donatori sani (Tabella supplementare 3; Tabella 1; Fig. 1c). Questa convalida ha incluso CIRCRNA esonici da 15 geni diversi, due isoforme alternative di IKZF1 e del maschio-specifico ZFY dal cromosoma Y, un circRNA (18:63280887-63281214: -) derivato dalla circolarizzazione di 328 bp dell’unico grande introne BCL2 e un circRNA da un nuovo gene putativo (“intergenico”, vedi sotto). La struttura circolare dei CIRCRNA è stata corroborata dall’arricchimento osservato dei CIRCRNA dopo il trattamento con RNasi R e rilevata da qRT-PCR con primer divergenti specifici per la giunzione backsplice14, 27. Inoltre, tutte le giunzioni backsplice previste sono state confermate dal sequenziamento Sanger.
Isoforme circolari multiple e CIRCRNA da nuovi geni
Quasi tutte le CIRCRNA (99,4%) derivano da geni annotati, prevalentemente con giunzioni backsplice sovrapposte a esoni noti (98,9%). Dei 71 CIRCRNA con entrambe le estremità nelle regioni introniche, quelli più abbondanti includevano il circBCL2 specifico per i linfociti, che è stato convalidato, circHLA-E, circRASSF3 e diverse isoforme circMBL1.
Quasi la metà dei geni dell’ospite circRNA esprimeva più isoforme circolari (fino a 20) ciascuna (Fig. 1d). Sono stati osservati l’uso preferenziale della giunzione backsplice e l’espressione di una o poche isoforme prevalenti. Il numero più alto di isoforme è stato espresso nei monociti da AGTPBP1 (20) e PICALM (15), e nei linfociti da UBAP2 (19) e ATM (17).
Trentaquattro circRNAs derivati da regioni intergeniche. circRNAs intergenici utilizzando lo stesso backsplice termina in diverse combinazioni identificati tre loci che esprimono isoforme multiple. Cinque circRNAs “intergenici” derivati da un nuovo gene putativo nella regione Xq11.2 (chrX:65051462-65113813) (Fig supplementare. 3). Il circRNA più abbondante del locus, circX(intergenico) (X:65051462-65075912:+), precedentemente rilevato nel sangue anche da Memczak e colleghi12, è stato convalidato (Fig. 1c).
Successivamente, abbiamo studiato fino a che punto l’espressione è a favore della circolare rispetto alle trascrizioni lineari che si sovrappongono alle giunzioni backsplice. I valori CLP vanno da 0 a 1: 0 quando non viene rilevata alcuna espressione circolare, 0 < CLP < 0.5 rappresenta circRNAs espressi meno abbondantemente rispetto alle rispettive isoforme lineari, 0.5 significa che le trascrizioni circolari e lineari hanno abbondanza equivalente, 0.5 < CLP ≤ 1 indica isoforme circolari espresse più abbondantemente delle rispettive trascrizioni lineari. In particolare, CLP = 1 quando l’espressione lineare relativa al circRNA non viene rilevata. È interessante notare che per 10 circRNAs non è stata rilevata alcuna espressione lineare. Inoltre, la CLP è stata notevolmente elevata (>0,95) per 14 CIRCRNA (Tabella supplementare 4), inclusi circGUSBP2 e circNBPF10, con CLP mediana compresa tra 0,99 e 1 in tutte le popolazioni cellulari (Tabella supplementare 4), e circAFF2, che ha mostrato una CLP elevata nei monociti (0,97). La circolarizzazione preferenziale della trascrizione in cellule ematiche mature di geni specifici5,39 e / o maggiore stabilità della circolare rispetto agli RNA lineari16, 40 potrebbe spiegare questi risultati.
Confronto tra tipi di cellule divulgate espressione circRNA specifica per tipo di cellula e modelli di circolarizzazione alternativi
Successivamente, abbiamo mirato a definire le differenze dei CIRCRNAOMI di popolazione B, T e monociti. I confronti a coppie delle tre popolazioni hanno identificato complessivamente 1.369 circRNAs (DECS) significativamente differenzialmente espressi tra i tipi di cellule (Tabella supplementare 5), che derivano da 880 geni. Il clustering gerarchico dei profili di espressione DEC rifletteva gli insiemi di circRNAs sovraregolati in ciascun tipo di cella (Fig. 2 bis). DECs esclusivamente o sovraespressi in un tipo di cellula indicavano CIRCRNA specifici della popolazione (Fig. 2b) : 622 erano caratteristici delle cellule B, 183 delle cellule T e 438 dei monociti (1.243 in totale; Tabella supplementare 5). Inoltre, 72 DECS sono stati sovraregolati in entrambe le popolazioni linfocitarie (Fig. 2 ter-d). Nessun percorso di KEGG significativamente arricchito di termini di ontologia genica è risultato per i geni dei CIRCRNA caratteristici delle cellule B, che tuttavia includevano geni coinvolti nella via di segnalazione del recettore delle cellule B, come SOS2 e NFKB1, o legati alle funzioni delle cellule B. Al contrario, i geni che esprimono i CIRCRNA caratteristici delle cellule T sono stati significativamente arricchiti della via di segnalazione del recettore delle cellule T. Inoltre, i geni dei CIRCRNA monociti-caratteristici hanno arricchito significativamente diversi processi biologici e percorsi correlati alle funzioni dei monociti. Altri geni ospiti caratteristici del tipo cellulare, invece, avevano funzioni cellulari non direttamente collegate alla cellula di origine (Tabella supplementare 6).
Sebbene i set di circRNA caratteristici del tipo cellulare fossero disgiunti, la sovrapposizione di set di geni che esprimevano isoforme specifiche indicava modelli di circolarizzazione alternativi specifici del tipo cellulare. Da notare, i geni 37 esprimevano CIRCRNA caratteristici di due tipi di cellule e rappresentavano il 14,7% dei geni con CIRCRNA multipla specifica per il tipo di cellula (Fig. 2 quater). Quattro isoforme circAKT3 hanno mostrato espressione specifica del tipo cellulare, tre per le cellule B e una per le cellule T; anche quattro circMBNL1 erano specifiche del tipo cellulare, 3 per le cellule B e uno per i monociti. Inoltre, sei diverse isoforme circolari GRK3 erano specificamente sovraespresse nelle cellule B, mentre altre due erano sovraespresse solo nei monociti.
La quantificazione mediante qRT-PCR in cellule B, cellule T e monociti ordinati da 5 donatori sani indipendenti ha confermato i risultati di RNA-seq per tutti i 15 CIRCRNA testati, supportando la robustezza e la riproducibilità dei dati (Fig. 2d e supplementari Fig. 4).
È stata confermata una significativa up-regulation nelle cellule B di 5 CIRCRNA, inclusi circAFF3 (esoni 4-6), circIL4R (esoni 6-7), circSETBP1 (esone 2). Inoltre, alta espressione circRNA dalla regione genomica 9p13. 2 compreso PAX5 (Fig supplementare. 5) è stato convalidato: circPAX5 (esoni 2-5) e circZCCHC7 (esone 2) erano entrambi specifici delle cellule B, mentre una tendenza verso l’upregulation di circGRHPR nelle cellule B era in accordo con la stima dai dati RNA-seq. PAX5 esercita un ruolo notevole nell’impegno delle cellule b41 e la co-espressione dei trascritti lineari PAX5 e ZCCHC7 è stata descritta durante la progressione dai precursori comuni dei linfociti alle cellule pre-pro-b42. Suggestivo di coregolamentazione del 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 ha trovato 102 circRNAs espressi in modo differenziale tra tipi e stadi di cellule del sangue, 98 dei quali sono stati rilevati nei nostri dati. In particolare, 42 CIRCRNA sono risultati differenzialmente espressi anche nel nostro confronto, 31 dei quali erano specifici del tipo cellulare. Nel complesso, i nostri dati sono stati in accordo con i cluster circRNA precedentemente associati a popolazioni cellulari mature (Fig. 2 ter). I CIRCRNA precedentemente assegnati a cluster specifici delle cellule linfoidi hanno mostrato la massima espressione nelle cellule B o nelle cellule T, inclusi circZCCHC7 e circFBXW7 che abbiamo convalidato sperimentalmente. Nove CIRCRNA su 10 precedentemente considerati monociti specifici sono stati richiamati dalla nostra analisi essendo più espressi nei monociti, incluso circAFF2. Tuttavia, la maggior parte dei 1.243 CIRCRNA definiti come specifici del tipo cellulare nel presente studio, inclusi 11 CIRCRNA su 15 per i quali la sovraespressione specifica del tipo cellulare è stata confermata dalla qRT-PCR in questo studio (Fig. 2d), non sono stati rappresentati nei cluster definiti da Nicolet et al.
Successivamente, abbiamo controllato se l’abbondanza di isoforme circolari rispetto all’espressione lineare è stata alterata tra i tipi di cellule. Le variazioni di CLP attraverso le circostanze del campione indicano il tasso di indipendenza fra un circRNA e l’espressione lineare ospite-gene. In primo luogo, abbiamo osservato che il numero di CIRCRNA con più abbondante proporzione di espressione circolare (CLP > 0,5) era più alto nelle cellule linfoidi (185 nei monociti, 333 e 364 nelle cellule B e nelle cellule T, rispettivamente), che è in accordo con le precedenti osservazioni su un insieme più piccolo di circrna 17. Quindi, abbiamo identificato 687 CIRCRNA (da 495 geni) con espressione indipendente dal gene ospite (Tabella supplementare 7). Tra i DEC, 163 hanno avuto una variazione significativa della proporzione di espressione circolare tra i tipi di cellule in accordo con l’espressione assoluta differenziale, indicando che le variazioni osservate di questi livelli di espressione circRNA tra le popolazioni cellulari non sono dovute a una corrispondente variazione di espressione lineare. CircIKZF1, per il quale è stata convalidata la sovraregolazione nelle cellule T, è stato espresso anche con CLP elevato nelle cellule T. In particolare, 25 circRNAs hanno mostrato una proporzione di espressione circolare elevata e significativamente variata (Fig. 6), compreso il circX convalidato(intergenico) e tre ulteriori circRNAs intergenici, tutti sovraespressi in cellule B e T. CircSMARCA5 aveva la più alta espressione circolare assoluta e relativa nelle cellule B, mentre era significativamente più bassa nelle cellule T e più bassa nei monociti (Fig. 7).
Espressione di CIRCRNA in sei sottotipi citogenetici di leucemia linfoblastica acuta precursore delle cellule B
A partire dalla risorsa circRNA a livello di trascrittoma sopra descritta, l’espressione e la possibile deregolamentazione di CIRCRNA in BCP-ALL è stata esaminata per un set target di CIRCRNA. I CIRCRNA selezionati hanno mostrato specificità linfocitaria e / o derivati da loci associati alla leucemia. Seguendo questi criteri, dieci dei CIRCRNA con upregulation convalidato in cellule B, cellule T o in entrambe le popolazioni di linfociti (Fig. 2d) sono stati selezionati per la quantificazione in BCP-ALL, compresi CIRCRNA da geni noti (AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 e ZCCHC7) e il circX recentemente identificato(intergenico) altamente espresso nei linfociti. Inoltre, circZFY, un circRNA espresso ad un livello elevato nelle cellule del sangue di soggetti di sesso maschile; circHIPK3, per il quale sono note proprietà oncogeniche nei tumori solidi43; e circPVT1, recentemente collegato alla leucemia linfoblastica acuta22, sono stati inclusi.
L’espressione dei 13 CIRCRNA selezionati è stata misurata mediante qRT-PCR in 32 campioni di xenotrapianto (PDX) BCP-TUTTI derivati dal paziente (Tabella supplementare 8).
Tutti i campioni leucemici insieme sono stati confrontati per la prima volta con cellule B provenienti da donatori sani (Fig. 8 e Fig. 3a) per verificare la presenza di espressione circRNA deregolamentata nelle cellule leucemiche. Per sette CIRCRNA l’espressione era significativamente diversa in TUTTI i campioni rispetto alle cellule B. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
Inoltre, abbiamo esplorato l’espressione dell’insieme target di CIRCRNA attraverso i principali sottotipi citogenetici BCP-ALL (Fig. 3 bis). I sottotipi citogenetici sono caratterizzati da lesioni genetiche specifiche, tra cui traslocazioni ricorrenti (riarrangiamenti MLL, BCR/ABL, ETV6-RUNX1 e fusioni TCF3-PBX1) e cariotipo iperdiploide. La caratterizzazione del sottotipo citogenetico è strumentale per la prognosi del rischio e la stratificazione del trattamento dei pazienti affetti da leucemia. Le cellule leucemiche di diversi sottotipi hanno caratteristiche biologiche distinte, profili di espressione genica e segni specifici di mirna44, 45. In questo contesto, nuove informazioni sulla natura eterogenea delle leucemie acute sono state aggiunte dalle significative differenze di espressione del circRNA osservate tra i sottotipi citogenetici (Fig. 3 bis). CircAFF2 è stato altamente espresso in TCF3-PBX1 BCP-ALL e, in misura minore, in ETV6-RUNX1 BCP-ALL, rispetto alle cellule B e ad altri sottogruppi di BCP-ALL citogenetici. CircBCL2 (intronic) è stato sovraregolato in TUTTE le fusioni ETV6-RUNX1. CircSETBP1 e circX (intergenico) sono stati entrambi molto ridotti nei campioni riarrangiati MLL. CircIKZF1 era inferiore nelle leucemie BCR-ABL e iperdiploide rispetto al sottotipo ETV6-RUNX1, in cui l’espressione era conservata a livelli comparabili con le cellule B.