Zirkuläre RNA-Differentialexpression in Blutzellpopulationen und Erforschung der circRNA-Deregulation bei pädiatrischer akuter lymphoblastischer Leukämie
- CIRCRNAOME von B-, T-Zell- und Monozytenpopulationen
- Multiple zirkuläre Isoformen und circRNAs aus neuen Genen
- Vergleich zwischen Zelltypen, zelltypspezifischer circRNA-Expression und alternativen Zirkularisierungsmustern
- Expression von circRNAs in sechs zytogenetischen Subtypen der akuten lymphoblastischen B-Zell-Vorläuferleukämie
CIRCRNAOME von B-, T-Zell- und Monozytenpopulationen
Die CircRNA-Expression in B-, T-Zell- und Monozytenpopulationen gesunder Spender wurde unter Verwendung von High-Depth-Methoden ribodeplettierte RNA-seq-Daten von 12 Proben mit 4 Replikaten für jede Zellpopulation sortiert aus peripheren mononukleären Blutzellen, PBMCs (GEO series ID: GSE110159; Ergänzende Methoden und ergänzende Tabelle 1).
Die CircRNA-Quantifizierung und -annotation wurden von Circompara 25 bereitgestellt, das 9 circRNA-Detektionssoftwaretools (CIRI226 Findcirc27; CIRCexplorer228 auf BWA29-, STAR30-, Segemehl31- und TopHat232-Alignern; DCC33; circRNA_finder34; und Segemehl31) kombinierte, um die zuverlässigsten Backsplices zu erhalten. Tatsächlich wurde gezeigt, dass die gemeinsame Ausgabe von zwei oder mehr Algorithmen zur circRNA-Erkennung falsch positive Vorhersagen reduziert35,36. CirComPara führt Lesevorverarbeitungsqualitätsfilter durch, z. B. Adaptertrimmen, Auswahl der mittleren Lesequalität und Filtern nach Leselänge. Darüber hinaus zählt CirComPara die linear gespleißten Reads, die an den Backsplice-Übergängen jeder circRNA ausgerichtet sind, um die Expression linearer Transkripte abzuschätzen, die aus dem Wirtsgen der circRNA exprimiert werden. Diese Werte wurden mit den backspliced Read Counts kombiniert, die den zirkulären Ausdruck messen, um den Anteil des Ausdrucks zwischen den zirkulären und linearen Isoformen zu berechnen (Circular to Linear expression Proportion, CLP; siehe Methoden). Darüber hinaus bettet das CLP das Konzept der zirkulären zu linearen Expressionskorrelation ein, so dass die CLP-Variation unter verschiedenen Bedingungen die Unabhängigkeitsrate zwischen einer circRNA und der linearen Expression ihres Wirtsgens vermittelt33.
Insgesamt wurden 68.007 circRNAs aus 10.148 Einzelgenen mit mindestens zwei Methoden nachgewiesen. Wie von Hansen et al.36 stimmten die Algorithmen meist auf stark exprimierte circRNAs überein, wohingegen diejenigen, die von nur einem Algorithmus detektiert wurden, im Allgemeinen niedrige Lesezahlen aufwiesen (ergänzende Abb. 1).
Ferner wurde eine Untergruppe von 6.228 circRNAs (aus 3.323 Genen) gefunden, die Expression in allen biologischen Replikaten mindestens eines Zelltyps zeigten und als “High Confidence” (HC) circRNAs bezeichnet wurden (Ergänzende Tabelle 2). Vergleich der in dieser Studie berichteten circRNAs mit den Ergebnissen von Nicolet et al.17 bestätigte die Übereinstimmung für 83% der 489 HC circRNAs, die in der vorherigen Studie gefunden wurden, und offenbarte 5.824 zusätzliche HC circRNAs, die noch nicht auf Expressionsvariation in Blutzellpopulationen untersucht wurden (Ergänzende Abb. 2A).
Von den 6.228 HC-circRNAs wurden 5.970 und 5.821 in B- und T-Zellen und 5.144 in Monozyten exprimiert (Abb. 1a). Die Mehrheit der circRNAs (4.763; 80%) wurde in allen drei Zelltypen nachgewiesen, einschließlich der ubiquitären circZNF60937, circHIPK338 und neuartigen circRNAs. Neue circRNAs (z.B. circPICALM) sind wahrscheinlich spezifisch für das hämatopoetische Kompartiment. CircRNAs, die von zwei Zelltypen gemeinsam genutzt werden, sind meist zwischen Lymphozyten verbreitet.
Die unüberwachte Hauptkomponentenanalyse zeigte eine relativ geringe Variation der circRNA-Expressionsprofile innerhalb von Replikaten derselben Zellpopulation und wies auf CIRCRNAOM-Unterschiede hin, die die Zelltypen eindeutig diskriminierten (Abb. 1b).
Die Expression von 21 HC circRNAs wurde durch RT-PCR in PBMCs verschiedener gesunder Spender validiert (Ergänzende Tabelle 3; Tabelle 1; Abb. 1c). Diese Validierung umfasste exonische circRNAs aus 15 verschiedenen Genen, zwei alternative Isoformen von IKZF1 und des männlichen spezifischen ZFY aus dem Y-Chromosom, eine circRNA (18:63280887-63281214:-) abgeleitet aus der Zirkularisierung von 328 bp des einzigartigen großen BCL2-Introns und einer circRNA aus einem mutmaßlichen neuen Gen (“intergen”, siehe unten). Die zirkuläre Struktur von circRNAs wurde durch die beobachtete Anreicherung von circRNAs nach RNase R-Behandlung bestätigt und durch qRT-PCR mit divergenten Primern nachgewiesen, die für den Backsplice-Übergang spezifisch sind14,27. Darüber hinaus wurden alle vorhergesagten Backsplice-Übergänge durch Sanger-Sequenzierung bestätigt.
Multiple zirkuläre Isoformen und circRNAs aus neuen Genen
Fast alle circRNAs (99,4%) stammen aus annotierten Genen, überwiegend mit Backsplice-Übergängen, die bekannte Exons überlappen (98,9%). Von den 71 circRNAs mit beiden Enden in intronischen Regionen umfassten die am häufigsten vorkommenden das lymphozytenspezifische circBCL2, das validiert wurde, circHLA-E, circRASSF3 und mehrere circMBL1-Isoformen.
Fast die Hälfte der circRNA-Wirtsgene exprimierte jeweils mehrere (bis zu 20) zirkuläre Isoformen (Abb. 1d). Bevorzugte Backsplice-Junction-Verwendung und Expression einer oder weniger vorherrschender Isoformen wurden beobachtet. Die höchste Anzahl von Isoformen wurde in Monozyten durch AGTPBP1 (20) und PICALM (15) und in Lymphozyten durch UBAP2 (19) und ATM (17) exprimiert.
Vierunddreißig circRNAs aus intergenen Regionen. Intergene circRNAs, die dieselben Backsplice-Enden in verschiedenen Kombinationen verwenden, identifizierten drei Loci, die multiple Isoformen exprimieren. Fünf “intergene” circRNAs, abgeleitet von einem mutmaßlichen neuen Gen in der Xq11.2-Region (chrX: 65051462-65113813) (Ergänzende Abb. 3). Die am häufigsten vorkommende circRNA des Locus, circX(intergenic) (X: 65051462-65075912: +), die zuvor auch von Memczak und Kollegen im Blut nachgewiesen wurde12, wurde validiert (Abb. 1c).
Als nächstes untersuchten wir, inwieweit der Ausdruck für kreisförmige in Bezug auf lineare Transkripte ist, die die Backsplice-Übergänge überlappen. CLP-Werte reichen von 0 bis 1: 0, wenn keine zirkuläre Expression nachgewiesen wird, 0 < CLP < 0,5 steht für circRNAs, die weniger häufig exprimiert werden als die jeweiligen linearen Isoformen, 0,5 bedeutet, dass zirkuläre und lineare Transkripte eine äquivalente Häufigkeit aufweisen, 0.5 < CLP ≤ 1 zeigt zirkuläre Isoformen an, die häufiger exprimiert werden als die jeweiligen linearen Transkripte. Insbesondere ist CLP = 1, wenn die lineare Expression relativ zur circRNA nicht detektiert wird. Interessanterweise wurde für 10 circRNAs keine lineare Expression nachgewiesen. Darüber hinaus war der CLP für 14 circRNAs bemerkenswert hoch (> 0,95) (ergänzende Tabelle 4), einschließlich circGUSBP2 und circNBPF10, mit einem medianen CLP im Bereich von 0,99 bis 1 in allen Zellpopulationen (ergänzende Tabelle 4) und circAFF2, das einen hohen CLP in Monozyten zeigte (0,97). Eine bevorzugte Transkriptzirkularisierung in reifen Blutzellen spezifischer Gene5,39 und / oder eine höhere Stabilität der zirkulären im Vergleich zu linearen RNAs16,40 könnten diese Befunde erklären.
Vergleich zwischen Zelltypen, zelltypspezifischer circRNA-Expression und alternativen Zirkularisierungsmustern
Als nächstes wollten wir Unterschiede der Circrnaome der B-, T-Zell- und Monozytenpopulation definieren. Paarweise Vergleiche der drei Populationen identifizierten insgesamt 1.369 signifikant differentiell exprimierte circRNAs (DECs) zwischen Zelltypen (Ergänzende Tabelle 5), die von 880 Genen abstammten. Das hierarchische Clustering von DEC-Expressionsprofilen spiegelte die Sätze von circRNAs wider, die in jedem Zelltyp hochreguliert waren (Abb. 2a). DECs, die in einem Zelltyp ausschließlich oder überexprimiert wurden, zeigten populationsspezifische circRNAs (Fig. 2b): 622 waren charakteristisch für B-Zellen, 183 für T-Zellen und 438 für Monozyten (insgesamt 1243; Ergänzende Tabelle 5). Darüber hinaus wurden in beiden Lymphozytenpopulationen 72 DECs hochreguliert (Abb. 2b-d). Für Gene von B-Zell-charakteristischen circRNAs ergaben sich keine signifikant angereicherten KEGG-Signalwege von Genontologiebegriffen, die jedoch Gene enthielten, die am B-Zell-Rezeptor-Signalweg beteiligt waren, wie SOS2 und NFKB1, oder mit B-Zell-Funktionen verbunden waren. Im Gegenteil, Gene, die T-Zell-charakteristische circRNAs exprimieren, reicherten den T-Zell-Rezeptor-Signalweg signifikant an. Darüber hinaus haben Gene monozytencharakteristischer circRNAs mehrere biologische Prozesse und Signalwege im Zusammenhang mit Monozytenfunktionen signifikant angereichert. Andere Zelltyp-charakteristische Wirtsgene hatten dagegen Zellfunktionen, die nicht direkt mit der Ursprungszelle verbunden waren (ergänzende Tabelle 6).
Obwohl Zelltyp-charakteristische circRNA-Sätze disjunkt waren, deutete die Überlappung von Gensätzen, die spezifische Isoformen exprimierten, auf alternative Zelltyp-spezifische Zirkularisierungsmuster hin. Bemerkenswert ist, dass 37 Gene circRNAs exprimierten, die für zwei Zelltypen charakteristisch sind, und 14,7% der Gene mit multiplen zelltypspezifischen circRNAs ausmachten (Abb. 2c). Vier circAKT3-Isoformen zeigten zelltypspezifische Expression, drei für B- und eine für T-Zellen; auch vier circMBNL1 waren zelltypspezifisch, 3 für B-Zellen und eine für Monozyten. Darüber hinaus wurden sechs verschiedene zirkuläre GRK3-Isoformen spezifisch in B-Zellen überexprimiert, während zwei andere nur in Monozyten überexprimiert wurden.
Quantifizierung mittels qRT-PCR in B-Zellen, T-Zellen und Monozyten, sortiert von 5 unabhängigen gesunden Spendern, bestätigte RNA-seq-Ergebnisse für alle 15 getesteten circRNAs, was die Datenrobustheit und Reproduzierbarkeit unterstützt (Abb. 2d und ergänzende Fig. 4).
Signifikante Hochregulation in B-Zellen von 5 circRNAs, einschließlich circAFF3 (Exons 4-6), circIL4R (Exons 6-7), circSETBP1 (Exon 2) wurde bestätigt. Darüber hinaus ist eine hohe circRNA-Expression aus der Genomregion 9p13.2 einschließlich PAX5 (Ergänzende Fig. 5) wurde validiert: circPAX5 (Exons 2-5) und circZCCHC7 (Exon 2) waren beide B-Zell-spezifisch, während ein Trend zur Hochregulation von circGRHPR in B-Zellen mit der Schätzung aus den RNA-seq-Daten übereinstimmte. PAX5 spielt eine bemerkenswerte Rolle bei der Bindung von B-Zellen41, und die Koexpression von linearen Transkripten von PAX5 und ZCCHC7 wurde während des Fortschreitens von gemeinsamen Lymphozytenvorläufern zu Prä-Pro-B-Zellen42 beschrieben. Suggestive der Koregulierung der 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 fanden 102 circRNAs, die über Blutzelltypen und -stadien hinweg unterschiedlich exprimiert wurden, von denen 98 in unseren Daten nachgewiesen wurden. Insbesondere wurden auch in unserem Vergleich 42 circRNAs differentiell exprimiert, von denen 31 zelltypspezifisch waren. Insgesamt stimmten unsere Daten mit circRNA-Clustern überein, die zuvor mit reifen Zellpopulationen assoziiert waren (Ergänzende Abb. 2b). CircRNAs, die zuvor lymphoiden zellspezifischen Clustern zugeordnet wurden, zeigten die höchste Expression in B-Zellen oder T-Zellen, einschließlich circZCCHC7 und circFBXW7, die wir experimentell validiert haben. Neun von 10 circRNAs, die zuvor als monozytenspezifisch galten, wurden durch unsere Analyse daran erinnert, dass sie stärker in Monozyten exprimiert wurden, einschließlich circAFF2. Die Mehrheit der 1.243 circRNAs, die in der vorliegenden Studie als zelltypspezifisch definiert wurden, darunter 11 von 15 circRNAs, für die in dieser Studie eine zelltypspezifische Überexpression durch qRT-PCR bestätigt wurde (Abb. 2d), waren in den von Nicolet et al.
Als nächstes untersuchten wir, ob die Häufigkeit zirkulärer Isoformen in Bezug auf die lineare Expression zwischen den Zelltypen verändert war. CLP-Variationen über die Probenbedingungen hinweg zeigen die Unabhängigkeitsrate zwischen einer circRNA und der linearen Expression des Wirtsgens an. Zunächst beobachteten wir, dass die Anzahl der circRNAs mit einem reichlicheren zirkulären Expressionsanteil (CLP > 0,5) in lymphoiden Zellen am höchsten war (185 in Monozyten, 333 und 364 in B-Zellen bzw. Anschließend identifizierten wir 687 circRNAs (aus 495 Genen) mit wirtsgenunabhängiger Expression (ergänzende Tabelle 7). Unter DECs, 163 hatte eine signifikante Variation der zirkulären Expressionsanteil zwischen den Zelltypen in Übereinstimmung mit der differentiellen absoluten Expression, was darauf hinweist, dass beobachtete Variationen dieser circRNA Expressionsniveau über Zellpopulationen sind nicht auf eine entsprechende Variation der linearen Expression. CircIKZF1, für das die Hochregulation in T-Zellen validiert wurde, wurde ebenfalls mit hohem CLP in T-Zellen exprimiert. Insbesondere 25 circRNAs zeigten einen hohen und signifikant variierten zirkulären Expressionsanteil (Ergänzende Abb. 6), einschließlich der validierten circX (intergenic) und drei zusätzlichen intergenen circRNAs, die alle in B- und T-Zellen überexprimiert wurden. CircSMARCA5 hatte die höchste absolute und relative zirkuläre Expression in B-Zellen, während sie in T-Zellen signifikant niedriger und in Monozyten am niedrigsten war (Ergänzende Abb. 7).
Expression von circRNAs in sechs zytogenetischen Subtypen der akuten lymphoblastischen B-Zell-Vorläuferleukämie
Ausgehend von der oben beschriebenen transkriptomweiten circRNA-Ressource wurde die Expression und mögliche Deregulation von circRNAs in BCP-ALL auf einen Zielsatz von circRNAs untersucht. Die ausgewählten circRNAs zeigten Lymphozytenspezifität und/ oder stammten von Leukämie-assoziierten Loci ab. Nach diesen Kriterien wurden zehn der circRNAs mit validierter Hochregulation in B-Zellen, T-Zellen oder in beiden Lymphozytenpopulationen (Abb. 2d) wurden für die Quantifizierung in BCP-ALL ausgewählt, einschließlich circRNAs aus bekannten Genen (AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 und ZCCHC7) und dem neu identifizierten circX(intergenic) hoch exprimiert in Lymphozyten. Darüber hinaus circZFY, eine circRNA, die in Blutzellen männlicher Probanden auf hohem Niveau exprimiert wird; circHIPK3, für das onkogene Eigenschaften bei soliden Krebserkrankungen bekannt sind43; und circPVT1, das kürzlich mit akuter lymphoblastischer Leukämie22 in Verbindung gebracht wurde, wurden eingeschlossen.
Die Expression der 13 ausgewählten circRNAs wurde mittels qRT-PCR in 32 BCP-ALL Patienten-abgeleiteten Xenograft (PDX) Proben gemessen (ergänzende Tabelle 8).
Alle leukämischen Proben zusammen wurden zunächst mit B-Zellen gesunder Spender verglichen (Ergänzende Abb. 8 und Fig. 3a) auf deregulierte circRNA-Expression in Leukämiezellen zu überprüfen. Bei sieben circRNAs war die Expression in ALLEN Proben signifikant anders als bei B-Zellen. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
Darüber hinaus untersuchten wir die Expression des Zielsatzes von circRNAs über die wichtigsten zytogenetischen Subtypen von BCP-ALL (Abb. 3a). Zytogenetische Subtypen sind durch spezifische genetische Läsionen gekennzeichnet, einschließlich rezidivierender Translokationen (MLL-Umlagerungen, BCR / ABL-, ETV6-RUNX1- und TCF3-PBX1-Fusionen) und hyperdiploider Karyotyp. Die zytogenetische Subtypcharakterisierung ist entscheidend für die Risikoprognose und Behandlungsstratifizierung von Leukämiepatienten. Leukämiezellen verschiedener Subtypen weisen unterschiedliche biologische Merkmale, Genexpressionsprofile und spezifische miRNA-Signaturen auf44,45. In diesem Zusammenhang wurden neue Informationen über die Heterogenität akuter Leukämien durch die beobachteten signifikanten circRNA-Expressionsunterschiede zwischen zytogenetischen Subtypen hinzugefügt (Abb. 3a). CircAFF2 wurde in TCF3-PBX1 BCP-ALL und in geringerem Maße in ETV6-PBX1 BCP-ALL im Vergleich zu B-Zellen und anderen zytogenetischen BCP-ALL-Untergruppen stark exprimiert. CircBCL2 (intronic) wurde bei ALLEN mit ETV6-RUNX1-Fusionen hochreguliert. CircSETBP1 und circX (intergenisch) waren beide in MLL-rearrangierten Proben sehr reduziert. CircIKZF1 war bei BCR-ABL und hyperdiploiden Leukämien niedriger als beim Subtyp ETV6-RUNX1, bei dem die Expression auf einem mit B-Zellen vergleichbaren Niveau konserviert war.