Ronde RNA differentiële expressie in het bloed cel populaties en verkenning van de circRNA deregulering in pediatric acute lymfatische leukemie
- CircRNAomes van B-, T-cellen en monocyten populaties
- meerdere circulaire isovormen en circRNAs uit nieuwe genen
- vergelijking tussen celtypen onthulde celtype-specifieke circRNA-expressie en alternatieve circularisatiepatronen
- expressie van circRNAs in zes cytogenetische subtypes van B-cel precursor acute lymfoblastische leukemie
CircRNAomes van B-, T-cellen en monocyten populaties
CircRNA uitdrukking in de B-, T-cellen en monocyten populaties van gezonde donoren werd onderzocht met behulp van hoge-diepte ribodepleted RNA-seq data van 12 monsters, met 4 herhaald voor elke populatie van cellen gesorteerd van mononucleaire cellen uit perifeer bloed, PBMC ‘ s (GEO-serie ID: GSE110159; aanvullende methoden en aanvullende tabel 1).
CircRNA-kwantificering en annotatie werden verstrekt door CirComPara25, dat 9 circRNA-detectiesoftware-tools combineerde (CIRI226 Findcirc27; CIRCexplorer228 op bwa29, STAR30, Segemehl31 en TopHat232-uitlijners; DCC33; circRNA_finder34; en Segemehl31) om de meest betrouwbare backsplices te verkrijgen. Gedeelde output van twee of meer algoritmen voor circRNA-detectie is inderdaad aangetoond dat het vals-positieve voorspellingen35,36 vermindert. CirComPara voert lees voorbewerking kwaliteit filters, zoals adapter trimmen, lezen gemiddelde kwaliteit selectie en filteren op leeslengte. Bovendien telt CirComPara lineair gesplitste leest uitgelijnd op de backsplice-verbindingen van elke circRNA om de uitdrukking van lineaire afschriften te schatten die van de gastheer-gen van circRNA worden uitgedrukt. Deze waarden werden gecombineerd met de backspliced read counts, die de cirkeluitdrukking meten, om de verhouding van de expressie tussen de cirkelvormige en lineaire isovormen te berekenen (cirkelvormige naar Lineaire expressieverhouding, CLP; zie methoden). Verder, sluit het CLP het concept van circulaire aan lineaire uitdrukkingscorrelatie in, zodat de variatie van CLP tussen voorwaarden het tarief van onafhankelijkheid tussen circRNA en de lineaire expressie33 van zijn gastheer-gen overbrengt.
in totaal werden 68.007 circRNAs van 10.148 individuele genen gedetecteerd met ten minste twee methoden. Zoals gerapporteerd door Hansen et al.36, de algoritmen meestal overeengekomen op sterk uitgedrukte circRNAs, terwijl die ontdekt door slechts één algoritme had over het algemeen lage gelezen tellingen (aanvullende Fig. 1).
verder werd een subreeks van 6.228 circRNAs (uit 3.323 genen) gevonden die expressie vertoonde in alle biologische replicaten van ten minste één celtype en aangeduid als “high confidence” (HC) circRNAs (aanvullende tabel 2). Vergelijking van circRNAs gerapporteerd in deze studie met de resultaten van Nicolet et al.17 bevestigde Concordantie voor 83% van de 489 HC circRNAs die in de vorige studie werden gevonden en onthulde 5.824 extra HC circRNAs die nog niet waren onderzocht voor expressievariatie in bloedcelpopulaties (aanvullende Fig. 2 bis).
van de 6.228 HC circRNAs, 5970 en 5.821 werden uitgedrukt in B – en T-cellen, en 5.144 in monocyten (Fig. 1 bis). De meerderheid van circRNAs (4,763; 80%) werd ontdekt in alle drie celtypes, met inbegrip van alomtegenwoordige circrnf60937, circHIPK338 en nieuwe circRNAs. Nieuwe circRNAs (bv. circPICALM) zijn waarschijnlijk specifiek voor het hematopoëtische compartiment. CircRNAs gedeeld door twee celtypes waar meestal gemeenschappelijk tussen lymfocyten.
de unsupervised belangrijkste componentanalyse toonde vrij kleine variatie van circRNA-uitdrukkingsprofielen binnen replicaten van de zelfde celpopulatie, en wees op circRNAome verschillen die duidelijk de celtypes onderscheidden (Fig. 1 ter).
expressie van 21 HC circRNAs werd gevalideerd door RT-PCR in PBMC ‘ s van verschillende gezonde donoren (aanvullende tabel 3; Tabel 1; Fig. 1c). Deze bevestiging omvatte exonic circRNAs van 15 verschillende genen, twee alternatieve isovormen van IKZF1 en van Mannelijk-specifiek ZFY van het chromosoom van Y, één circRNA (18:63280887-63281214: -) afgeleid van circularisatie van 328 bp van het unieke grote bcl2 intron, en één circRNA van een vermoedelijk nieuw gen (“intergenic”, zie hieronder). De circulaire structuur van circRNAs werd bevestigd door de waargenomen verrijking van circRNAs na RNase R-behandeling, en gedetecteerd door qRT-PCR met divergente inleidingen specifiek voor de backsplice junction14,27. Bovendien werden alle voorspelde backsplice-verbindingen bevestigd door het rangschikken van Sanger.
meerdere circulaire isovormen en circRNAs uit nieuwe genen
bijna alle circRNAs (99,4%) zijn afgeleid van geannoteerde genen, voornamelijk met backsplice junctions overlappende bekende exonen (98,9%). Van de 71 circRNAs met beide uiteinden in intronische gebieden, omvatten de meest voorkomende de lymfocyt-specifieke circBCL2, die werd gevalideerd, circHLA – E, cirrassf3, en verschillende circMBL1 isovormen.
bijna de helft van de circRNA-gastheergenen vertoonde elk meerdere (tot 20) cirkelvormige isovormen (Fig. 1d). Voorkeur backsplice junction gebruik en expressie van een of enkele voorkomende isovormen werden waargenomen. De hoogste aantallen isovormen werden uitgedrukt in monocyten door AGTPBP1 (20) en PICALM (15), en in lymfocyten door UBAP2 (19) en ATM (17).
34 circrna ‘s afkomstig uit intergene regio’ s. Intergenic circRNAs gebruikend de zelfde backsplice einden in verschillende combinaties identificeerden drie loci die veelvoudige isovormen uitdrukken. Vijf” intergenic ” circRNAs afgeleid van een vermoedelijk nieuw gen in het xq11.2 Gebied (chrX: 65051462-65113813) (aanvullende Fig. 3). De meest voorkomende circRNA van de locus, circX(intergenic) (x: 65051462-65075912:+), die eerder ook door Memczak en collega ‘ s in bloed werd aangetroffen, werd gevalideerd (Fig. 1c).
vervolgens hebben we onderzocht in welke mate de uitdrukking in het voordeel is van circulaire met betrekking tot lineaire transcripten die de backsplice junctions overlappen. CLP-waarden variëren van 0 tot 1: 0 komt wanneer geen cirkelvormige expressie wordt gedetecteerd, 0 < CLP < 0,5 vertegenwoordigt circRNAs uitgedrukt minder overvloedig dan de respectieve lineaire isovormen, 0,5 betekent dat cirkelvormige en lineaire transcripten hebben equivalente abundantie, 0.5 < CLP ≤ 1 geeft cirkelvormige isovormen aan die overvloediger worden uitgedrukt dan de respectieve lineaire transcripten. In het bijzonder, CLP = 1 wanneer de lineaire uitdrukking ten opzichte van circRNA niet wordt ontdekt. Interessant, voor 10 circRNAs werd geen lineaire uitdrukking ontdekt. Bovendien was de CLP opmerkelijk hoog (>0,95) voor 14 circRNAs (aanvullende tabel 4), inclusief circGUSBP2 en circNBPF10, met mediane CLP variërend van 0,99 tot 1 in alle celpopulaties (aanvullende tabel 4), en circAFF2, die hoge CLP in monocyten vertoonde (0,97). Preferentiële transcript circularisatie in volwassen bloedcellen van specifieke genes5,39 en / of een hogere stabiliteit van cirkelvormige in vergelijking met lineaire RNAs16,40 zou deze bevindingen te verklaren.
vergelijking tussen celtypen onthulde celtype-specifieke circRNA-expressie en alternatieve circularisatiepatronen
vervolgens werd getracht verschillen te definiëren tussen de B -, T-cel-en monocyt-populatie circrnaomen. Paarsgewijze vergelijkingen van de drie populaties geà dentificeerd totaal 1,369 beduidend differentieel uitgedrukt circRNAs (DECs) tussen celtypes (aanvullende tabel 5), die afgeleid uit 880 genen. Hiërarchische clustering van DECEXPRESSIEPROFIELEN weerspiegelde de reeksen circRNAs upregulated in elk celtype (Fig. 2 bis). DECs uitsluitend of over-uitgedrukt in één celtype aangegeven populatie-specifieke circRNAs (Fig. 2b): 622 waren karakteristiek voor B-cellen, 183 van T-cellen en 438 van monocyten (1.243 in totaal; aanvullende tabel 5). Bovendien werden 72 DECs verhoogd in beide lymfocytenpopulaties (Fig. 2b-d). Geen beduidend verrijkte Kegg-wegen van termen van genontologie resulteerden voor genen van B-cel-kenmerkende circRNAs, die niettemin genen betrokken bij de signaalweg van de B-celreceptor, zoals SOS2 en NFKB1, of verbonden aan B-celfuncties omvatten. Integendeel, werden de genen die t-celkarakteristiek circRNAs uitdrukken beduidend verrijkt de T-celreceptor signalerende weg. Bovendien verrijkten de genen van monocyt-kenmerkende circRNAs beduidend verscheidene biologische processen en wegen met betrekking tot monocyt functies. Andere celtype-karakteristieke gastheer-genen, in plaats daarvan, had celfuncties niet direct gekoppeld aan de cel van oorsprong (aanvullende tabel 6).
hoewel celtype-kenmerkende circRNA reeksen disjunct waren, Wees de overlapping van genreeksen die specifieke isovormen uitdrukten op alternatieve celtype-specifieke circularisatiepatronen. Van nota, drukken 37 genen circRNAs kenmerkend van twee celtypes uit en verantwoordelijk voor 14,7% van de genen met veelvoudige celtype-specifieke circRNAs (Fig. 2c). Vier circAKT3-isovormen vertoonden celtype-specifieke expressie, drie voor B – en één voor T-cellen; ook vier circMBNL1 waren celtype-specifiek, 3 voor B-cellen en één voor monocyten. Bovendien werden zes verschillende grk3 cirkelvormige isovormen specifiek overexpressed in B-cellen, terwijl twee anderen overexpressed slechts in monocytes waren.
kwantificering door qRT-PCR in B-cellen, T-cellen en monocyten gesorteerd van 5 onafhankelijke gezonde donoren bevestigde RNA-seq-resultaten voor alle 15 geteste circrna’ s, wat de robuustheid en reproduceerbaarheid van de gegevens ondersteunt (Fig. 2d en aanvullende Fig. 4).
significante up-regulatie in B-cellen van 5 circrna ‘ s, waaronder circAFF3 (exons 4-6), circIL4R (exons 6-7), circSETBP1 (exon 2) werd bevestigd. Bovendien, hoge circRNA expressie uit het genomische gebied 9p13.2 met inbegrip van PAX5 (aanvullende Fig. 5) werd gevalideerd: circPAX5 (exons 2-5) en circZCCHC7 (exon 2) waren beide b-celspecifiek, terwijl een trend naar upregulatie van circGRHPR in B-cellen in overeenstemming was met de schatting van de RNA-seq-gegevens. PAX5 oefent een opvallende rol uit in de betrokkenheid van B-cellen41 en co-expressie van pax5 en zcchc7 lineaire transcripten werd beschreven tijdens de progressie van gemeenschappelijke lymfocytenvoorlopercellen tot pre-pro-b cellen42. Suggestief van coregulering van het 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 vonden 102 circRNAs differentieel uitgedrukt over bloedceltypes en stadia, waarvan 98 in onze gegevens werden ontdekt. In het bijzonder, 42 circRNAs resulteerden differentieel uitgedrukt ook in onze vergelijking, 31 van die celtype-specifiek waren. Globaal, waren onze gegevens in overeenstemming met circRNA clusters eerder geassocieerd met rijpe celpopulaties (aanvullende Fig. 2b). CircRNAs eerder toegewezen aan lymfoïde cel – specifieke clusters toonde de hoogste uitdrukking in B-cellen of T-cellen, met inbegrip van circZCCHC7 en circFBXW7 die wij experimenteel gevalideerd. Negen van de 10 circRNAs eerder beschouwd als monocyt-specifiek werden teruggeroepen door onze Analyse die meer uitgedrukt in monocyten, met inbegrip van circAFF2. Echter, de meerderheid van de 1.243 circRNAs gedefinieerd als celtype-specifiek in de huidige studie, met inbegrip van 11 van de 15 circRNAs waarvoor celtype-specifieke overexpressie werd bevestigd door qRT-PCR in deze studie (Fig. 2d), waren niet vertegenwoordigd in de clusters gedefinieerd door Nicolet et al.
vervolgens werd onderzocht of de abundantie van cirkelvormige isovormen met betrekking tot lineaire expressie was veranderd tussen de celtypen. De variaties van CLP over steekproefvoorwaarden wijzen op het tarief van onafhankelijkheid tussen circRNA en de gastheer-gen lineaire uitdrukking. Ten eerste merkten we op dat het aantal circRNAs met een meer overvloedige circulaire expressieverhouding (CLP > 0,5) het hoogst was in lymfoïde cellen (respectievelijk 185 in monocyten, 333 en 364 in B-cellen en T-cellen), wat in overeenstemming is met eerdere waarnemingen op een kleinere verzameling circRNAs17. Vervolgens identificeerden we 687 circRNAs (van 495 genen) met gastheergenonafhankelijke expressie (aanvullende tabel 7). Onder DECs, hadden 163 significante variatie van cirkeluitdrukkingsverhouding tussen celtypes in overeenstemming met de differentiële absolute uitdrukking, die erop wijzen dat de waargenomen variaties van deze circRNA uitdrukkingsniveau over celpopulaties niet aan een overeenkomstige variatie van lineaire uitdrukking toe te schrijven zijn. CircIKZF1, waarvoor upregulatie in T-cellen werd gevalideerd, werd ook uitgedrukt met hoge CLP in T-cellen. In het bijzonder vertoonden 25 circRNAs een hoog en aanzienlijk gevarieerd circulair expressiepercentage (aanvullende Fig. 6), met inbegrip van de gevalideerde circX(intergenic) en drie extra intergenic circRNAs, alle overexpressed in B – en T-cellen. CircSMARCA5 had de hoogste absolute en relatieve cirkelvormige expressie in B-cellen, terwijl het significant lager was in T-cel en het laagst in monocyten (aanvullende Fig. 7).
expressie van circRNAs in zes cytogenetische subtypes van B-cel precursor acute lymfoblastische leukemie
uitgaande van de hierboven beschreven transcriptoombrede circRNA-hulpbron, werd de expressie en mogelijke deregulering van circRNAs in BCP-ALL onderzocht op een target set van circRNAs. De geselecteerde circRNAs toonde lymfocyt-specificiteit en / of afgeleid van leukemie-geassocieerde loci. Volgens deze criteria, tien van de circRNAs met gevalideerde upregulation in B-cellen, T-cellen of in beide lymfocyten populaties (Fig. 2d) werden geselecteerd voor kwantificering in BCP-ALL, met inbegrip van circRNAs van bekende genen (AFF2, AFF3, bcl2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 en ZCCHC7) en de nieuw geïdentificeerde circX(intergenic) sterk uitgedrukt in lymfocyten. Bovendien circZFY, een circRNA uitgedrukt op een hoog niveau in bloedcellen van mannelijke proefpersonen; circHIPK3, waarvoor oncogene eigenschappen bekend zijn bij vaste kanker43; en circPVT1, onlangs gekoppeld aan acute lymfoblastische leukemia22, werden opgenomen.
de expressie van de 13 geselecteerde circRNAs werd gemeten met qRT-PCR in 32 BCP-all patiënt-derived xenotransplantaat (PDX) monsters (aanvullende tabel 8).
alle leukemische monsters samen werden eerst vergeleken met B-cellen van gezonde donoren (aanvullende Fig. 8 en Fig. 3a) om voor gedereguleerde circRNA uitdrukking in leukemic cellen te controleren. Voor zeven circRNAs was de uitdrukking beduidend verschillend in alle steekproeven die met B-cellen worden vergeleken. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
verder, onderzochten wij uitdrukking van de doelreeks van circRNAs over de belangrijkste BCP-alle cytogenetische subtypes (Fig. 3a). Cytogenetische subtypes worden gekenmerkt door specifieke genetische laesies, waaronder recidiverende translocaties (MLL herschikkingen, BCR/ABL, etv6-RUNX1 en tcf3-PBX1 fusies) en hyperdiploïde karyotype. Cytogenetische subtype karakterisatie is instrumenteel voor risico prognose en behandeling stratificatie van leukemie patiënten. Leukemic cellen van verschillende subtypes hebben verschillende biologische eigenschappen, de profielen van de genuitdrukking en Specifieke miRNA signatures44,45. In deze context werd nieuwe informatie over de heterogene aard van acute leukemias toegevoegd door de waargenomen significante circRNA-expressieverschillen tussen cytogenetische subtypes (Fig. 3a). CircAFF2 werd sterk uitgedrukt in TCF3-PBX1 BCP-ALL en, in mindere mate, in ETV6-RUNX1 BCP-ALL, vergeleken met B-cellen en andere cytogenetische BCP-ALL subgroepen. CircBCL2 (intronic) werd in totaal verhoogd met etv6-RUNX1 fusies. CircSETBP1 en circX (intergenic) waren beide zeer gereduceerd in MLL herschikte monsters. CircIKZF1 was lager in BCR-ABL en hyperdiploïde leukemieën vergeleken met het subtype ETV6-RUNX1, waarin de expressie werd behouden op niveaus vergelijkbaar met B-cellen.