Expression différentielle de l’ARN circulaire dans les populations de cellules sanguines et exploration de la dérégulation de l’ARN CIRCRN chez les leucémies lymphoblastiques aiguës pédiatriques
- CircRNAomes des populations de lymphocytes B, T et monocytes
- Isoformes circulaires multiples et circRNAs provenant de nouveaux gènes
- Comparaison entre les types de cellules décrits expression de circRNA spécifique au type de cellule et modèles de circularisation alternatifs
- Expression de CIRCRNA dans six sous-types cytogénétiques de leucémie lymphoblastique aiguë précurseur de lymphocytes B
CircRNAomes des populations de lymphocytes B, T et monocytes
L’expression de l’ARN CIRCRN chez les populations de lymphocytes B, T et monocytes de donneurs sains a été étudiée à l’aide d’ARN ribodéplété à haute profondeur – données seq de 12 échantillons, avec 4 répliques pour chaque population de cellules triées à partir de cellules mononucléées du sang périphérique, PBMC (série GEO ID: GSE110159; Méthodes supplémentaires et Tableau supplémentaire 1).
La quantification et l’annotation de CircRNA ont été fournies par CirComPara25, qui a combiné 9 outils logiciels de détection de circRNA (CIRI226 Findcirc27; CIRCexplorer228 sur les aligneurs BWA29, STAR30, Segemehl31 et TopHat232; DCC33; circRNA_finder34; et Segemehl31) pour obtenir les backsplices les plus fiables. En effet, il a été démontré que la sortie partagée de deux algorithmes ou plus pour la détection de circNNA réduisait les prévisions faussement positives35,36. CirComPara effectue des filtres de qualité de prétraitement en lecture, tels que le rognage de l’adaptateur, la sélection de la qualité moyenne en lecture et le filtrage par longueur de lecture. De plus, CirComPara compte les lectures épissées linéairement alignées sur les jonctions de retour de chaque circRNA pour estimer l’expression des transcrits linéaires exprimés à partir du gène hôte du circRNA. Ces valeurs ont été combinées avec les comptes de lecture en creux, qui mesurent l’expression circulaire, pour calculer la proportion d’expression entre les isoformes circulaires et linéaires (Proportion d’expression Circulaire à linéaire, CLP ; voir Méthodes). De plus, la CLP intègre le concept de corrélation d’expression circulaire à linéaire, de sorte que la variation de la CLP entre les conditions traduit le taux d’indépendance entre un circRNA et l’expression linéaire de son gène-hôte 33.
Au total, 68 007 circRNAs provenant de 10 148 gènes individuels ont été détectés par au moins deux méthodes. Tel que rapporté par Hansen et coll.36, les algorithmes s’accordaient pour la plupart sur des circRNAs fortement exprimés, alors que ceux détectés par un seul algorithme avaient généralement un faible nombre de lectures (Fig. 1).
De plus, un sous-ensemble de 6 228 CIRCRNA (provenant de 3 323 gènes) montrant une expression dans tous les réplicats biologiques d’au moins un type cellulaire a été récupéré et désigné sous le nom de CIRCRNA de ” confiance élevée ” (HC) (Tableau supplémentaire 2). Comparaison des circRNAs rapportés dans cette étude avec les résultats de Nicolet et al.17 concordance confirmée pour 83 % des 489 circRNAs HC récupérés dans l’étude précédente et découverte de 5 824 circRNAs HC supplémentaires qui n’ont pas encore été étudiés pour la variation d’expression dans les populations de cellules sanguines (fig. supplémentaire. 2 BIS).
Des 6 228 circRNAs HC, 5 970 et 5 821 ont été exprimés dans les cellules B et T, et 5 144 dans les monocytes (Fig. 1 bis). La majorité des CIRCARNAS (4 763; 80 %) ont été détectés dans les trois types cellulaires, y compris les circZNF60937 ubiquitaires, les circHIPK338 et les nouveaux CIRCARNAS. Les nouveaux circRNAs (par exemple circPICALM) sont susceptibles d’être spécifiques du compartiment hématopoïétique. Les CircRNAs partagés par deux types de cellules sont généralement communs entre les lymphocytes.
L’analyse en composantes principales non supervisée a montré une variation relativement faible des profils d’expression du circNNA au sein des répliques d’une même population cellulaire, et a mis en évidence des différences de CIRCNAOME qui discriminaient clairement les types cellulaires (Fig. 1b).
L’expression de 21 circRNAs HC a été validée par RT-PCR dans des PBMC de différents donneurs sains (Tableau supplémentaire 3; Tableau 1; Fig. 1c). Cette validation comprenait des CIRCRNA exoniques de 15 gènes différents, deux isoformes alternatives d’IKZF1 et du ZFY spécifique au mâle du chromosome Y, un circRNA (18:63280887-63281214 🙂 dérivé de la circularisation de 328 pb du grand intron BCL2 unique, et d’un circRNA issu d’un nouveau gène putatif (“intergénique”, voir ci-dessous). La structure circulaire des CIRCRNA a été corroborée par l’enrichissement observé des CIRCRNA après traitement à la RNase R, et détectée par qRT-PCR avec des amorces divergentes spécifiques de la jonction dosse14,27. De plus, toutes les jonctions de rétrodiffusion prédites ont été confirmées par séquençage de Sanger.
Isoformes circulaires multiples et circRNAs provenant de nouveaux gènes
Presque tous les circRNAs (99,4%) dérivaient de gènes annotés, principalement avec des jonctions dorsales chevauchant des exons connus (98,9%). Parmi les 71 circRNAs avec les deux extrémités dans les régions introniques, les plus abondantes comprenaient le circBCL2 spécifique aux lymphocytes, qui a été validé, circHLA-E, circRASSF3 et plusieurs isoformes de circMBL1.
Près de la moitié des gènes hôtes du circRNA ont exprimé plusieurs (jusqu’à 20) isoformes circulaires chacune (Fig. 1d). L’utilisation et l’expression préférentielles d’une ou de quelques isoformes prévalentes ont été observées. Les nombres les plus élevés d’isoformes ont été exprimés dans les monocytes par AGTPBP1 (20) et PICALM (15), et dans les lymphocytes par UBAP2 (19) et ATM (17).
Trente-quatre circRNAs dérivés de régions intergéniques. Les circRNAs intergéniques utilisant les mêmes extrémités de dosseret dans différentes combinaisons ont identifié trois loci exprimant plusieurs isoformes. Cinq CIRCRNA “intergéniques” dérivés d’un nouveau gène putatif dans la région Xq11.2 (chrX:65051462-65113813) (Fig. supplémentaire. 3). Le circRNA le plus abondant du locus, circX (intergénique) (X:65051462-65075912:+), précédemment détecté dans le sang également par Memczak et ses collègues 12, a été validé (Fig. 1c).
Ensuite, nous avons étudié dans quelle mesure l’expression est en faveur de la circulaire par rapport à des transcriptions linéaires chevauchant les jonctions de dosseret. Les valeurs CLP vont de 0 à 1: 0 vient lorsqu’aucune expression circulaire n’est détectée, 0 < CLP < 0,5 représente les CIRCNAS exprimés moins abondamment que les isoformes linéaires respectives, 0,5 signifie que les transcriptions circulaires et linéaires ont une abondance équivalente, 0.5 < CLP ≤ 1 indique des isoformes circulaires exprimées plus abondamment que les transcriptions linéaires respectives. En particulier, CLP = 1 lorsque l’expression linéaire relative au circNNA n’est pas détectée. Fait intéressant, pour 10 circRNAs, aucune expression linéaire n’a été détectée. De plus, la CLP était remarquablement élevée (> 0,95) pour 14 CIRCRNA (Tableau supplémentaire 4), y compris circGUSBP2 et circNBPF10, avec une CLP médiane allant de 0,99 à 1 dans toutes les populations cellulaires (Tableau supplémentaire 4), et circAFF2, qui a montré une CLP élevée dans les monocytes (0,97). La circularisation préférentielle de la transcription dans les cellules sanguines matures de gènes spécifiques5,39 et/ou une stabilité plus élevée des ARN circulaires par rapport aux ARN linéaires16,40 pourraient expliquer ces résultats.
Comparaison entre les types de cellules décrits expression de circRNA spécifique au type de cellule et modèles de circularisation alternatifs
Ensuite, nous avons cherché à définir les différences entre les circRNAomes de population de cellules B, de cellules T et de monocytes. Les comparaisons par paires des trois populations ont permis d’identifier au total 1 369 circRNAs (DEC) exprimés de manière significativement différentielle entre les types cellulaires (Tableau supplémentaire 5), qui dérivent de 880 gènes. Le regroupement hiérarchique des profils d’expression DEC reflète les ensembles de circRNAs régulés à la hausse dans chaque type de cellule (Fig. 2 bis). Les DEC sont exclusivement ou surexprimés dans un type de cellule et indiquent des circRNAs spécifiques à la population (Fig. 2b) : 622 étaient caractéristiques des lymphocytes B, 183 des lymphocytes T et 438 des monocytes (1 243 au total ; Tableau supplémentaire 5). De plus, 72 DEC ont été régulés à la hausse dans les deux populations de lymphocytes (Fig. 2b-d). Aucune voie de KEGG enrichie de manière significative en termes d’ontologie génique n’a abouti à des gènes de CIRCRNA caractéristiques des lymphocytes B, qui comprenaient néanmoins des gènes impliqués dans la voie de signalisation des récepteurs des lymphocytes B, tels que SOS2 et NFKB1, ou liés à des fonctions des lymphocytes B. Au contraire, les gènes exprimant les CIRCRNA caractéristiques des lymphocytes T ont été enrichis de manière significative la voie de signalisation des récepteurs des lymphocytes T. De plus, les gènes des circRNAs caractéristiques des monocytes ont considérablement enrichi plusieurs processus et voies biologiques liés aux fonctions des monocytes. D’autres gènes-hôtes caractéristiques du type cellulaire avaient plutôt des fonctions cellulaires non directement liées à la cellule d’origine (Tableau supplémentaire 6).
Bien que les ensembles de circRNA caractéristiques du type cellulaire soient disjoints, le chevauchement des ensembles de gènes qui expriment des isoformes spécifiques indique d’autres modèles de circularisation spécifiques au type cellulaire. Il est à noter que 37 gènes ont exprimé des circRNAs caractéristiques de deux types cellulaires et représentaient 14,7 % des gènes avec des circRNAs spécifiques à plusieurs types cellulaires (Fig. 2c). Quatre isoformes circAKT3 ont montré une expression spécifique au type cellulaire, trois pour les cellules B et une pour les cellules T; quatre circMBNL1 étaient également spécifiques au type cellulaire, 3 pour les cellules B et un pour les monocytes. De plus, six isoformes circulaires différentes de GRK3 ont été spécifiquement surexprimées dans les cellules B, alors que deux autres l’ont été uniquement dans les monocytes.
La quantification par qRT-PCR dans les cellules B, les cellules T et les monocytes triés de 5 donneurs sains indépendants a confirmé les résultats de l’ARN-seq pour les 15 CIRCRNA testés, confirmant la robustesse et la reproductibilité des données (Fig. 2d et Fig. 4).
Une régulation ascendante significative dans les cellules B de 5 CIRCRNA, y compris circAFF3 (exons 4-6), circIL4R (exons 6-7), circSETBP1 (exon 2) a été confirmée. De plus, une expression circRNA élevée de la région génomique 9p13.2 incluant PAX5 (Figure supplémentaire. 5) a été validé : circPAX5 (exons 2-5) et circZCCHC7 (exon 2) étaient tous deux spécifiques aux lymphocytes B, tandis qu’une tendance à la régulation à la hausse du circGRHPR chez les lymphocytes B était en accord avec l’estimation des données ARN-seq. PAX5 exerce un rôle frappant dans l’engagement des cellules b41 et la co-expression des transcrits linéaires PAX5 et ZCCHC7 a été décrite au cours de la progression des précurseurs lymphocytaires communs vers les cellules pré-pro-b42. Suggestive de corégulation de la 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 ont trouvé 102 circRNAs exprimés de manière différentielle selon les types et stades de cellules sanguines, dont 98 ont été détectés dans nos données. En particulier, 42 circRNAs ont également été exprimés de manière différentielle dans notre comparaison, dont 31 étaient spécifiques au type de cellule. Dans l’ensemble, nos données étaient en accord avec les clusters circNNA précédemment associés à des populations de cellules matures (Fig. 2b). Les ARNCI précédemment affectés à des amas spécifiques aux cellules lymphoïdes ont montré l’expression la plus élevée chez les lymphocytes B ou les lymphocytes T, y compris circZCCHC7 et circFBXW7 que nous avons validés expérimentalement. Neuf circRNAs sur 10 précédemment considérés comme spécifiques des monocytes ont été rappelés par notre analyse étant plus exprimés dans les monocytes, y compris circAFF2. Cependant, la majorité des 1 243 CIRCRNA définis comme spécifiques au type cellulaire dans la présente étude, y compris 11 CIRCRNA sur 15 pour lesquels une surexpression spécifique au type cellulaire a été confirmée par qRT-PCR dans cette étude (Fig. 2d), n’étaient pas représentés dans les grappes définies par Nicolet et al.
Ensuite, nous avons vérifié si l’abondance des isoformes circulaires par rapport à l’expression linéaire était modifiée entre les types de cellules. Les variations de CLP dans les conditions de l’échantillon indiquent le taux d’indépendance entre un circRNA et l’expression linéaire du gène hôte. Tout d’abord, nous avons observé que le nombre de circRNAs avec une proportion d’expression circulaire plus abondante (CLP > 0,5) était le plus élevé dans les cellules lymphoïdes (185 dans les monocytes, 333 et 364 dans les lymphocytes B et les lymphocytes T, respectivement), ce qui est conforme aux observations précédentes sur un plus petit ensemble de circRNAs17. Ensuite, nous avons identifié 687 CIRCRNA (issus de 495 gènes) avec une expression indépendante du gène hôte (Tableau supplémentaire 7). Parmi les DEC, 163 présentaient une variation significative de la proportion d’expression circulaire entre les types de cellules en accord avec l’expression absolue différentielle, ce qui indique que les variations observées de ce niveau d’expression du circNNA entre les populations cellulaires ne sont pas dues à une variation correspondante de l’expression linéaire. CircIKZF1, pour lequel la régulation à la hausse chez les lymphocytes T a été validée, a également été exprimée avec une CLP élevée chez les lymphocytes T. En particulier, 25 circRNAs ont montré une proportion d’expression circulaire élevée et significativement variée (Fig. 6), y compris le circX validé (intergénique) et trois CIRCRNA intergéniques supplémentaires, tous surexprimés dans les cellules B et T. Le CircSMARCA5 présentait l’expression circulaire absolue et relative la plus élevée chez les lymphocytes B, alors qu’elle était significativement plus faible chez les lymphocytes T et la plus faible chez les monocytes (Fig. 7).
Expression de CIRCRNA dans six sous-types cytogénétiques de leucémie lymphoblastique aiguë précurseur de lymphocytes B
À partir de la ressource de circRNA à l’échelle du transcriptome décrite ci-dessus, l’expression et la dérégulation possible des CIRCRNA dans BCP-ALL ont été examinées pour un ensemble cible de CIRCRNA. Les CIRCRNA sélectionnés ont montré une spécificité lymphocytaire et/ou dérivés de locus associés à la leucémie. En suivant ces critères, dix des CIRCRNA avec une régulation positive validée chez les lymphocytes B, les lymphocytes T ou dans les deux populations de lymphocytes (Fig. 2d) ont été sélectionnés pour être quantifiés dans le BCP-ALL, y compris les CIRCRNA de gènes connus (AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 et ZCCHC7) et le circX (intergénique) nouvellement identifié fortement exprimé dans les lymphocytes. De plus, circZFY, un circRNA exprimé à un niveau élevé dans les cellules sanguines de sujets masculins; circHIPK3, pour lequel des propriétés oncogènes sont connues dans les cancers solids43; et circPVT1, récemment liée à la leucémie aiguë lymphoblastique 22, ont été inclus.
L’expression des 13 CIRCRNA sélectionnés a été mesurée par qRT-PCR dans 32 échantillons de xénogreffe (PDX) provenant de tous les patients BCP (Tableau supplémentaire 8).
Tous les échantillons leucémiques ensemble ont d’abord été comparés avec des cellules B provenant de donneurs sains (Fig. 8 et Fig. 3a) pour vérifier l’expression dérégulée du CIRCNA dans les cellules leucémiques. Pour sept circRNAs, l’expression était significativement différente dans TOUS les échantillons par rapport aux cellules B. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
En outre, nous avons exploré l’expression de l’ensemble cible de CIRCNAS à travers les principaux sous-types de BCP – TOUS cytogénétiques (Fig. 3 bis). Les sous-types cytogénétiques sont caractérisés par des lésions génétiques spécifiques, y compris des translocations récurrentes (réarrangements MLL, fusions BCR/ ABL, ETV6-RUNX1 et TCF3-PBX1) et un caryotype hyperdiploïde. La caractérisation du sous-type cytogénétique est déterminante pour le pronostic du risque et la stratification du traitement des patients atteints de leucémie. Les cellules leucémiques de différents sous-types ont des caractéristiques biologiques distinctes, des profils d’expression génique et des signatures spécifiques des miarns44,45. Dans ce contexte, de nouvelles informations sur la nature hétérogène des leucémies aiguës ont été ajoutées par les différences significatives d’expression du circNNA observées entre les sous-types cytogénétiques (Fig. 3 bis). CircAFF2 a été fortement exprimé dans TCF3-PBX1 BCP-ALL et, dans une moindre mesure, dans ETV6-RUNX1 BCP-ALL, par rapport aux lymphocytes B et à d’autres sous-groupes cytogénétiques BCP-ALL. CircBCL2 (intronique) a été régulé à la hausse en TOUT avec des fusions ETV6-RUNX1. CircSETBP1 et circX (intergénique) ont tous deux été très réduits dans des échantillons réarrangés MLL. CircIKZF1 était plus faible dans les leucémies BCR-ABL et hyperdiploïdes que dans le sous-type ETV6-RUNX1, dans lequel l’expression était conservée à des niveaux comparables à ceux des lymphocytes B.