Circular RNA expressão diferencial no sangue das populações de células e exploração de circRNA desregulamentação no pediátricos com leucemia linfoblástica aguda
- CircRNAomes de B, células T e monócitos populações
- Vários circular isoformas e circRNAs de novos genes
- Comparação entre tipos de células divulgadas tipo de célula específica circRNA expressão e alternativa circularization padrões de
- Expressão de circRNAs em seis citogenética subtipos de células B precursoras leucemia linfoblástica aguda
CircRNAomes de B, células T e monócitos populações
CircRNA expressão em B, células T e monócitos populações de dadores saudáveis foi investigado o uso de alta profundidade ribodepleted RNA-seq dados de 12 amostras, com 4 réplicas para cada população de células classificados a partir de células mononucleares do sangue periférico, PBMCs (ID da série GEO: GSE110159; métodos suplementares e quadro Complementar 1).
CircRNA quantificação e anotação foram fornecidos por CirComPara25, que combinado 9 circRNA software de detecção de ferramentas (CIRI226 Findcirc27; CIRCexplorer228 no BWA29, STAR30, Segemehl31 e TopHat232 alinhadores; DCC33; circRNA_finder34; e Segemehl31) para obter o mais confiável backsplices. Na verdade,a saída compartilhada de dois ou mais algoritmos para detecção de circRNA tem sido demonstrada para reduzir falsas previsões positivas 35, 36. A CirComPara executa filtros de qualidade de pré-processamento de leitura, tais como a limpeza do adaptador, a selecção da qualidade média de leitura e a filtragem por tamanho de leitura. Além disso, CirComPara conta as leituras linearmente Articuladas alinhadas com as junções backsplice de cada circRNA para estimar a expressão de transcrições lineares expressas a partir do gene hospedeiro do circRNA. Estes valores foram combinados com as contagens de leitura voltadas para trás, que medem a expressão circular, para calcular a proporção de expressão entre as isoformas circulares e lineares (proporção de expressão Circular para Linear, CLP; ver Métodos). Além disso, o CLP incorpora o conceito de correlação de expressão circular para expressão linear, de modo que a variação CLP entre as condições transmite a taxa de independência entre um circRNA e a expressão linear de seu gene-hospedeiro33.
globalmente, 68. 007 circRNAs de 10. 148 genes individuais foram detectados por pelo menos dois métodos. Como relatado por Hansen et al.36, the algorithms mostly agreed on highly expressed circRNAs, whereas those detected by only one algorithm had generally low read counts(Supplementary Fig. 1).
além disso, um sub-conjunto de 6,228 circRNAs (a partir de 3,323 genes), mostrando expressão em todos os biológicas replica de pelo menos um tipo de célula foi recuperado e referidas como “de alta confiança” (HC) circRNAs (Quadro Suplementar de 2). Comparação de circnas relatadas neste estudo com os resultados de Nicolet et al.17 concordância confirmada para 83% das circRNAs de 489 HC obtidas no estudo anterior e revelou 5.824 circRNAs de HC adicionais que ainda não foram investigadas quanto à variação da expressão nas populações de células sanguíneas (Fig. suplementar. 2A).
das circRNAs de 6.228 HC, 5,970 e 5,821 foram expressos em células B E T e 5,144 em monócitos (Fig. 1a). A maioria das cirrnas (4.763; 80%) foram detectadas nos três tipos de células, incluindo circZNF60937 omnipresentes, circHIPK338 e circhnas novas. É provável que as novas circRNAs (por exemplo, circPICALM) sejam específicas do compartimento hematopoiético. Cirnas partilhadas por dois tipos de células onde a maioria é comum entre linfócitos.
a análise principal de componentes não supervisionada mostrou uma variação relativamente pequena dos perfis de expressão de circRNA dentro de réplicas da mesma população celular, e apontou para diferenças de circRNAome que claramente discriminavam os tipos de células(Fig. 1b).
a expressão das circRNAs de 21 HC foi validada por RT-PCR em CPSP de diferentes dadores saudáveis (quadro suplementar 3; Quadro 1; Fig. 1c). Esta validação incluiu circRNAs exónicas de 15 genes diferentes, duas isoformas alternativas do IKZF1 e do ZFY masculino específico do cromossoma Y, um circRNA (18:63280887-63281214: -) derived from circularization of 328 bp of the unique large BCL2 intron, and one circRNA from a putative new gene (“intergenic”, see below). A estrutura circular das circRNAs foi corroborada pelo enriquecimento observado das circRNAs após o tratamento com RNase R, e detectada pelo qRT-PCR com primers divergentes específicos para a junção backsplice 14,27. Além disso, todas as junções de backsplice previstas foram confirmadas pela sequenciação de Sanger.
Vários circular isoformas e circRNAs de novos genes
Quase todos os circRNAs (99.4%), derivados de genes anotados, predominantemente com backsplice junções sobrepostas conhecido exões (98.9%). 71 circRNAs com ambas as extremidades em intrônicos regiões, os mais abundantes os linfócitos específicos circBCL2, que foi validado, circHLA-E, circRASSF3, e vários circMBL1 isoformas.
quase metade dos genes do hospedeiro circRNA expressaram múltiplas isoformas circulares (até 20) cada (Fig. 1d). Observou-se o uso preferencial da junção backsplice e a expressão de uma ou poucas isoformas prevalentes. O maior número de isoformas foi expresso em monócitos por AGTPBP1 (20) e PICALM (15), e em linfócitos por UBAP2 (19) e ATM (17).
trinta e quatro circas derivadas de regiões intergénicas. CircRNAs intergénicas utilizando as mesmas extremidades de espolho em diferentes combinações identificadas três loci que expressam múltiplas isoformas. Cinco circRNAs “intergênicas” derivadas de um novo gene putativo na região Xq11. 2 (chrX: 65051462-65113813) (Supplementary Fig. 3). O mais abundante circRNA do locus, circX(intergenic) (X:65051462-65075912:+), anteriormente detectado no sangue, também por Memczak e colleagues12, foi validado (Fig. 1c).
Next, we investigated to what extent the expression is in favor of circular with respect to linear transcripts overlapping the backsplice junctions. Os valores CLP variam entre 0 e 1: 0, quando não é detectada nenhuma expressão circular, 0 < CLP < 0, 5 representa circRNAs expressas menos abundantemente do que as respectivas isoformas lineares, 0, 5 significa que as transcrições circulares e lineares têm abundância equivalente, 0.5 < CLP ≤ 1 indica isoformas circulares expressas mais abundantemente do que as respectivas transcrições lineares. Em particular, CLP = 1 quando a expressão linear relativa ao circRNA não é detectada. Curiosamente, para 10 circnas não foi detectada nenhuma expressão linear. Além disso, o CLP foi extremamente alta (>0.95) para 14 circRNAs (Complementar Tabela 4), incluindo circGUSBP2 e circNBPF10, com mediana de CLP que variam de 0,99 a 1 em todas as populações de células (Complementar Tabela 4), e circAFF2, que mostrou alta CRE em monócitos (0.97). A circularização preferencial em células sanguíneas maduras de genes5, 39 e / ou maior estabilidade circular em comparação com RNAs16,40 lineares pode explicar estes achados.
Comparação entre tipos de células divulgadas tipo de célula específica circRNA expressão e alternativa circularization padrões de
em seguida, buscou-se definir as diferenças do B, células T e monócitos população circRNAomes. Comparações emparelhadas entre as três populações identificadas globalmente 1,369 circRNAs (DECs) significativamente diferentes entre tipos celulares (tabela suplementar 5), que derivam de 880 genes. A agregação hierárquica dos perfis de expressão DEC reflectia os conjuntos de circRNAs sub-regulados em cada tipo de célula(Fig. 2a). DECs exclusiva ou sobre-expressa em circRNAs específicas da população (Fig. 2b): 622 são característicos das células B, 183 das células T e 438 dos monócitos (1, 243 no total; Quadro 5 suplementar). Além disso, 72 DECs foram upregulados em ambas as populações de linfócitos (Fig. 2b–d). Nenhuma via KEGG significativamente enriquecida dos Termos ontológicos do gene resultou em genes de circRNAs características das células B, que, no entanto, incluiu genes envolvidos na Via de sinalização do receptor das células B, tais como SOS2 e NFKB1, ou ligados a funções das células B. Pelo contrário, os genes que expressam circnas características das células T enriqueceram significativamente a via de sinalização do receptor das células T. Além disso, os genes das circnas características dos monócitos enriqueceram significativamente vários processos biológicos e vias relacionadas com as funções dos monócitos. Outros tipos de células-característicos hospedeiros-genes, em vez disso, tinham funções celulares não diretamente ligadas à célula de origem (tabela suplementar 6).
embora os conjuntos circRNA característicos de tipo celular fossem disjuntos, a sobreposição de conjuntos de genes que expressavam isoformas específicas indicavam padrões alternativos de circularização específicos de tipo celular. De notar que 37 genes expressaram circRNAs características de dois tipos de células e representaram 14,7% dos genes com múltiplos tipos de células específicas circRNAs (Fig. 2c). Quatro isoformas circAKT3 mostraram expressão específica para o tipo de célula, três para as células B e uma para as células T; também quatro circMBNL1 eram específicas para o tipo de célula, três para as células B e um para os monócitos. Além disso, seis isoformas circulares GRK3 diferentes foram especificamente sobreexpressas nas células B, enquanto outras duas foram sobreexpressas apenas nos monócitos.
quantificação por qRT-PCR em células B, células T e monócitos ordenados a partir de 5 dadores saudáveis independentes confirmaram os resultados ARN-seq para todos os 15 circRNAs testados, suportando a robustez e a reprodutibilidade dos dados (Fig. 2D e Fig. suplementar. 4).
regulação significativa das células B de 5 circRNAs, incluindo circAFF3 (exons 4-6), circIL4R (exons 6-7), circSETBP1 (exon 2) foi confirmada. Além disso, a expressão circRNA elevada da região genómica 9p13.2, incluindo PAX5 (Fig. suplementar. 5) foi validado: o circPAX5 (exons 2-5) e o circZCCHC7 (exon 2) eram ambos específicos da célula B, enquanto uma tendência para a regulação do circGRHPR em células B estava de acordo com a estimativa dos dados RNA-seq. PAX5 exerce um papel marcante no Compromisso das células B41 e a co-expressão das transcrições lineares PAX5 e ZCCHC7 foi descrita durante a progressão de precursores comuns de linfócitos para células pré-pro-B42. Sugestivo de co-regulação do 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.17 detectaram 102 cirnas diferentes, expressas através de tipos e fases de células sanguíneas, 98 das quais foram detectadas nos nossos dados. Em particular, 42 circnas resultaram diferentemente expressas também em nossa comparação, 31 das quais eram específicas do tipo celular. De um modo geral, os nossos dados em que, de acordo com os aglomerados circRNA anteriormente associados a populações celulares Maduras (Figo suplementar. 2b). As circnas anteriormente atribuídas a grupos específicos de células linfóides mostraram a expressão mais elevada em células B ou T, incluindo circZCCHC7 e circFBXW7 que validámos experimentalmente. Nove em cada 10 circRNAs anteriormente consideradas como monócito-específicas foram lembradas por nossa análise ser mais expressa em monócitos, incluindo circAFF2. No entanto, a maioria das 1.243 circRNAs definidas como específicas para o tipo de célula no presente estudo, incluindo 11 em 15 circRNAs para as quais a sobre-expressão específica para o tipo de célula foi confirmada pelo qRT-PCR neste estudo (Fig. 2d), não foram representados nos aglomerados definidos por Nicolet et al.A seguir, examinamos se a abundância de isoformas circulares em relação à expressão linear foi alterada entre os tipos de células. As variações CLP entre as condições da amostra indicam a taxa de independência entre um circRNA e a expressão linear do gene-hospedeiro. Primeiro, observamos que o número de circRNAs com mais abundante circular expressão proporção (CLP > 0.5) foi maior nas células linfóides (185 em monócitos, 333 e 364 em células B e células T, respectivamente), o que está de acordo com observações anteriores em um conjunto menor de circRNAs17. Em seguida, identificamos 687 circRNAs (a partir de 495 genes) com expressão independente hospedeiro-gene (tabela suplementar 7). Entre o DECs, 163 teve uma variação significativa da proporção de expressão circular entre os tipos de células de acordo com a expressão absoluta diferencial, indicando que variações observadas destes níveis de expressão circRNA entre as populações celulares não são devidas a uma variação correspondente da expressão linear. O CircIKZF1, para o qual a regulamentação em células T foi validada, também foi expresso com alto CLP em células T. Em particular, 25 cirnas mostraram alta e significativamente variada proporção de expressão circular (Figo suplementar. 6), incluindo o circX validado(intergénico) e três circRNAs intergénicas adicionais, todas sobreexpressas em células B e T. O CircSMARCA5 teve a maior expressão circular absoluta e relativa nas células B, enquanto foi significativamente menor nas células T e menor nos monócitos (Figo suplementar. 7).
Expressão de circRNAs em seis citogenética subtipos de células B precursoras leucemia linfoblástica aguda
Iniciando a partir do acima descrito transcriptoma-grande circRNA de recursos, a expressão e a possível liberalização do circRNAs no BCP-TUDO foi examinado para uma meta definida de circRNAs. As circnas seleccionadas mostraram especificidade linfocitária e / ou derivadas de loci associado a leucemia. De acordo com estes critérios, dez das circRNAs com regulação validada em células B, células T ou em ambas as populações de linfócitos (Fig. 2d) foram selecionados para a quantificação do BCP-TODOS, incluindo circRNAs de genes conhecidos (AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 e ZCCHC7) e o recém-identificados circX(intergenic) altamente expresso em linfócitos. Além disso, circZFY, um circRNA expresso a um nível elevado nas células sanguíneas dos indivíduos do sexo masculino; o circHIPK3, para o qual são conhecidas propriedades oncogénicas em cancers sólidos 43; e o circPVT1, recentemente ligado a leucemia22 linfoblásico agudo, foram incluídos.
a expressão das 13 circRNAs seleccionadas foi medida pelo qRT-PCR em 32 amostras de xenograft derivadas de BCP (PDX) de todos os doentes (quadro suplementar 8).
todas as amostras leucémicas em conjunto foram primeiramente comparadas com as células B de dadores saudáveis (Fig. suplementar. 8 e Fig. 3a) verificar a expressão desregulada do circRNA em células leucémicas. Para sete circRNAs, a expressão foi significativamente diferente em todas as amostras em comparação com as células B. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
além disso, exploramos a expressão do conjunto alvo de circnas através do principal BCP-todos os subtipos citogenéticos(Fig. 3a). Os subtipos citogenéticos são caracterizados por lesões genéticas específicas, incluindo translocações recorrentes (rearranjos de LLM, BCR/ABL, ETV6-RUNX1 e perfusões TCF3-PBX1) e cariótipo hiperdiplóide. A caracterização do subtipo citogenético é fundamental para o prognóstico de risco e a estratificação do tratamento de pacientes com leucemia. Células leucêmicas de diferentes subtipos têm características biológicas distintas,perfis de expressão genética e signatures44, 45 específicas de miRNA. Neste contexto, novas informações sobre a natureza heterogénea das leucemias agudas foram adicionadas pelas diferenças significativas observadas na expressão circRNA entre os subtipos citogenéticos (Fig. 3a). CircAFF2 foi altamente expresso em TCF3-PBX1 BCP-todos e, em menor extensão, em ETV6-RUNX1 BCP-todos, em comparação com células B e outros subgrupos citogenéticos BCP-todos. O CircBCL2 (intrónico) foi sub-regulado em todas as perfusões ETV6-RUNX1. CircSETBP1 e circX (intergênico) foram ambos muito reduzidos em amostras rearranjadas MLL. O CircIKZF1 foi inferior nas leucemias BCR-ABL e hiperdiplóides em comparação com o subtipo ETV6-RUNX1, no qual a expressão foi conservada em níveis comparáveis com as células B.