Różnicowa ekspresja piłą RNA w populacji komórek krwi i badanie deregulacji piłą RNA w ostrej białaczki limfoblastycznej u dzieci
- Циркулярные RNA w populacjach, W-, komórek T i monocytów
- wiele kolistych izoform i cirrnas z nowych genów
- porównanie typów komórek ujawnionych ekspresji cirrna specyficznej dla typu komórki i alternatywnych wzorców cyrkularyzacji
- ekspresja cirrna w sześciu podtypach cytogenetycznych prekursora ostrej białaczki limfoblastycznej z komórek B
Циркулярные RNA w populacjach, W-, komórek T i monocytów
Ekspresja piłą RNA w populacjach, W-, komórek T i monocytów zdrowych dawców została zbadana za pomocą głębokich danych ribodepleted RNA-seq z 12 próbek, po 4 powtórzenia dla każdej populacji sortowanie komórek z jednojądrzastych komórek krwi obwodowej, PBMC (identyfikator serii GEO: GSE110159; metody uzupełniające i tabela uzupełniająca 1).
kwantyfikacja i adnotacja CircRNA zostały dostarczone przez CirComPara25, który połączył 9 narzędzi oprogramowania do wykrywania circRNA (ciri226 Findcirc27; CIRCexplorer228 na alignerach Bwa29, STAR30, Segemehl31 i Tophat232; dcc33; circRNA_finder34 i Segemehl31), aby uzyskać najbardziej niezawodne backsplice. W rzeczywistości wykazano, że wspólne dane wyjściowe z dwóch lub więcej algorytmów wykrywania cirrna zmniejszają fałszywie dodatnie przewidywania35,36. CirComPara wykonuje filtry jakości wstępnego przetwarzania odczytu, takie jak przycinanie adaptera, wybór jakości średniej odczytu i filtrowanie według długości odczytu. Co więcej, CirComPara liczy liniowo splecione odczyty wyrównane do tylnych połączeń każdego cirrna w celu oszacowania ekspresji liniowych transkryptów wyrażonych z genu gospodarza cirrna. Wartości te połączono z odwróconymi licznikami odczytu, które mierzą wyrażenie kołowe, aby obliczyć proporcję wyrażenia między izoformami kołowymi i liniowymi (proporcja wyrażenia kołowego do liniowego, CLP; patrz metody). Ponadto CLP osadza pojęcie korelacji ekspresji kołowej do liniowej, tak że zmienność CLP w różnych warunkach przekazuje szybkość niezależności między cirrna a liniową ekspresją genu gospodarza 33.
ogólnie, co najmniej dwiema metodami wykryto 68 007 cirrna z 10 148 pojedynczych genów. Jak donosi Hansen et al.36, algorytmy w większości zgadzały się na silnie wyrażone cirrna, podczas gdy te wykryte tylko przez jeden algorytm miały ogólnie niską liczbę odczytów(dodatkowe rys. 1).
ponadto pobrano podzbiór 6228 cirrnas (z 3323 genów) wykazujący ekspresję we wszystkich replikatach biologicznych co najmniej jednego typu komórki i określano go jako” high confidence ” (HC) cirrnas (dodatkowa Tabela 2). Porównanie cirrna zgłoszonych w tym badaniu z wynikami Nicolet et al.Potwierdzono zgodność 83% z 489 cyrkrenami HC uzyskanymi w poprzednim badaniu i ujawniono 5824 dodatkowych cyrkrenów HC, które nie były jeszcze badane pod kątem zmian ekspresji w populacjach komórek krwi (dodatkowe rys. 2A).
z 6228 cyrkrenów HC, 5970 i 5821 ulegało ekspresji w komórkach B I T, A 5144 w monocytach (Fig. 1a). Większość cirrnas (4 763; 80%) wykryto we wszystkich trzech typach komórek, w tym we wszechobecnych circZNF60937, circHIPK338 i nowych cirrnas. Nowe cirrna (np. circPICALM) mogą być specyficzne dla kompartmentu krwiotwórczego. Cirrna dzielą się na dwa typy komórek, w których najczęściej występują między limfocytami.
Nienadzorowana analiza głównych składników wykazała stosunkowo niewielką zmienność profili ekspresji cirrna w replikatach tej samej populacji komórek i wskazała na różnice cirrnaome, które wyraźnie rozróżniały typy komórek (Fig. 1B).
ekspresja 21 HC cirrna została zatwierdzona metodą RT-PCR w PBMC różnych zdrowych dawców (tabela uzupełniająca 3; Tabela 1; Fig. 1c). Walidacja ta obejmowała egzoniczne cirrna pochodzące z 15 różnych genów, dwie alternatywne izoformy IKZF1 i męskiego specyficznego ZFY z chromosomu Y, jedną cirrna (18:63280887-63281214: -) pochodzi z krążenia 328 bp unikalnego dużego intronu bcl2 i jednego cirrna z domniemanego nowego genu (“intergenic”, patrz poniżej). Kolistą strukturę cirrna potwierdzono obserwowanym wzbogaceniem cirrna po leczeniu Rnazą R i wykryto za pomocą qRT-PCR z rozbieżnymi starterami specyficznymi dla połączenia backsplice 14,27. Co więcej, wszystkie przewidywane połączenia backsplice zostały potwierdzone przez sekwencjonowanie Sangera.
wiele kolistych izoform i cirrnas z nowych genów
prawie wszystkie cirrnas (99,4%) pochodzą z adnotowanych genów, przeważnie z backsplice junctions nakładającymi się na znane eksony (98,9%). Spośród 71 cirrna z obydwoma końcami w regionach intronicznych, do najliczniejszych należały zwalidowane specyficzne dla limfocytów circBCL2, circHLA-E, circRASSF3 i kilka izoform circMBL1.
prawie połowa genów gospodarza cirrna eksprymuje wiele (do 20) kolistych izoform każdy (Fig. 1d). Zaobserwowano preferencyjne wykorzystanie złącza backsplice i ekspresję jednej lub kilku rozpowszechnionych izoform. Najwięcej izoform wyrażono w monocytach AGTPBP1 (20) i PICALM (15), a w limfocytach UBAP2 (19) i ATM (17).
trzydzieści cztery cirrna pochodzące z regionów międzygenicznych. Cirrna międzygeniczne wykorzystujące te same końce backsplice w różnych kombinacjach zidentyfikowały trzy loci wyrażające wiele izoform. Pięć” międzygenicznych ” cirrnas pochodzących z domniemanego nowego genu w regionie Xq11 .2 (chrX: 65051462-65113813) (dodatkowe rys. 3). Najbardziej obfite cirrna locus, cirx(intergenic) (X:65051462-65075912:+), wcześniej wykryte we krwi również przez Memczaka i kolegi12, zostało zatwierdzone (Fig. 1c).
następnie zbadaliśmy, w jakim stopniu wyrażenie jest na korzyść kołowego w odniesieniu do transkryptów liniowych nakładających się na złącza backsplice. Wartości CLP mieszczą się w zakresie od 0 do 1: 0, gdy nie wykryto wyrażenia kołowego, 0 < CLP < 0,5 oznacza cirrna wyrażone mniej obficie niż odpowiednie izoformy liniowe, 0,5 oznacza, że transkrypty kołowe i liniowe mają równoważną obfitość, 0.5 < CLP ≤ 1 wskazuje koliste izoformy wyrażone bardziej obficie niż odpowiednie transkrypty liniowe. W szczególności CLP = 1, gdy wyrażenie liniowe względem cirrna nie jest wykrywane. Co ciekawe, dla 10 cirrna nie wykryto ekspresji liniowej. Ponadto, CLP było niezwykle wysokie (>0,95) dla 14 cirrna( tabela uzupełniająca 4), w tym circGUSBP2 i circNBPF10, z medianą CLP w zakresie od 0,99 do 1 we wszystkich populacjach komórkowych (tabela uzupełniająca 4), oraz circAFF2, które wykazały wysoki CLP w monocytach (0,97). Preferencyjna cyrkulacja transkryptu w dojrzałych komórkach krwi specyficznych genów5, 39 i / lub większa stabilność kolistego w porównaniu z liniowym RNAs16, 40 może wyjaśnić te wyniki.
porównanie typów komórek ujawnionych ekspresji cirrna specyficznej dla typu komórki i alternatywnych wzorców cyrkularyzacji
następnie staraliśmy się zdefiniować różnice w cyrkrnaomach populacji B, T i monocytów. Porównując parami trzy populacje zidentyfikowano ogółem 1369 istotnie różniących się ekspresją cirrna (DECs) pomiędzy typami komórek (tabela uzupełniająca 5), które pochodzą z 880 genów. Hierarchiczne grupowanie profili ekspresji DEC odzwierciedlało zestawy cirrna ustawionych w górę w każdym typie komórki (Fig. 2A). DECs wyłącznie lub nadmiernie wyrażone w jednym typie komórek wskazywały specyficzne dla populacji cirrna (Fig. 2b): 622 były charakterystyczne dla limfocytów B, 183 dla limfocytów T i 438 dla monocytów (łącznie 1243; tabela uzupełniająca 5). Ponadto, w obu populacjach limfocytów zwiększono liczbę 72 deks (Fig. 2b-d). Nie uzyskano znacząco wzbogaconych szlaków KEGG w kategoriach ontologii genów dla genów cirrna charakterystycznych dla komórek B, które jednak obejmowały geny zaangażowane w szlak sygnałowy receptora dla komórek B, takie jak SOS2 i NFKB1, lub związane z funkcjami komórek B. Przeciwnie, geny wyrażające charakterystyczne dla limfocytów T cirrna zostały znacząco wzbogacone w szlak sygnałowy receptora limfocytów T. Ponadto geny charakterystycznych dla monocytów cirrna znacząco wzbogaciły szereg procesów biologicznych i szlaków związanych z funkcjami monocytów. Inne geny gospodarza, charakterystyczne dla danego typu komórki, miały natomiast funkcje komórkowe niezwiązane bezpośrednio z komórką pochodzenia (tabela uzupełniająca 6).
chociaż zestawy cirrna charakterystyczne dla typu komórkowego były rozłączne, nakładanie się zestawów genów, które wyrażały specyficzne izoformy, wskazywało na alternatywne wzorce cyrkularyzacji specyficzne dla typu komórki. Należy zauważyć, że 37 genów wyrażało cirrna charakterystyczne dla dwóch typów komórek i stanowiło 14,7% genów z wieloma specyficznymi dla danego typu komórkowego cirrna (Fig. 2c). Cztery izoformy circAKT3 wykazywały ekspresję specyficzną dla typu komórkowego, trzy dla B – i jedna dla limfocytów T; również cztery circMBNL1 były swoiste dla typu komórkowego, 3 dla limfocytów B i jedna dla monocytów. Co więcej, sześć różnych okrągłych izoform GRK3 zostało specjalnie nadekspresowanych w limfocytach B, podczas gdy dwie inne były nadekspresowane tylko w monocytach.
oznaczanie ilościowe za pomocą qRT-PCR w komórkach B, komórkach T i monocytach posortowane od 5 niezależnych zdrowych dawców potwierdzono wyniki RNA-seq dla wszystkich 15 badanych cirrna, potwierdzając solidność i odtwarzalność danych (Fig. 2D i dodatkowe rys. 4).
potwierdzono istotną regulację up w komórkach B 5 obwodów, w tym circAFF3 (eksony 4-6), circIL4R (eksony 6-7), circSETBP1 (ekson 2). Ponadto, wysoka ekspresja cirrna z regionu genomowego 9p13. 2, w tym PAX5 (dodatkowa Fig. 5) zwalidowano: circPAX5 (eksony 2-5) i circcchc7 (ekson 2) były zarówno specyficzne dla komórek B, podczas gdy tendencja do zwiększenia regulacji circGRHPR w komórkach B była zgodna z estymacją z danych RNA-seq. PAX5 odgrywa uderzającą rolę w zaangażowaniu komórek B41, a współekspresję liniowych transkryptów PAX5 i ZCCHC7 opisano podczas progresji z popularnych prekursorów limfocytów do komórek pre-pro-B42. Sugestia współregulacji 9p13.2 locus, circPAX5, circZCCHC7 and circGRHPR isoforms were all overexpressed specifically in B-cells. CircPAX5 and circZCCHC7 were previously detected in CD19 + cells14. Both circZCCHC7 and circGRHPR were identified in CD34 + cells and, according to data on RNA base modification promoting efficient initiation of protein translation from circRNAs in human cells, are likely to encode peptides10.
Regarding T-cells, significant overexpression was confirmed for circIKZF1 (exons 2–3), circTNIK (exons 5–7), circTXK (exons 2–6) and, in agreement with previous reports17, for circFBXW7 (exons 3–4). Also an increasing trend for circZFY (exons 2–3) in T-cells and for circAFF2 (exon 3) in monocytes, in agreement with Nicolet et al.17, confirmed RNA-seq results, while significant upregulation of circX(intergenic) and circBCL2(intronic) in lymphocytes and of circHIPK3 (exon 2) in monocytes was validated.
Nicolet et al.U 17 znaleziono 102 cirrna różniące się ekspresją w różnych typach i stadiach krwi, z czego 98 wykryto w naszych danych. W szczególności, 42 cirrna wykazały różną ekspresję również w naszym porównaniu, z czego 31 było specyficznych dla typu komórki. Ogólnie rzecz biorąc, nasze dane, w których w zgodzie z klastrów cirrna wcześniej związane z populacjami dojrzałych komórek (dodatkowe rys. 2b). Cirrna wcześniej przypisane do klastrów limfoidalnych wykazywały najwyższą ekspresję w komórkach B lub limfocytach T, w tym circchc7 i circFBXW7, które potwierdziliśmy doświadczalnie. 9 z 10 cirrna wcześniej uznanych za specyficzne dla monocytów zostało przywołanych przez naszą analizę, która była bardziej eksprymowana w monocytach, w tym w circAFF2. Jednak większość z 1243 cirrna zdefiniowanych jako swoiste dla typu komórki w niniejszym badaniu, w tym 11 z 15 cirrna, dla których nadekspresja specyficzna dla typu komórki została potwierdzona przez qRT-PCR w tym badaniu (Fig. 2d), nie były reprezentowane w grupach zdefiniowanych przez Nicolet et al.
następnie sprawdziliśmy, czy obfitość kolistych izoform w odniesieniu do ekspresji liniowej została zmieniona między typami komórek. Różnice CLP w różnych warunkach próbki wskazują na szybkość niezależności pomiędzy cirrna a liniową ekspresją genu gospodarza. Po pierwsze, zaobserwowaliśmy, że liczba cirrna o większym udziale ekspresji kołowej (CLP > 0,5) była najwyższa w komórkach limfoidalnych (185 w monocytach, 333 i 364 odpowiednio w komórkach B I T), co jest zgodne z wcześniejszymi obserwacjami na mniejszym zestawie cirrna17. Następnie zidentyfikowaliśmy 687 cirrna (z 495 genów) o ekspresji niezależnej od genu gospodarza (tabela uzupełniająca 7). Wśród DECs, 163 wykazywał znaczną zmienność proporcji ekspresji kołowej pomiędzy typami komórek w zgodzie z różniczkową ekspresją bezwzględną, co wskazuje, że obserwowane zmiany poziomu ekspresji cirrna w populacjach komórek nie są spowodowane odpowiednią zmiennością ekspresji liniowej. CircIKZF1, dla którego zwalidowano wzrost regulacji w komórkach T, również wyrażono wysokim CLP w komórkach T. W szczególności, 25 cirrna wykazywało wysoki i znacząco zróżnicowany udział ekspresji kołowej (Fig. 6), w tym zwalidowane circX (intergenic) i trzy dodatkowe cirrna intergenic, wszystkie nadekspresowane w komórkach B I T. CircSMARCA5 miała najwyższą bezwzględną i względną ekspresję kołową w komórkach B, podczas gdy była ona znacznie niższa w komórkach T i najniższa w monocytach (Fig. 7).
ekspresja cirrna w sześciu podtypach cytogenetycznych prekursora ostrej białaczki limfoblastycznej z komórek B
począwszy od wyżej opisanego zasobu cirrna o szerokości transkryptomu, ekspresję i możliwą deregulację cirrna w BCP-ALL badano pod kątem docelowego zestawu cirrna. Wybrane cirrna wykazały swoistość limfocytów i (lub) pochodzą z loci związanych z białaczką. Zgodnie z tymi kryteriami, dziesięć cirrna z potwierdzoną regulacją w komórkach B, limfocytach T lub w obu populacjach limfocytów (Fig. 2d) wybrano do oznaczenia ilościowego w BCP-ALL, w tym cirrna ze znanych genów (AFF2, AFF3, BCL2, FBXW7, IKZF1, IL4R, PAX5, SETBP1 i ZCCHC7) oraz nowo zidentyfikowanego cirx(intergenic) o wysokiej ekspresji w limfocytach. Ponadto circZFY, cirrna wyrażona na wysokim poziomie w komórkach krwi u mężczyzn; uwzględniono circHIPK3, dla którego znane są właściwości onkogenne w nowotworach stałych43 oraz circPVT1, związany ostatnio z ostrą białaczką limfoblastyczną22.
ekspresję 13 wybranych cirrna oznaczono metodą qRT-PCR w 32 próbkach ksenograftu (PDX) pochodzących od wszystkich pacjentów (tabela uzupełniająca 8).
wszystkie próbki białaczkowe razem zostały najpierw porównane z komórkami B od zdrowych dawców (dodatkowe rys. 8 i Rys. 3A) w celu sprawdzenia deregulacji ekspresji cirrna w komórkach białaczkowych. Dla siedmiu cirrna ekspresja była znacząco różna we wszystkich próbkach w porównaniu z limfocytami B. CircIL4R, circZCCHC7 and circX(intergenic), all highly expressed in lymphocytes, were less expressed in ALL. Conversely, overexpression of circAFF3, circHIPK3, circPVT1 and circPAX5 in BCP-ALL emerged. Differently from circPVT1 and circHIPK3, a functional characterization of circPAX5 and circAFF3 is still lacking. Thus, custom functional predictions, in terms of possible miRNA- binding sites, RNA binding protein (RBP) binding sites, and coding potential were obtained (Fig. 3b and Supplementary Fig. 9).
ponadto zbadaliśmy ekspresję docelowego zestawu cirrna w obrębie głównych podtypów cytogenetycznych BCP-ALL (Fig. 3A). Podtypy cytogenetyczne charakteryzują się specyficznymi zmianami genetycznymi, w tym nawracającymi translokacjami (zmiany MLL, BCR/ABL, Fuzje ETV6-RUNX1 i TCF3-PBX1) i kariotypem hiperdiploidalnym. Charakterystyka podtypu cytogenetycznego jest instrumentalna dla rokowania ryzyka i rozwarstwienia leczenia pacjentów z białaczką. Komórki białaczkowe różnych podtypów mają różne cechy biologiczne, profile ekspresji genów i specyficzne sygnatury mirna44, 45. W tym kontekście nowe informacje o niejednorodnym charakterze ostrych białaczek zostały dodane przez zaobserwowane znaczące różnice ekspresji cirrna między podtypami cytogenetycznymi (Fig. 3A). CircAFF2 wykazywał dużą ekspresję w tcf3-PBX1 BCP-ALL I, w mniejszym stopniu, w ETV6-RUNX1 BCP-ALL, w porównaniu z limfocytami B i innymi podgrupami cytogenetycznymi BCP-ALL. CircBCL2 (intronic) był regulowany w górę we wszystkich z fuzjami ETV6-RUNX1. CircSETBP1 i cirx (intergenic) były bardzo zredukowane w próbkach MLL. CircIKZF1 był niższy w białaczkach BCR-ABL i hiperdiploidalnych w porównaniu z podtypem ETV6-RUNX1, w którym ekspresja była zachowana na poziomie porównywalnym z limfocytami B.