3.6. Geny z transkryptami i identycznymi nazwami zgłaszane jako posiadające 0 zliczeń nawet przy zmapowanych odczytach
Home →CLC software: Ważne powiadomienia →problemy dotyczące tylko wersji produktów wydanych przed czerwcem 2017 r. →geny z transkryptami i o identycznych nazwach zgłaszane jako posiadające 0 zliczeń nawet przy zmapowanych odczytach
problem
podczas uruchamiania narzędzia RNA-Seq przy użyciu odniesień opartych na ścieżkach i
- przy użyciu opcji “genomy oznaczone genami i transkryptami”, a
- dwa lub więcej genów miało tej samej nazwy, a
- każdemu z tych genów można przypisać transkrypcję ze ścieżki mRNA
wtedy wartość w kolumnie “transkrypcje” w ścieżka GE i w ścieżce TE wynosiła 0, a wszystkie liczby dla takich genów były zgłaszane jako zero, nawet jeśli były do nich odwzorowywane odczyty.
które oprogramowanie i wersje są dotknięte?
ten problem dotyczy:
które wersje oprogramowania są naprawione?
ten problem został rozwiązany w CLC Genomics Workbench 9.0.1, Biomedical Genomics Workbench 3.0.1 i CLC Genomics Server 8.0.1, wydany 9 czerwca 2016 roku.
zostało to również omówione w poprzedniej linii wydań: CLC Genomics Workbench 8.5.3, Biomedical Genomics Workbench 2.5.3 i CLC Genomics Server 7.5.3, wydany 16 czerwca 2016.
uwagi do wydania opisujące poprawkę dla tego problemu można znaleźć na stronach najnowszych ulepszeń dla każdego produktu. Ta konkretna poprawka jest opisana w następujący sposób:
Naprawiono problem z narzędziem do analizy RNA-Seq, który mógł pojawić się, gdy wybrano opcję “genomy oznaczone genami i transkryptami”: jeśli dwa lub więcej genów miało tę samą nazwę, a transkrypt mógł być przypisany do każdego ze ścieżek mRNA, wartość w kolumnie “transkrypty oznaczone” w ścieżce GE i w ścieżce TE wynosiła 0. Co więcej, wszystkie liczby dla takich genów były zgłaszane jako zero, nawet jeśli były do nich odwzorowywane odczyty.
Jak mogę sprawdzić, czy problem dotyczy mojej analizy RNA-Seq?
aby dowiedzieć się, czy Twoja analiza ma wpływ na Ciebie:
- Sortuj tabelę ścieżek TE w kolumnie: “transkrypcje adnotowane”
- dotyczy to wszystkich transkryptów, które mają 0 w tej kolumnie. Ten błąd nie ma wpływu na wszystkie inne transkrypcje.
błąd był obecny na bardzo późnym etapie wykonywania algorytmu RNA-Seq, kiedy Wyniki obliczeń zostały wprowadzone do tabeli. Podstawowe obliczenia zostały wykonane poprawnie, ale wartości dla zduplikowanych nazw genów zostały wykluczone. Wartości niezerowe, które znalazły się w tabeli, są poprawne i nie ulegną zmianie wraz z poprawką.
chociaż transkrypty z 0 w kolumnie “transkrypty z adnotacją” (transkrypty, których to dotyczy) będą często widoczne podczas korzystania z dotkniętych wersji oprogramowania w Warunkach analizy opisanych powyżej, nie przewidujemy, że w większości przypadków konieczne będzie ponowne uruchomienie analiz. Tylko bardzo mała liczba genów / transkryptów byłaby ogólnie dotknięta i mogą to nie być geny interesujące dla analizy. Na przykład w wielu przypadkach geny o tej samej nazwie kodują rRNA, snoRNA i inne różne RNA, a nie mRNA.
jeśli widzisz zmienione transkrypty związane z genami potencjalnie interesującymi, zalecamy ponowne uruchomienie analizy przy użyciu wersji oprogramowania, która zawiera rozwiązanie tego problemu.