3.6. Genes con transcripciones y con nombres idénticos reportados con 0 recuentos, incluso con lecturas mapeadas
Inicio →software CLC: Notificaciones importantes →Problemas que afectan solo a versiones de productos lanzados antes de junio de 2017 →Genes con transcripciones y con nombres idénticos informados como con 0 recuentos incluso con lecturas mapeadas
El problema
Cuando se ejecuta la herramienta RNA-Seq utilizando referencias basadas en pistas y
- utilizando la opción “Genomas anotados con genes y transcripciones”, y
- dos o más genes tenían la el mismo nombre, y
- se podría asignar una transcripción a cada uno de estos genes de la pista de ARNm
luego el valor en la columna “Transcripciones anotadas” en la pista GE y en la pista TE fue 0,y todos los recuentos de dichos genes se reportaron como cero, incluso cuando se les asignaron lecturas.
¿Qué software y versiones se ven afectados?
Este problema afecta a:
¿Qué versiones de software se han solucionado?
Este problema se solucionó en CLC Genomics Workbench 9.0.1, Biomedical Genomics Workbench 3.0.1 y CLC Genomics Server 8.0.1, lanzados el 9 de junio de 2016.
También se ha abordado en la línea de versiones anteriores: CLC Genomics Workbench 8.5.3, Biomedical Genomics Workbench 2.5.3 y CLC Genomics Server 7.5.3, publicado el 16 de junio de 2016.
Las notas de la versión que describen la solución para este problema se pueden encontrar en las últimas páginas de Mejoras para cada producto. Esta solución en particular se describe de la siguiente manera:
Se corrigió un problema con la herramienta de Análisis de ARN-Seq que podía surgir cuando se elegía la opción “Genomas anotados con genes y transcripciones”: Si dos o más genes tenían el mismo nombre, y se podía asignar una transcripción a cada uno desde la pista de ARNm, entonces el valor en la columna” Transcripciones anotadas ” en la pista de GE y en la pista de TE era 0. Además, todos los recuentos de dichos genes se reportaron como cero, incluso cuando se les asignaron lecturas.
¿Cómo puedo comprobar si mi análisis de ARN-Seq se ha visto afectado por el problema?
Para averiguar si su análisis le afecta:
- Ordenar la tabla de pistas TE en la columna: “Transcripciones anotadas”
- Cualquier transcripción que tenga 0 en esta columna se verá afectada. Todas las demás transcripciones no se ven afectadas por este error.
El error estaba presente en una etapa muy tardía en la ejecución del algoritmo RNA-Seq, cuando los resultados del cálculo se ingresaron en la tabla. Los cálculos subyacentes se hicieron correctamente, pero se excluyeron los valores de los nombres de genes duplicados. Los valores distintos de cero que llegaron a la tabla son correctos y no cambiarán con la corrección.
Mientras que las transcripciones con 0 en la columna “Transcripciones anotadas” (transcripciones afectadas) a menudo se verán al usar las versiones de software afectadas bajo las condiciones de análisis descritas anteriormente, no anticipamos que sea necesario volver a ejecutar los análisis en la mayoría de los casos. Solo un número muy pequeño de genes/transcripciones generalmente se vería afectado y estos pueden no ser genes de interés para el análisis. Por ejemplo, en muchos casos, a los genes se les da el mismo nombre de código para ARNR, snoRNA y otros ARN diversos, en lugar de ARNm.
Si ve transcripciones afectadas asociadas con genes de interés potencial, le recomendamos que vuelva a ejecutar el análisis utilizando una versión del software que incluya una solución para este problema.