3.6. Gènes avec transcrits et avec des noms identiques signalés comme ayant 0 compte même avec des lectures cartographiées

Accueil →Logiciel CLC: Notifications importantes → Problèmes affectant uniquement les versions de produits publiées avant juin 2017 → Gènes avec des transcrits et avec des noms identiques signalés comme ayant 0 compte même avec des lectures cartographiées

Le problème

Lors de l’exécution de l’outil RNA-Seq en utilisant des références basées sur la piste et

  • en utilisant l’option “Génomes annotés avec des gènes et des transcrits”, et
  • deux gènes ou plus avaient le même nom, et
  • un transcrit pourrait être attribué à chacun de ces gènes à partir de la piste d’ARNm

puis la valeur dans la colonne “Transcriptions annotées” dans la piste GE et dans la piste TE était 0, et tous les comptes pour de tels gènes ont été signalés comme nuls, même lorsqu’il y avait des lectures qui leur étaient mappées.

Quels logiciels et versions sont concernés ?

Ce problème affecte :

Quelles versions de logiciel sont corrigées ?

Ce problème est résolu dans l’Atelier de génomique CLC 9.0.1, l’atelier de génomique biomédicale 3.0.1 et le serveur de génomique CLC 8.0.1, publiés le 9 juin 2016.

Il a également été abordé dans la ligne de publication précédente: Atelier de génomique CLC 8.5.3, Atelier de génomique biomédicale 2.5.3 et Serveur de génomique CLC 7.5.3, publié le 16 juin 2016.

Les notes de version décrivant le correctif pour ce problème se trouvent sur les dernières pages d’améliorations pour chaque produit. Ce correctif particulier est décrit comme suit:

Correction d’un problème avec l’outil d’analyse ARN-Seq qui pouvait survenir lorsque l’option “Génomes annotés de gènes et de transcriptions” était choisie: Si deux gènes ou plus avaient le même nom et qu’un transcrit pouvait être attribué à chacun à partir de la piste d’ARNm, alors la valeur dans la colonne “Transcrits annotés” dans la piste GE et dans la piste TE était 0. De plus, tous les dénombrements de ces gènes ont été signalés comme nuls, même lorsqu’il y avait des lectures mappées sur eux.

Comment puis-je vérifier si mon analyse ARN-Seq a été affectée par le problème?

Pour savoir si votre analyse vous affecte:

  • Triez la table des pistes TE sur la colonne : “Transcriptions annotées”
  • Toutes les transcriptions qui ont 0 dans cette colonne sont affectées. Toutes les autres transcriptions ne sont pas affectées par ce bogue.

Le bogue était présent à un stade très avancé de l’exécution de l’algorithme RNA-Seq, lorsque les résultats du calcul ont été entrés dans le tableau. Les calculs sous-jacents ont été effectués correctement, mais les valeurs pour les noms de gènes dupliqués ont été exclues. Les valeurs non nulles qui sont entrées dans la table sont correctes et ne changeront pas avec le correctif.

Bien que les transcriptions avec 0 dans la colonne “Transcriptions annotées” (transcriptions affectées) soient souvent visibles lors de l’utilisation des versions logicielles affectées dans les conditions d’analyse décrites ci-dessus, nous ne prévoyons pas qu’il sera nécessaire de réexécuter les analyses dans la plupart des cas. Seul un très petit nombre de gènes / transcrits seraient généralement affectés et ceux-ci peuvent ne pas être des gènes d’intérêt pour l’analyse. Par exemple, dans de nombreux cas, les gènes portant le même nom codent pour les ARNR, les ARNN et d’autres ARN divers, plutôt que pour les ARNM.
Si vous voyez des transcriptions affectées associées à des gènes d’intérêt potentiel, nous vous recommandons de relancer l’analyse à l’aide d’une version du logiciel qui inclut une solution à ce problème.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.