Génomique computationnelle

Les racines de la génomique computationnelle sont partagées avec celles de la bioinformatique. Au cours des années 1960, Margaret Dayhoff et d’autres membres de la National Biomedical Research Foundation ont assemblé des bases de données de séquences de protéines homologues pour une étude évolutive. Leurs recherches ont mis au point un arbre phylogénétique qui a déterminé les changements évolutifs nécessaires pour qu’une protéine particulière se transforme en une autre protéine en fonction des séquences d’acides aminés sous-jacentes. Cela les a amenés à créer une matrice de notation qui évaluait la probabilité qu’une protéine soit liée à une autre.

À partir des années 1980, des bases de données de séquences génomiques ont commencé à être enregistrées, mais cela a présenté de nouveaux défis sous forme de recherche et de comparaison des bases de données d’informations génétiques. Contrairement aux algorithmes de recherche de texte utilisés sur des sites Web tels que Google ou Wikipedia, la recherche de sections de similitude génétique nécessite de trouver des chaînes qui ne sont pas simplement identiques, mais similaires. Cela a conduit au développement de l’algorithme de Needleman-Wunsch, qui est un algorithme de programmation dynamique permettant de comparer des ensembles de séquences d’acides aminés entre eux en utilisant des matrices de notation dérivées des recherches antérieures de Dayhoff. Plus tard, l’algorithme BLAST a été développé pour effectuer des recherches rapides et optimisées dans des bases de données de séquences de gènes. BLAST et ses dérivés sont probablement les algorithmes les plus utilisés à cet effet.

L’émergence de l’expression “génomique computationnelle” coïncide avec la disponibilité de génomes séquencés complets au milieu et à la fin des années 1990. La première réunion de la Conférence Annuelle sur la Génomique Computationnelle a été organisée par des scientifiques de l’Institute for Genomic Research (TIGR) en 1998, offrant un forum pour cette spécialité et distinguant efficacement ce domaine de la science des domaines plus généraux de la Génomique ou de la Biologie Computationnelle. La première utilisation de ce terme dans la littérature scientifique, selon les résumés de MEDLINE, remonte à un an seulement dans la recherche sur les acides nucléiques. La dernière conférence de génomique computationnelle a eu lieu en 2006, avec un discours liminaire du lauréat du prix Nobel Barry Marshall, co-découvreur du lien entre Helicobacter pylori et les ulcères d’estomac. Depuis 2014, les principales conférences dans le domaine incluent les Systèmes Intelligents pour la Biologie Moléculaire (ISMB) et la Recherche en Biologie Moléculaire Computationnelle (RECOMB).

Le développement des mathématiques assistées par ordinateur (à l’aide de produits tels que Mathematica ou Matlab) a aidé les ingénieurs, les mathématiciens et les informaticiens à se lancer dans ce domaine, et une collection publique d’études de cas et de démonstrations se développe, allant de la comparaison du génome entier à l’analyse de l’expression génique. Cela a augmenté l’introduction de différentes idées, y compris des concepts de systèmes et de contrôle, de la théorie de l’information, de l’analyse des chaînes et de l’exploration de données. Il est prévu que les approches informatiques deviendront et resteront un sujet standard pour la recherche et l’enseignement, tandis que les étudiants maîtrisant les deux sujets commencent à se former dans les multiples cours créés au cours des dernières années.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.