Computational Genomics

Die Wurzeln der Computational Genomics sind mit denen der Bioinformatik geteilt. In den 1960er Jahren sammelten Margaret Dayhoff und andere von der National Biomedical Research Foundation Datenbanken mit homologen Proteinsequenzen für Evolutionsstudien. Ihre Forschung entwickelte einen phylogenetischen Baum, der die evolutionären Veränderungen bestimmte, die erforderlich waren, damit sich ein bestimmtes Protein basierend auf den zugrunde liegenden Aminosäuresequenzen in ein anderes Protein verwandelte. Dies führte dazu, dass sie eine Bewertungsmatrix erstellten, die die Wahrscheinlichkeit bewertete, dass ein Protein mit einem anderen verwandt ist.

Ab den 1980er Jahren wurden Datenbanken mit Genomsequenzen aufgezeichnet, was jedoch neue Herausforderungen in Form der Suche und des Vergleichs der Datenbanken mit Geninformationen darstellte. Im Gegensatz zu Textsuchalgorithmen, die auf Websites wie Google oder Wikipedia verwendet werden, erfordert die Suche nach Abschnitten genetischer Ähnlichkeit, dass Zeichenfolgen gefunden werden, die nicht einfach identisch, sondern ähnlich sind. Dies führte zur Entwicklung des Needleman-Wunsch-Algorithmus, bei dem es sich um einen dynamischen Programmieralgorithmus zum Vergleichen von Sätzen von Aminosäuresequenzen untereinander handelt, indem Bewertungsmatrizen verwendet werden, die aus der früheren Forschung von Dayhoff abgeleitet wurden. Später wurde der BLAST-Algorithmus entwickelt, um eine schnelle, optimierte Suche in Gensequenzdatenbanken durchzuführen. BLAST und seine Derivate sind wahrscheinlich die am weitesten verbreiteten Algorithmen für diesen Zweck.

Die Entstehung des Ausdrucks “Computational Genomics” fällt mit der Verfügbarkeit vollständiger sequenzierter Genome Mitte bis Ende der 1990er Jahre zusammen. Das erste Treffen der jährlichen Konferenz für Computational Genomics wurde 1998 von Wissenschaftlern des Instituts für Genomforschung (TIGR) organisiert, um ein Forum für diese Spezialität zu bieten und diesen Wissenschaftsbereich effektiv von den allgemeineren Bereichen der Genomik oder der Computational Biology zu unterscheiden. Die erste Verwendung dieses Begriffs in der wissenschaftlichen Literatur war laut MEDLINE Abstracts nur ein Jahr zuvor in der Nukleinsäureforschung. Die letzte Computational Genomics Conference fand 2006 statt, mit einem Keynote-Vortrag von Nobelpreisträger Barry Marshall, Mitentdecker der Verbindung zwischen Helicobacter pylori und Magengeschwüren. Zu den führenden Konferenzen auf diesem Gebiet gehören seit 2014 Intelligent Systems for Molecular Biology (ISMB) und Research in Computational Molecular Biology (RECOMB).

Die Entwicklung der computergestützten Mathematik (unter Verwendung von Produkten wie Mathematica oder Matlab) hat Ingenieuren, Mathematikern und Informatikern geholfen, in diesem Bereich tätig zu werden, und eine öffentliche Sammlung von Fallstudien und Demonstrationen wächst, die vom Vergleich des gesamten Genoms bis zur Genexpressionsanalyse reichen. Dies hat die Einführung verschiedener Ideen erhöht, einschließlich Konzepte aus Systemen und Steuerung, Informationstheorie, Datenanalyse und Data Mining. Es wird erwartet, dass computergestützte Ansätze ein Standardthema für Forschung und Lehre werden und bleiben, während Studenten, die beide Themen fließend beherrschen, in den in den letzten Jahren geschaffenen mehreren Kursen ausgebildet werden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.