Genomica computazionale

Le radici della genomica computazionale sono condivise con quelle della bioinformatica. Durante gli anni ‘ 60, Margaret Dayhoff e altri presso la National Biomedical Research Foundation assemblarono database di sequenze proteiche omologhe per lo studio evolutivo. La loro ricerca ha sviluppato un albero filogenetico che ha determinato i cambiamenti evolutivi che sono stati richiesti affinchè una proteina particolare cambi in un’altra proteina basata sulle sequenze sottostanti dell’amminoacido. Ciò li ha portati a creare una matrice di punteggio che ha valutato la probabilità che una proteina sia correlata a un’altra.

A partire dal 1980, i database di sequenze genomiche hanno cominciato a essere registrati, ma questo ha presentato nuove sfide sotto forma di ricerca e confronto dei database di informazioni sui geni. A differenza degli algoritmi di ricerca testuale utilizzati su siti Web come Google o Wikipedia, la ricerca di sezioni di somiglianza genetica richiede di trovare stringhe che non sono semplicemente identiche, ma simili. Ciò ha portato allo sviluppo dell’algoritmo Needleman-Wunsch, che è un algoritmo di programmazione dinamica per confrontare insiemi di sequenze di amminoacidi tra loro utilizzando matrici di punteggio derivate dalla precedente ricerca di Dayhoff. Successivamente, l’algoritmo BLAST è stato sviluppato per eseguire ricerche veloci e ottimizzate di database di sequenze geniche. BLAST e i suoi derivati sono probabilmente gli algoritmi più utilizzati per questo scopo.

L’emergere della frase “genomica computazionale” coincide con la disponibilità di genomi sequenziati completi nella metà-fine degli anni ‘ 90. Il primo incontro della Conferenza annuale sulla genomica computazionale è stato organizzato da scienziati dell’Istituto per la ricerca genomica (TIGR) nel 1998, fornendo un forum per questa specialità e distinguendo efficacemente quest’area della scienza dai campi più generali della genomica o della biologia computazionale. Il primo uso di questo termine nella letteratura scientifica, secondo MEDLINE abstracts, era solo un anno prima nella ricerca sugli acidi nucleici. La conferenza finale di genomica computazionale si è tenuta nel 2006, con un discorso chiave del premio Nobel Barry Marshall, co-scopritore del legame tra Helicobacter pylori e ulcere gastriche. A partire dal 2014, le principali conferenze nel campo includono Intelligent Systems for Molecular Biology (ISMB) e Research in Computational Molecular Biology (RECOMB).

Lo sviluppo della matematica assistita da computer (utilizzando prodotti come Mathematica o Matlab) ha aiutato ingegneri, matematici e informatici a iniziare a operare in questo settore, e una raccolta pubblica di casi di studio e dimostrazioni sta crescendo, che vanno dai confronti dell’intero genoma all’analisi dell’espressione genica. Ciò ha aumentato l’introduzione di idee diverse, inclusi concetti di sistemi e controllo, teoria dell’informazione, analisi delle stringhe e data mining. Si prevede che gli approcci computazionali diventeranno e rimarranno un argomento standard per la ricerca e l’insegnamento, mentre gli studenti fluenti in entrambi gli argomenti iniziano a formarsi nei corsi multipli creati negli ultimi anni.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.