ConSurf

Einleitung

ConSurf ist ein bioinformatisches Werkzeug zur Schätzung der evolutionären Erhaltung von Amino- / Nukleinsäurepositionen in einem Protein / DNA / RNA-Molekül basierend auf den phylogenetischen Beziehungen zwischen homologen Sequenzen. Der Grad, in dem eine Amino- (oder Nukleinsäure-) Säureposition evolutionär konserviert ist, hängt stark von ihrer strukturellen und funktionellen Bedeutung ab; Sich schnell entwickelnde Positionen sind variabel, während sich langsam entwickelnde Positionen konserviert werden. So kann die Analyse von Positionen unter Mitgliedern derselben Familie oft die Bedeutung jeder Position für die Struktur des Proteins (oder der Nukleinsäure) aufdecken. function.In ConSurf, die Evolutionsrate wird basierend auf der evolutionären Verwandtschaft zwischen dem Protein (DNA / RNA) und seinen Homologen und unter Berücksichtigung der Ähnlichkeit zwischen Aminosäuren (Nukleinsäuren) geschätzt, wie sie sich in der Substitutionsmatrix widerspiegelt. Einer der Vorteile von ConSurf im Vergleich zu anderen Methoden ist die genaue Berechnung der Evolutionsrate unter Verwendung einer empirischen Bayes-Methode oder einer Maximum-Likelihood-Methode (ML).

Methodik

Angesichts der Amino- oder Nukleinsäuresequenz (kann aus der 3D-Struktur extrahiert werden) führt ConSurf eine Suche nach engen homologen Sequenzen mit BLAST (oder PSI-BLAST) durch . Der Benutzer kann eine von mehreren Datenbanken auswählen und Kriterien für die Definition von Homologen angeben. Der Benutzer kann auch die gewünschten Sequenzen aus den Blastergebnissen auswählen. Die Sequenzen werden geclustert und sehr ähnliche Sequenzen werden mit CD-HIT entfernt. Ein Multiple Sequence Alignment (MSA) der homologen Sequenzen wird mit MAFFT, STREICH, T-KAFFEE, MUSKEL (Standard) oder CLUSTALW konstruiert. Die MSA wird dann verwendet, um einen phylogenetischen Baum mit dem Neighbor-Joining-Algorithmus zu erstellen, wie er im Rate4Site-Programm implementiert ist. Positionsspezifische Erhaltungswerte werden unter Verwendung der empirischen Bayes- oder ML-Algorithmen berechnet. Die kontinuierlichen Erhaltungswerte werden zur Visualisierung in eine diskrete Skala von neun Stufen unterteilt, von den variabelsten Positionen (Grad 1) in Türkis über zwischen konservierte Positionen (Grad 5) in Weiß bis zu den konserviertesten Positionen (Grad 9) in Kastanienbraun. Die Erhaltungswerte werden auf die Protein / Nukleotidsequenz und auf die MSA projiziert

 Kaliumkanal (Kcsa, Ketten: A, B, C, D)  Kaliumkanal (Kcsa, Ketten: A, B, C, D)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.