A critical view on conservative mutations
Abstract
Durch die Analyse der Oberflächenzusammensetzung eines Satzes von Protein-3D-Strukturen, ergänzt durch vorhergesagte Oberflächenzusammensetzungsinformationen für homologe Proteine, haben wir signifikante Beweise für eine Schichtzusammensetzung von Proteinstrukturen gefunden. In den innersten und äußersten Teilen von Proteinen gibt es eine negative Nettoladung, während die Mitte eine positive Nettoladung hat. Darüber hinaus weisen unsere Ergebnisse darauf hin, dass das Konzept der konservativen Mutation grundlegend überarbeitet werden muss, z. B. wurden sehr unterschiedliche räumliche Präferenzen für Glutaminsäure und Asparaginsäure gefunden. Das Alanin-Screening, das häufig in Protein-Engineering-Projekten verwendet wird, beinhaltet die Substitution von Rückständen durch Alanin, basierend auf der Annahme, dass Alanin ein `neutraler’ Rest ist. Alanin hat jedoch eine hohe negative Korrelation mit allen außer den unpolaren Resten. Wir schlagen daher die Verwendung von beispielsweise Serin als Ersatz für die Reste vor, die negativ mit Alanin korrelieren.
Einleitung
Beim Falten einer Peptidkette in eine 3D-Proteinstruktur werden einige Reste aus einer polaren Umgebung in eine unpolarere Umgebung im Inneren des gefalteten Proteins übertragen. Dieser Transfer wird durch die thermodynamischen Eigenschaften der Aminosäuren und des Lösungsmittels angetrieben. Während der gesamten molekularen Evolution hat die Natur die geeignete Funktion und Stabilität des resultierenden Proteins ausgewählt. Für kleine bis mittelgroße Proteine — in der gefalteten Struktur – sind nur wenige Reste vollständig vergraben ( Chothia, 1976; Miller et al., 1987 ; Petersen et al., 1998 ), während die meisten Rückstände nur teilweise vergraben sind. Die Variation der Lösemittelzugänglichkeit ist abhängig von den Eigenschaften des betreffenden Rückstands und spiegelt sich in der Aminosäurezusammensetzung in der gesamten Proteinstruktur wider. Diese Unterschiede im Lösemittelzugänglichkeitsprofil haben breite Anwendungen in verschiedenen Strukturvorhersagemethoden gefunden ( Holbrook et al., 1990 ; Rost und Sander, 1994 ; Thompson und Goldstein, 1996 ). Auch die Verwendung von umgebungsspezifischen Substitutionsmatrizen ( Donnelly et al., 1994 ; Wako und Blundell, 1994) haben sich als wertvoll erwiesen. Die sequenzielle Nachbarschaft von Aminosäuren wurde bereits untersucht ( Vonderviszt et al., 1986) und seine Verwendung wurde beispielsweise in der Schleifenvorhersage gefunden (Wojcik et al., 1999 ) und Sekundärstrukturvorhersage ( Chou und Fasman, 1978 ; Chandonia und Karplus, 1999 ; Jones, 1999). Es wurde keine signifikante Korrelation zwischen Resten und Nachbarschaftspräferenz festgestellt.
Auch die räumliche Nachbarschaft um einzelne Rückstände wurde bereits untersucht (Burley und Petsko, 1985 ; Bryant und Amzel, 1987 ; Miyazawa und Jernigan, 1993 ; Petersen et al., 1999 ). Ferner wurden räumliche Kontakte untersucht, um Kontaktpotentiale für die verschiedenen Aminosäurewechselwirkungen abzuleiten ( Brocchieri und Karlin, 1995 ; Miyazawa und Jernigan, 1996, 1999 ). Die gemeinsame Strategie besteht darin, die Anzahl der Kontakte innerhalb einer bestimmten Entfernung zu untersuchen. Die Literatur scheint jedoch frei von Untersuchungen entfernungsabhängiger Kontakte und auch von Berichten zu sein, in denen die eingebetteten Informationen über die Lösemittelzugänglichkeit der beteiligten Rückstände verwendet werden.
Eine Zwei-Zustands-Vorhersage der Zugänglichkeit von Lösungsmitteln Korrelation zwischen Hydrophobie, vergrabener Kontaktneigung und der Position im Vorhersagefenster wurde berichtet ( Mucchielli-Giorgi et al., 1999 ). Es wird jedoch keine Korrelation zwischen einzelnen Rückstandsverteilungen beschrieben.
Es ist wichtig, zwischen korrekt gefalteten und falsch gefalteten Modellstrukturen unterscheiden zu können. Es wurde darauf hingewiesen, dass potentielle energiebasierte Methoden nicht gut zwischen gefalteten und fehlgefalteten Strukturen unterscheiden. Strukturelle Merkmale wie vergrabene polare Oberfläche ( Overington et al., 1992 ) und Anzahl der polaren Kontakte ( Bryant und Amzel, 1987 ; Golovanov et al. 1999 ) haben sich bewährt.
In der Proteintechnik wird häufig das Konzept der konservativen Mutationen verwendet. Die allgemeine Idee ist, dass eine Substitution einer Aminosäure durch eine andere Aminosäure mit ähnlichen physikalisch-chemischen Eigenschaften die Stabilität und Funktion des Proteins nicht beeinflusst. Die vorliegende Arbeit zeigt, dass die räumlichen Präferenzen für ähnliche Reste in Proteinstrukturen unter ähnlichen Umständen dramatisch unterschiedlich sein können (in diesem Zusammenhang Lösungsmittelzugänglichkeit).
Die Ergebnisse der Nachbaranalyse werden für die Modellvalidierung, als Werkzeug zur Strukturvorhersage und insbesondere als Leitfaden bei der Suche nach stabilitätsfördernden Mutationen von Nutzen sein.
Methoden
Die verwendeten Sequenzen sind eine Teilmenge des 25%igen Sequenzidentitätssatzes nicht homologer Strukturen ( Hobohm et al., 1992 ; Hobohm und Sander, 1994) aus der Proteinstrukturdatenbank PDB ( Bernstein et al., 1977 ). Es wurden nur einkettige Proteinsequenzen verwendet. Der resultierende Datensatz bestand aus 336 einkettigen Sequenzen mit einer maximalen paarweisen Sequenzidentität von 25%. Die Teilmenge wurde durch die Verwendung der entsprechenden HSSP-Dateien erweitert ( Dodge et al., 1998 ). Der Gesamtdatensatz enthielt 8379 ausgerichtete Sequenzen und 1 415 986 Reste. Dies entspricht 6,7% aller Rückstände in der Version 34 von SWISS-PROT ( Bairoch und Apweiler, 1997 ). Die Länge der Sequenzen lag zwischen 64 und 1017 Resten. Die Auflösung der verwendeten Röntgenstrukturen variierte zwischen 1,0 und 3,0 Å mit durchschnittlich 2,0 Å. Ferner enthielt die Teilmenge 31 durch NMR gelöste Strukturen. Alle Wasserstoffatomkoordinaten wurden jedoch verworfen. Um eine mögliche Verzerrung durch die Verwendung der homologen Sequenzen zu überprüfen, wurde die vollständige Analyse mit und ohne die alignierten Sequenzen durchgeführt. Es wurden keine signifikanten Unterschiede beobachtet, obwohl die reduzierte Größe des kleineren der beiden Datensätze erwartungsgemäß zu mehr Rauschen führte.
Die räumlichen Nachbarn jedes Rückstands wurden basierend auf Lösungsmittelzugänglichkeit und räumlicher Entfernung bestimmt. Die Lösemittelzugänglichkeit wurde den jeweiligen HSSP-Dateien entnommen (Dodge et al., 1998 ). Für jeden Oberflächenrest wurden die benachbarten Oberflächenreste nach ihrem Abstand zu dem betreffenden Rückstand gruppiert. Der Abstand zwischen zwei Resten wurde als der kürzeste Abstand zwischen der Menge aller möglichen Atompaare in den beiden Resten berechnet. Wir gehen davon aus, dass die Ausrichtung in der HSSP-Datei impliziert, dass Nachbarn in der Hauptsequenz auch Nachbarn in den ausgerichteten Sequenzen sind und dass die Lösungsmittelzugänglichkeit erhalten bleibt ( Andrade et al., 1998 ; Goldman et al., 1998 ). Die zu erwartende Anzahl von Nachbarinteraktionen zwischen Resten vom Typ i und j wird berechnet durch
1
wobei xi und xj der Anteil der Aminosäure i und j im Datensatz für den Entfernungsbereich d und bei einer Lösemittelzugänglichkeit größer als der Grenzwert ACC und N0 die Gesamtzahl der beobachteten Nachbarkontakte sind. Die Punktzahl, Sij / d, ACC , wird berechnet durch
2
Dies ergibt eine negative Punktzahl für benachteiligte Nachbarpaare und eine positive Punktzahl für bevorzugte Interaktionen. Der Score-Wert Sij/d,ACC kann durch Multiplikation mit RT in einen scheinbaren thermodynamischen Parameter transformiert werden.
Die Nettoladung in jeder Schicht des Proteins wurde berechnet. Asparaginsäure und Glutaminsäure gelten als negativ geladen und Arginin und Lysin als positiv geladen. Histidin wird entweder als ungeladen oder positiv geladen angesehen. Die relative Nettoladung Δ qrel definieren wir als
3
wobei Npositiv die Anzahl der positiven Reste, nnegativ die Anzahl der negativen Reste und NTotal die Gesamtzahl der Reste in dieser bestimmten Schicht ist.
The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2 dkb, 1 gpl, 1 csh, 4 enl, 1 pmi, 1 lgr, 1 nhp, 1 gcb, 1 bp1, 1 geo, 2 bnh, 3 grs, 1 gln, 1 gai, 2 pgd, 2 cae, 2 aaa, 1 byb, 1smd, 2 myr, 3 cox, 1 dpe, 1 pkm, 1 ayl, 1 crl, 1 ctn, 1 clc, 1tyv, 2cas, 1ecl, 1oxy, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo und 1kcw.
Ergebnisse und Diskussion
Die Verteilung der geladenen Reste in verschiedenen Schichten der Protein-3D-Struktur und die gesamte Nettoladung sind in Abbildung 1 dargestellt. In den innersten und äußersten Teilen von Proteinen gibt es eine negative Nettoladung, während die Mitte eine positive Nettoladung hat. Interessant ist diese scheinbare Dreischichtstruktur mit wechselnder Ladung, die die negativ geladene äußerste Schicht dem Lösungsmittel aussetzt. Eine solche Organisation sichert ein gewisses Maß an radialer Ladungsneutralisation und kann möglicherweise zu einer engen Packung des Proteins beitragen. Ebenso könnte diese Ladungsorganisation der Oberflächenschicht eine wichtige elektrostatische Führung während des Faltvorgangs liefern. Umgekehrt destabilisiert die Änderung des pH-Werts zu sauren oder alkalischen Bedingungen, bei denen Teilmengen der titrierbaren Rückstände ungeladen werden, die Packung der Rückstände an der Oberfläche des Proteins. Saure Aminosäuren können jedoch in mehreren verschiedenen Proteinstrukturen vorkommen und diese Reste spielen beispielsweise in Trypsin eine wichtige funktionelle Rolle ( McGrath et al., 1992 ), Ribonuklease T1 ( Giletto und Pace, 1999 ) und Thioredoxin ( Dyson et al., 1997 ; Bhavnani et al., 2000 ). Die berichtete Dreischichtstruktur wird sowohl mit als auch ohne die ausgerichtete Sequenz beobachtet und wird daher nicht durch eine Vorspannung verursacht, die durch die Erhaltung der vergrabenen, geladenen Gruppen innerhalb einer Proteinfamilie eingeführt wird.
Die räumlichen Nachbarn um jede Art von Rückstand wurden ohne Diskriminierung hinsichtlich der Lösemittelzugänglichkeit berechnet. Mit den bemerkenswerten Ausnahmen von Tryptophan und Cystein wurden Aminosäuren nicht häufig als räumliche Nachbarn identischer Resttypen beobachtet. Dieser Trend hing nicht von der Wahl des Abstandsgrenzwerts ab (Ergebnisse nicht dargestellt). Die Unterschiede in der Verteilung waren bemerkenswert klein zwischen den verschiedenen Aminosäuren für einen 8 Å Abstand Cut-off, was darauf hindeutet, dass 8 Å ein groß genug Abstand für die Verteilung unabhängig von der Art des zentralen Rests zu werden. Diese Beobachtung führte zur Verwendung von 8 Å als größtem Abstand zwischen den im Detail untersuchten Nachbarn.
Abbildung 2 zeigt die Score-Werte für alle Aminosäure-Nachbarpaare mit Tryptophan, Glycin, Alanin, Prolin, Serin, Histidin, Lysin und Asparaginsäure für Nachbarpaare mit mindestens 20% Lösungsmittelzugänglichkeit. Die Ergebnisse zu den anderen Aminosäuren finden Sie auf unserer Homepage ( http://www.bio.auc.dk/ ). Score-Werte wurden ähnlich für andere Lösungsmittel Zugänglichkeit Cut-offs berechnet. Der aromatische Rest Tryptophan ist einer von nur zwei Resten, die eine klare Präferenz für Kontakte mit dem gleichen Rückstandstyp zeigen (der andere ist Cystein). Auch Wechselwirkungen mit den anderen aromatischen Resten sind bevorzugt. Interessanterweise scheinen die Wechselwirkungen zwischen Tryptophan und den beiden sauren Resten (Asparaginsäure und Glutaminsäure) unterschiedlich zu sein. Während Tryptophan und Glutaminsäure seltener als erwartet beobachtet werden, wird bei Tryptophan und Asparaginsäure das Gegenteil beobachtet. Glycin zeigt den typischen negativen Wert für Wechselwirkungen mit demselben Rückstandstyp. Glycin scheint auch keine Nachbarn in der nahen räumlichen Nachbarschaft zu haben (≤3,5 Å). Diese Unterrepräsentation der Nachbarn in der Nähe ist für proline noch deutlicher. Wir interpretieren diese Unterrepräsentation als Zeichen der Präferenz für Schleife, die Prolinreste haben. Das Fehlen von Wechselwirkungen mit allen anderen Aminosäuren in seiner Nähe deutet darauf hin, dass die meisten Kontakte mit Lösungsmittelmolekülen bestehen. Proline hat jedoch eine Fülle von Kontakten in einem größeren Abstand (4-5 Å). Histidin ist insofern interessant, als es Anzeichen seiner aromatischen Eigenschaften durch bevorzugte Kontakte mit aromatischen Resten (~ 3,5 Å) und seiner Polarisierbarkeit durch bevorzugte Kontakte mit den negativ geladenen Resten (~ 3 Å) zeigt. Die basische Aminosäure Lysin weist erwartungsgemäß einen deutlich negativen Score für Kontakte mit anderen Lysinen auf. Die günstigen elektrostatischen Wechselwirkungen mit den sauren Aminosäuren sind evident.
Einige der interessantesten Paarwechselwirkungen sind in Abbildung 3 dargestellt . Abbildung 3A zeigt das Salzbrückenpaar Lysin-Asparaginsäure. Die starke Überrepräsentation bei 3 Å Trennung steht im Einklang mit dem klassischen Salzbrückenkonzept. Die Überrepräsentation von Lysin-Asparaginsäure–Paaren in den meisten lösungsmittelbelichteten Schichten, die bei 5,5 bis 6 Å beobachtet wurden, ist unerwartet. Wir schlagen vor, dass Ladungsnetzwerke auf der Proteinoberfläche diese Beobachtung verursachen könnten. In Abbildung 3B ist das Ergebnis für das Glutaminsäure-Asparaginsäure-Paar dargestellt. Das offensichtlichste Merkmal ist die erwartete Unterrepräsentation dieses Paares. In der Nähe der Proteinoberfläche scheint die gleiche Einschränkung jedoch nicht vorhanden zu sein. Auch hier schlagen wir vor, dass Oberflächenladungsnetzwerke zu dieser Beobachtung beitragen. In den Abbildungen 3C und D sind die Aminosäurepaare Tryptophan–Glutaminsäure und Tryptophan–Asparaginsäure dargestellt. Der allgemeine Glaube, dass eine Glutaminsäure-Asparaginsäure-Mutation konservativ ist, widerspricht den gezeigten Beobachtungen. Das Tryptophan-Glutaminsäure-Paar ist in den stark lösungsmittelbelichteten Schichten der Proteine stark unterrepräsentiert. Überraschenderweise kann das gleiche nicht für das Tryptophan–Asparaginsäure-Paar gesagt werden, wo eine Überrepräsentation für das Entfernungsintervall von 3,5 bis 6 Å beobachtet wird. Ähnliche, aber weniger ausgeprägte Beobachtungen wurden für die Tyrosin–Glutaminsäure– und Tyrosin-Asparaginsäure-Paare gemacht. Es wurden keine signifikanten Unterschiede zwischen den Phenylalanin–Glutaminsäure– und Phenylalanin-Asparaginsäure-Paaren beobachtet. Der einzige Unterschied zwischen der Glutaminsäure und der Asparaginsäure ist die Länge der Seitenkette. Tryptophan und Tyrosin gemeinsam ist ihre Polarisationsfähigkeit, im Gegensatz zu Phenylalanin. Wir glauben, dass oberflächlich lokalisierte Tryptophane, die an der Definition der Proteinfunktionalität beteiligt sind, durch ihre lokale elektrostatische Umgebung polarisiert sind. Obwohl wir keine quantitative Erklärung liefern können, ist es plausibel, dass die Unterschiede zwischen der unterschiedlichen Kettenlänge von Glutaminsäure und Asparaginsäure die Nähe zu Tryptophan bevorzugen. Es wurde gezeigt, dass Asparaginsäure eine Tendenz zu günstigen Wechselwirkungen zwischen der Seitenketten-Carbonylgruppe und der Rückgrat-Carbonylgruppe aufweist ( Deane et al., 1999), was zu einer ringartigen Struktur führt. Ähnliche Konformationen wurden für Glutaminsäure nicht beobachtet. In den Abbildungen 3E und F sind die Histidin–Asparaginsäure– und Serin-Histidin-Paare dargestellt. Da diese drei Reste die aktiven Standortreste einer breiten Palette von Hydrolasen darstellen, haben sie ein besonderes Interesse. Es gibt eine Überrepräsentation von Histidin-Asparaginsäure-Paaren in den stark lösungsmittelzugänglichen Bereichen. Der Abstand ist größer als der typische Abstand, der in aktiven Standortspalten beobachtet wird. Die geringe, aber signifikante Überrepräsentation im 3 Å-Bereich entspricht jedoch den klassischen Histidin-Asparaginsäure-Abständen in Hydrolasen. Abbildung 3E zeigt die klare Präferenz für Kontakte zwischen vergrabenen Histidinen und Asparaginsäuren. Wir glauben, dass dieses Merkmal ein wichtiger Teil der molekularen Evolution von De-Novo-katalytischen Stellen ist. Die Speicherung möglicher katalytischer ‘Triaden’ in nicht funktionellen Umgebungen verringert die Anzahl der Aminosäuresubstitutionen, die zur Aktivierung der Stelle erforderlich sind.
Das auffälligste Merkmal in Abbildung 3F ist die deutliche Unterrepräsentation von Serin-Histidin-Paaren in stark lösungsmittelexponierten Umgebungen. Eine schwache Überrepräsentation des Serin-Histidin-Paares ist bei 3 Å in den weniger Lösungsmittel zugänglichen Bereichen zu sehen. Somit wird die Anwesenheit der katalytischen Triade offenbar hauptsächlich durch die Präferenz des Histidin–Asparaginsäure-Paares bestimmt, obwohl das Serin-Histidin-Paar ähnliche, aber viel schwächere Trends zeigt.
Die Aminosäurezusammensetzung jeder Lösungsmittelzugänglichkeitsschicht wurde bestimmt. Wie erwartet bestehen die vergrabenen Teile der Proteine aus einer höheren Menge an unpolaren Resten als die stärker lösungsmittelbelichteten Schichten. Die Korrelation zwischen der Aminosäurezusammensetzung wurde aus den Daten der Zusammensetzung der einzelnen Strukturschichten berechnet. Es wird erwartet, dass Aminosäuren, die ähnliche Präferenzen für den Kontakt mit Lösungsmitteln und die lokale Umgebung haben, aufgrund ähnlicher Trends in ihrer Verteilung eine hohe positive Korrelation aufweisen. Daher haben Aminosäuren, die eine negative Korrelation aufweisen, unterschiedliche Präferenzen für die lokale Umgebung und werden daher nicht als kompatibel angesehen, d. H. Eine Mutation an einer einzigen Stelle dieses Typs an dieser Stelle wird nicht empfohlen. Da die unpolaren Reste im Kern reichlich vorhanden sind und mit zunehmender Zugänglichkeit des Lösungsmittels allmählich abnehmen, ist die Korrelation zwischen den unpolaren Resten im Allgemeinen positiv (Abbildung 4). Im Gegensatz dazu sind die polaren Reste in den stark exponierten Teilen häufiger und daher negativ mit den unpolaren Resten korreliert. Histidin und Threonin verhalten sich deutlich unterschiedlich. Sie zeigen eine positive Korrelation zueinander, aber wenig Korrelation mit einer der anderen Säulen, mit Ausnahme von Arginin und Glycin. Dies wird durch das geringe Vorkommen von Histidin und Threonin sowohl in den vergrabenen als auch in den stark exponierten Bereichen und ihr relativ hohes Vorkommen in den mittelbelichteten Schichten verursacht. Histidin hat eine positive Korrelation mit zwei aromatischen Resten, Tryptophan und Tyrosin, und mit dem schwach polaren Threonin und dem polaren Arginin. Auch hier interpretieren wir dies als Zeichen sowohl der aromatischen Eigenschaften als auch der Ladungseigenschaften von Histidin. Die schwach polaren Reste weisen nicht die gleiche deutliche Ähnlichkeit in der Verteilung auf wie die polaren und unpolaren Reste. Prolin und Serin scheinen enger mit den polaren Resten verwandt zu sein. Der schwach polare Rest Alanin weist nur mit den unpolaren Resten eine positive Korrelation auf. Wir schlagen vor, dass Mutationen zwischen Resten mit hoher positiver Korrelation eine hohe Chance haben, die thermodynamische Stabilität der 3D-Struktur aufrechtzuerhalten. Dies gilt insbesondere für geladene Rückstände. Im Gegensatz dazu sind die Reste mit einem hohen Grad an negativer Korrelation typischerweise Reste mit unterschiedlichen physikalisch-chemischen Eigenschaften, die nicht ausgetauscht werden können, ohne die physikalische Chemie des Proteins zu verändern. Bei den nicht korrelierten Resten handelt es sich um Reste mit einer besonderen Rolle in der Struktur, z. B. einige Reste, die häufig an der Katalyse beteiligt sind. Wir glauben, dass die Beobachtung, dass sich Prolin in unserer Studie ähnlich wie polare Reste verhält, mit der strukturellen Rolle von Prolinresten und ihrer Präferenz für Schleifen und Windungen zusammenhängt. Das Alanin-Screening, das häufig in Protein-Engineering-Projekten verwendet wird, beinhaltet die Substitution von Rückständen durch Alanin, basierend auf der Annahme, dass Alanin ein `neutraler’ Rest ist. Unsere Daten zeigen jedoch, dass Alanin eine hohe negative Korrelation mit allen außer den unpolaren Resten aufweist. Wir schlagen daher die Verwendung von beispielsweise Serin als Ersatz für die Reste vor, die negativ mit Alanin korrelieren.
Nach Ansicht der Autoren liefert die vorliegende Arbeit wichtige neue Informationen über die Strukturorganisation von Proteinen. Die Proteinoberfläche sollte als mehrschichtiges Strukturmerkmal des Proteins angesehen werden, wobei jede Schicht ihre spezifische Zusammensetzung und die daraus resultierenden Eigenschaften aufweist. Wir glauben, dass diese einfache Schlüsselbeobachtung für viele Protein-Engineering-Strategien, die auf die Modifikation von lösungsmittelexponierten Rückständen abzielen, von erheblicher Bedeutung sein wird.
Die relative Nettoladung in Schichten von Proteinstrukturen mit unterschiedlicher Lösungsmittelzugänglichkeit (ACC). Die relative Nettoladung ist definiert als die Nettoladung pro Rest in einer bestimmten Schicht (Anzahl positiver Ladungen – Anzahl negativer Ladungen / Anzahl Reste). Asparaginsäure und Glutaminsäure gelten als negativ, Arginin, Lysin und protoniertes Histidin als positiv (gepunktete Linie). Die durchgezogene Linie umfasst alle oben genannten Reste außer Histidin.
Die relative Nettoladung in Schichten von Proteinstrukturen mit unterschiedlicher Lösungsmittelzugänglichkeit (ACC). Die relative Nettoladung ist definiert als die Nettoladung pro Rest in einer bestimmten Schicht (Anzahl positiver Ladungen – Anzahl negativer Ladungen / Anzahl Reste). Asparaginsäure und Glutaminsäure gelten als negativ, Arginin, Lysin und protoniertes Histidin als positiv (gepunktete Linie). Die durchgezogene Linie umfasst alle oben genannten Reste außer Histidin.
Die deutlich über- oder unterrepräsentierten Nachbarpaare. Alle Rückstände haben eine Lösemittelzugänglichkeit von mehr als 20%. Der Abstand in Å zwischen den Resten ist entlang der vertikalen Achse angegeben. Rot und Grün repräsentieren Bereiche, in denen die Anzahl der Paare geringer bzw. höher als erwartet ist. (A) Tryptophan; (B) Glycin; (C) Prolin; (D) Histidin; (E) Lysin; (F) Asparaginsäure.
Die deutlich über- oder unterrepräsentierten Nachbarpaare. Alle Rückstände haben eine Lösemittelzugänglichkeit von mehr als 20%. Der Abstand in Å zwischen den Resten ist entlang der vertikalen Achse angegeben. Rot und Grün repräsentieren Bereiche, in denen die Anzahl der Paare geringer bzw. höher als erwartet ist. (A) Tryptophan; (B) Glycin; (C) Prolin; (D) Histidin; (E) Lysin; (F) Asparaginsäure.
Über- und unterrepräsentierte Nachbarpaare als Funktion von Lösungsmittelzugänglichkeit (ACC) und Entfernung (Å). Der Abstand zwischen den Rückständen ist entlang der vertikalen Achse und der Lösungsmittelzugänglichkeit entlang der horizontalen Achse angegeben. (A) Lysin-Asparaginsäure; (B) Glutaminsäure-Asparaginsäure; (C) Tryptophan-Glutaminsäure; (D) Tryptophan–Asparaginsäure; (E) Histidin–Asparaginsäure; (F) Serin–Histidin.
Über- und unterrepräsentierte Nachbarpaare als Funktion von Lösungsmittelzugänglichkeit (ACC) und Entfernung (Å). Der Abstand zwischen den Rückständen ist entlang der vertikalen Achse und der Lösungsmittelzugänglichkeit entlang der horizontalen Achse angegeben. (A) Lysin–Asparaginsäure; (B) Glutaminsäure–Asparaginsäure; (C) Tryptophan–Glutaminsäure; (D) Tryptophan–Asparaginsäure; (E) Histidin–Asparaginsäure; (F) Serin–Histidin.
Korrelation zwischen der Verteilung von Aminosäuren in Proteinen. Die Korrelation wird basierend auf der Aminosäurezusammensetzung der verschiedenen Schichten der Zugänglichkeitsschicht der Proteinstruktur berechnet. Die grünen Bereiche stellen eine positive Korrelation dar, während die roten Bereiche eine negative Korrelation darstellen. Bereiche mit geringem Korrelationsgrad sind weiß.
Korrelation zwischen der Verteilung von Aminosäuren in Proteinen. Die Korrelation wird basierend auf der Aminosäurezusammensetzung der verschiedenen Schichten der Zugänglichkeitsschicht der Proteinstruktur berechnet. Die grünen Bereiche stellen eine positive Korrelation dar, während die roten Bereiche eine negative Korrelation darstellen. Bereiche mit geringem Korrelationsgrad sind weiß.
An wen die Korrespondenz gerichtet sein sollte. E-Mail-Adresse: [email protected]
P.H.J. dankt dem Norwegischen Forschungsrat für die finanzielle Unterstützung (NFR-116316/410). S.B.P. bedankt sich für die finanzielle Unterstützung von Obelsk Familiefond sowie Mål-2.
Andrade,M.A., O’Donoghue,S.I. und Rost,B. (
)
,
,
–525.
Bairoch,A. und Apweiler,R. (
)
,
,
-36.
Bernstein,F.C., Koetzle,T.F., Williams,G.J., Meyer,E.E.,Jr., Brice,M.D., Rodgers,J.R., Kennard,O., Shimanouchi,T. und Tasumi,M. (
)
,
,
–542.
Bhavnani,M., Lloyd,D., Bhattacharyya,A., Marples,J., Elton,P. und Worwood,M. (
)
,
,
-710.
Brocchieri,L. und Karlin,S. (
)
,
,
-12140.
Bryant,S.H. und Amzel,L.M. (
)
,
,
-52.
Burley,S.K. und Petsko,G.A. (
)
,
,
-28.
Chandonia,J.M. und Karplus,M. (
)
,
,
-306.
Chothia,C. (
)
,
,
–14.
Chou,P.Y. und Fasman,G.D. (
)
,
,
–276.
Deane,C.M., Allen,F.H., Taylor,R. und Blundell,T.L. (
)
,
,
–1028.
Dodge,C., Schneider,R. und Sander,C. (
)
,
,
–315.
In den folgenden Jahren wurden die Ergebnisse der Studie veröffentlicht: Donnelly,D., Overington,J.P. and Blundell,T.L. (
)
,
,
–653.
Dyson,H.J., Jeng,M.F., Tennant,L.L., Slaby,I., Lindell,M., Cui,D.S., Kuprin,S. und Holmgren,A. (
)
,
,
-2636.
Giletto,A. und Pace,C.N. (
)
,
,
-13384.
Goldman,N., Thorne,J.L. und Jones,D.T. (
)
,
,
-458.
Golovanov,A.P., Volynsky,P.E., Ermakova,S.B. und Arseniev,A.S. (
)
,
,
–40.
Hobohm,U. und Sander,C. (
)
,
,
–524.
Hobohm,U., Scharf,M., Schneider,R. und Sander,C. (
)
,
,
–417.
Holbrook,S.R., Muskal,S.M. und Kim,S.H. (
)
,
,
–665.
In: Jones,D.T. (
)
,
,
–202.
McGrath,M.E., Vasquez,J.R., Craik,C.S., Yang,A.S., Honig,B. und Fletterick,R.J. (
)
,
,
-3064.
Müller,S., Janin,J., Lesk,A.M. und Chothia,C. (
)
,
,
–656.
Miyazawa,S. und Jernigan,R.L. (
)
,
,
–278.
Miyazawa,S. und Jernigan,R.L. (
)
,
,
–644.
Miyazawa,S. und Jernigan,R.L. (
)
,
,
-356.
Mucchielli-Giorgi,M.H., Tuffery,P. und Hazout,S. (
)
,
,
–193.
Es sind keine frei zugänglichen ergänzenden Materialien verfügbar Zitationen Overington,J., Donnelly,D., Johnson,MS, SŠali,A. and Blundell,T.L. (
)
,
,
–226.
Petersen,M.T.N., Jonson,P.H. und Petersen,S.B. (
)
,
,
–548.
Petersen,S.B., Jonson,P.H., Fojan,P., Petersen,E.I., Petersen,M.T.N., Hansen,S., Ishak,R.J. und Hough,E. (
)
,
,
–26.
Rost,B. und Sander,C. (
)
,
,
-226.
Thompson,M.J. und Goldstein,R.A. (
)
,
,
-47.
Vonderviszt,F., Mátrai,G. und Simon,I. (
)
,
,
-492.
Wako,H. und Blundell,T.L. (
)
,
,
-708.
Wojcik,J., Mornon,J.P. und Chomilier,J. (
)
,
,
-1490.