en kritisk syn på konservativa mutationer
Abstrakt
genom att analysera ytkompositionen av en uppsättning protein 3D-strukturer, kompletterad med förutsagd ytkompositionsinformation för homologa proteiner, har vi funnit signifikanta bevis för en lagerkomposition av proteinstrukturer. I de innersta och yttersta delarna av proteiner finns en netto negativ laddning, medan mitten har en netto positiv laddning. Dessutom indikerar våra resultat att begreppet konservativ mutation behöver betydande revidering, t.ex. mycket olika rumsliga preferenser hittades för glutaminsyra och asparaginsyra. Den alaninscreening som ofta används i proteintekniska projekt innebär substitution av rester till alanin, baserat på antagandet att alanin är en `neutral’ Rest. Alanin har emellertid en hög negativ korrelation med alla utom de icke-polära resterna. Vi föreslår därför användning av till exempel serin som ersättning för rester som är negativt korrelerade med alanin.
introduktion
vid vikning av en peptidkedja i en 3D-proteinstruktur överförs vissa rester från en polär miljö till en mer icke-polär miljö i det inre av det vikta proteinet. Denna överföring drivs av de termodynamiska egenskaperna hos aminosyrorna och lösningsmedlet. Under hela molekylär evolution naturen har valt för lämplig funktion och stabilitet av det resulterande proteinet. För små till medelstora proteiner – i den vikta strukturen-är bara några få rester helt begravda (Chothia, 1976 ; Miller et al., 1987; Petersen et al., 1998), medan de flesta rester endast är delvis begravda. Variationen i lösningsmedelstillgänglighet är beroende av egenskaperna hos återstoden i fråga och återspeglas i aminosyrasammansättningen genom hela proteinstrukturen. Dessa skillnader i lösningsmedelstillgänglighetsprofilen har funnit breda tillämpningar i olika strukturprediktionsmetoder ( Holbrook et al., 1990 ; Rost och Sander, 1994; Thompson och Goldstein, 1996 ). Också användningen av miljöspecifika substitutionsmatriser ( Donnelly et al., 1994; Wako och Blundell , 1994) har visat sig vara värdefulla. Den sekventiella grannskapet av aminosyror har undersökts tidigare (Vonderviszt et al., 1986) och dess användning har hittats i till exempel loop prediction ( Wojcik et al., 1999) och sekundär struktur förutsägelse ( Chou och Fasman, 1978 ; Chandonia och Karplus, 1999 ; Jones, 1999). Ingen signifikant korrelation mellan rester Sekventiell grannpreferens upptäcktes.
det rumsliga grannskapet kring enskilda rester har också tidigare undersökts (Burley och Petsko, 1985 ; Bryant och Amzel, 1987 ; Miyazawa och Jernigan, 1993 ; Petersen et al., 1999 ). Vidare har rumsliga kontakter studerats för att härleda kontaktpotentialer för de olika aminosyrainteraktionerna ( Brocchieri och Karlin, 1995 ; Miyazawa och Jernigan, 1996 , 1999 ). Den gemensamma strategin är att studera antalet kontakter inom ett visst avstånd cut-off. Litteraturen verkar emellertid sakna undersökningar av distansberoende kontakter och även rapporter som använder den inbäddade informationen om lösningsmedelstillgängligheten hos de berörda resterna.
en två-tillståndsprognos av lösningsmedelstillgänglighetskorrelation mellan hydrofobicitet, begravd kontaktbenägenhet och platsen i prediktionsfönstret har rapporterats ( Mucchielli-Giorgi et al., 1999 ). Det beskriver emellertid inte någon korrelation mellan enskilda restfördelningar.
det är viktigt att kunna skilja mellan korrekt vikta och felveckade modellstrukturer. Det har påpekats att potentiella energibaserade metoder inte diskriminerar väl mellan vikta och felveckade strukturer. Men strukturella egenskaper som begravd polär yta ( Overington et al., 1992) och antal polära kontakter ( Bryant och Amzel, 1987 ; Golovanov et al., 1999) har visat sig vara värdefulla.
i proteinteknik används begreppet konservativa mutationer ofta. Den allmänna tanken är att en substitution av en aminosyra med en annan aminosyra med liknande fysikalisk-kemiska egenskaper inte påverkar proteinets stabilitet och funktion. Föreliggande papper visar att de rumsliga preferenser för liknande rester kan vara dramatiskt olika i proteinstrukturer under liknande omständigheter (i detta sammanhang lösningsmedelstillgänglighet).
resultaten av grannanalysen kommer att vara värdefulla vid modellvalidering, som ett verktyg för strukturförutsägelse och särskilt som en guide i sökandet efter stabilitetsförbättrande mutationer.
metoder
sekvenserna som används är en delmängd av 25% sekvensidentitetsuppsättningen av icke-homologa strukturer ( Hobohm et al., 1992 ; Hobohm och Sander, 1994) härledd från proteinstrukturdatabasen PDB ( Bernstein et al., 1977 ). Endast enkelkedjiga proteinsekvenser användes. Den resulterande datauppsättningen bestod av 336 enkelkedjiga sekvenser med en maximal parvis sekvensidentitet på 25%. Delmängden utvidgades genom användning av motsvarande HSSP-filer ( Dodge et al., 1998 ). Den totala datamängden innehöll 8379 inriktade sekvenser och 1 415 986 rester. Detta motsvarar 6, 7% av alla rester i version 34 av SWISS-PROT ( Bairoch och Apweiler, 1997 ). Längden på sekvenserna var mellan 64 och 1017 rester. Upplösningen av de använda Röntgenstrukturerna varierade mellan 1, 0 och 3, 0 kg, med i genomsnitt 2, 0 kg. Vidare innehöll delmängden 31 strukturer lösta av NMR. Emellertid kasserades alla väteatomkoordinater. För att kontrollera om en eventuell förspänning infördes genom användning av de homologa sekvenserna gjordes den fullständiga analysen med och utan de inriktade sekvenserna. Inga signifikanta skillnader observerades, även om den minskade storleken på de mindre av de två datasätten, som förväntat, gav upphov till mer buller.
de rumsliga grannarna för varje Rest bestämdes baserat på lösningsmedelstillgänglighet och rumsligt avstånd. Lösningsmedelstillgängligheten togs från respektive HSSP-filer (Dodge et al., 1998 ). För varje restyta grupperades de närliggande resthalterna efter deras avstånd till restsubstansen i fråga. Avståndet mellan två rester beräknades som det kortaste avståndet mellan uppsättningen av alla möjliga par atomer i de två resterna. Vi antar att inriktningen i HSSP-filen innebär att grannar i huvudsekvensen också är grannar i de inriktade sekvenserna och att lösningsmedelstillgängligheten bevaras ( Andrade et al., 1998; Goldman et al., 1998 ). Det förväntade antalet granninteraktioner mellan rester av typ i och j beräknas med
1
där xi och xj är fraktionen av aminosyran i och j i datauppsättningen för avståndsområdet d och vid en lösningsmedelstillgänglighet större än cut-off ACC och N0 är det totala antalet observerade grannkontakter. Poängen, Sij / D, ACC, beräknas av
2
detta ger en negativ poäng för missgynnade grannpar och en positiv poäng för gynnade interaktioner. Poängvärdet Sij / D, ACC kan omvandlas till en uppenbar termodynamisk parameter genom multiplikation med RT .
nettoladdningen i varje lager av proteinet beräknades. Asparaginsyra och glutaminsyra anses vara negativt laddade och arginin och lysin anses vara positivt laddade. Histidin betraktas antingen som oladdad eller positivt laddad. Den relativa nettoavgiften , Qrel, definierar vi som
3
där Npositiv är antalet positiva restsubstanser, Nnegativ antalet negativa restsubstanser och NTotal det totala antalet restsubstanser i det aktuella skiktet.
The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2cae, 2aaa, 1byb, 1smd, 2myr, 3cox, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oxy, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo och 1kcw.
resultat och diskussion
fördelningen av laddade rester i olika lager av protein 3D-strukturen och den totala nettoladdningen visas i Figur 1 . I de innersta och yttersta delarna av proteiner finns en netto negativ laddning, medan mitten har en netto positiv laddning. Denna uppenbara treskiktsstruktur med alternerande laddning som utsätter det negativt laddade yttersta skiktet för lösningsmedlet är intressant. En sådan organisation kommer att säkerställa en viss nivå av neutralisering av radiell laddning och kan eventuellt bidra till tät förpackning av proteinet. På samma sätt kan denna laddningsorganisation av ytskiktet ge viktig elektrostatisk vägledning under vikningshändelsen. Omvänt kommer förändring av pH till sura eller alkaliska förhållanden vid vilka delmängder av de titrerbara resterna blir oladdade att destabilisera packningen av rester vid proteinets yta. Begravda kan sura aminosyror hittas i flera olika proteinstrukturer och dessa rester spelar viktiga funktionella roller i till exempel trypsin ( McGrath et al., 1992), ribonukleas T1 ( Giletto och Pace, 1999) och tioredoxin ( Dyson et al., 1997; Bhavnani et al., 2000 ). Den rapporterade treskiktsstrukturen observeras både med och utan den inriktade sekvensen och orsakas därför inte av en bias som införs genom bevarande av de begravda, laddade grupperna inom en proteinfamilj.
de rumsliga grannarna runt varje typ av rester beräknades utan diskriminering för lösningsmedelstillgänglighet. Med de anmärkningsvärda undantagen av tryptofan och cystein observerades inte aminosyror ofta som rumsliga grannar till identiska resttyper. Denna trend var inte beroende av valet av avståndsavstängning (resultat visas inte). Skillnaderna i fördelning var anmärkningsvärt små mellan de olika aminosyrorna för en avståndsavstängning på 8 kg, vilket tyder på att 8 kg är tillräckligt stort för att fördelningen ska bli oberoende av den centrala återstoden. Denna iakttagelse ledde till att 8 kg användes som det största avståndet mellan grannländerna som undersöktes i detalj.
Figur 2 visar poängvärdena för alla aminosyragrannpar som involverar tryptofan, glycin, alanin, prolin, serin, histidin, lysin och asparaginsyra för grannpar med minst 20% lösningsmedelstillgänglighet. Resultaten för de andra aminosyrorna finns på vår hemsida (http://www.bio.auc.dk/). Poängvärden har beräknats på samma sätt för andra lösningsmedelstillgänglighet cut-offs. Den aromatiska återstoden tryptofan är en av endast två rester som visar en tydlig preferens för kontakter med samma resttyp (den andra är cystein). Även interaktioner med de andra aromatiska resterna föredras. Intressant verkar interaktionerna mellan tryptofan och de två sura resterna (asparaginsyra och glutaminsyra) olika. Medan tryptofan och glutaminsyra observeras mindre ofta än förväntat, observeras motsatsen för tryptofan och asparaginsyra. Glycin visar den typiska negativa poängen för interaktioner med samma resttyp. Glycin verkar inte heller ha grannar i det nära rumsliga grannskapet(3,5 2BG). Denna underrepresentation av grannar i närheten är ännu tydligare för proline. Vi tolkar denna underrepresentation som ett tecken på preferensen för slinga som prolinrester har. Bristen på interaktioner med alla andra aminosyror i dess närhet pekar på att de flesta kontakter är med lösningsmedelsmolekyler. Proline har dock ett överflöd av kontakter på ett större avstånd (4-5 kcal). Histidin är intressant genom att det visar tecken på dess aromatiska egenskaper, genom preferens för kontakter med aromatiska rester (~3,5 kg) och dess polariserbara natur, genom föredragna kontakter med de negativt laddade resterna (~3 kg). Den grundläggande aminosyran lysin har som förväntat en tydlig negativ poäng för kontakter med andra lysiner. De gynnsamma elektrostatiska interaktionerna med de sura aminosyrorna är uppenbara.
några av de mest intressanta parinteraktionerna visas i Figur 3 . Figur 3A visar saltbroparet lysin-asparaginsyra. Den starka överrepresentationen som ses vid 3-separering av kakor överensstämmer med det klassiska saltbrokonceptet. Överrepresentationen av lysin-asparaginsyrapar i de mest lösningsmedelsexponerade skikten som observerats vid 5,5 till 6 Kg är oväntat. Vi föreslår att laddningsnätverk på proteinytan kan orsaka denna observation. I figur 3B visas resultatet för glutaminsyra–asparaginsyraparet. Den mest uppenbara funktionen är den förväntade underrepresentationen av detta par. Men nära proteinytan verkar samma begränsning inte vara närvarande. Återigen föreslår vi att ytbelagda laddningsnätverk bidrar till denna observation. I figurerna 3C och D visas aminosyraparen tryptofan–glutaminsyra och tryptofan–asparaginsyra. Den gemensamma tron att en glutaminsyra till asparaginsyramutation är konservativ strider mot de visade observationerna. Tryptofan-glutaminsyraparet är mycket underrepresenterat i de mycket lösningsmedelsexponerade skikten av proteinerna. Överraskande kan samma sak inte sägas för tryptofan-asparaginsyraparet, där en överrepresentation observeras för avståndsintervallet 3, 5 till 6 kg. Liknande men mindre uttalade observationer gjordes för tyrosin-glutaminsyra och tyrosin–asparaginsyrapar. Inga signifikanta skillnader observerades mellan fenylalanin–glutaminsyra och fenylalanin–asparaginsyrapar. Den enda skillnaden mellan glutaminsyra och asparaginsyra är sidokedjans längd. Gemensamt för både tryptofan och tyrosin är deras polarisbarhet, i motsats till fenylalanin. Vi tror att ytplacerade tryptofaner som är involverade i att definiera proteinfunktionalitet polariseras av deras lokala elektrostatiska miljö. Även om vi inte kan ge en kvantitativ förklaring är det troligt att skillnaderna mellan den olika kedjelängden av glutaminsyra och asparaginsyra kan ge företräde för närheten till tryptofan. Det har visats att asparaginsyra har en tendens att ha gynnsamma interaktioner mellan sidokedjans karbonylgrupp och ryggradskarbonylgruppen ( Deane et al., 1999), vilket resulterar i en ringliknande struktur. Liknande konformationer har inte observerats för glutaminsyra. I figurerna 3E och F visas histidin–asparaginsyra och serin–histidinpar. Eftersom dessa tre restsubstanser utgör de aktiva platsresterna av ett brett spektrum av hydrolaser har de särskilt intresse. Det finns en överrepresentation av histidin-asparaginsyrapar i de mycket lösningsmedelsåtkomliga områdena. Avståndet är större än det typiska avståndet som observeras i sprickor på aktiva platser. Emellertid överensstämmer den lilla, men signifikanta, överrepresentationen i 3-Kuborisintervallet med de klassiska histidin–asparaginsyraavstånden i hydrolaser. Figur 3E visar den tydliga preferensen för kontakter mellan begravda histidiner och asparaginsyror. Vi tror att denna funktion är en viktig del av den molekylära utvecklingen av de novo katalytiska platser. Lagring av möjliga katalytiska ‘triader’ i icke-funktionella miljöer gör antalet aminosyrasubstitutioner nödvändiga för att aktivera platsen mindre.
den mest distinkta funktionen i Figur 3F är den tydliga underrepresentationen av serin-histidinpar i mycket lösningsmedelsexponerade miljöer. En svag överrepresentation av serin–histidinparet ses vid 3 msk i de mindre lösningsmedelsåtkomliga områdena. Således bestäms närvaron av den katalytiska triaden tydligen mestadels av preferensen av histidin–asparaginsyraparet även om serin–histidinparet avslöjar liknande men mycket svagare trender.
aminosyrasammansättningen för varje lösningsmedelstillgänglighetsskikt bestämdes. Som förväntat består de begravda delarna av proteinerna av en högre mängd icke-polära rester än de mer lösningsmedelsexponerade skikten. Korrelationen mellan aminosyrakompositionen beräknades utifrån data för sammansättningen av de enskilda strukturella skikten. Aminosyror som har liknande preferenser för lösningsmedelskontakt och lokal miljö förväntas visa en hög positiv korrelation på grund av liknande trender i distributionen. Därför kommer aminosyror som visar negativ korrelation att ha olika preferenser för lokal miljö och tros därför inte vara kompatibla, dvs en enda platsmutation av denna typ på denna plats rekommenderas inte. Eftersom de icke-polära resterna är rikliga i kärnan och visar en gradvis minskning när lösningsmedelstillgängligheten ökar i allmänhet är korrelationen mellan de icke-polära resterna positiv (Figur 4 ). Däremot är de polära resterna rikligare i de mycket exponerade delarna och är därför negativt korrelerade med de icke-polära resterna. Histidin och treonin beter sig markant annorlunda. De visar positiv korrelation med varandra, men liten korrelation med någon av de andra kolumnerna, med undantag av arginin och glycin. Detta orsakas av den låga förekomsten av histidin och treonin i både de begravda och mycket utsatta områdena och deras relativt höga förekomst i de mediumexponerade skikten. Histidin har positiv korrelation med två aromatiska rester, tryptofan och tyrosin, och med den svagt polära treonin och den polära argininen. Återigen tolkar vi detta som ett tecken på både de aromatiska egenskaperna och laddningsegenskaperna hos histidin. De svagt polära resterna har inte samma tydliga likhet i fördelningen som de polära och icke-polära resterna. Prolin och serin verkar vara närmare besläktade med de polära resterna. Den svagt polära återstoden alanin har positiv korrelation endast med de icke-polära resterna. Vi föreslår att mutationer mellan rester med hög positiv korrelation har stor chans att upprätthålla 3D-strukturens termodynamiska stabilitet. Detta gäller särskilt för laddade rester. Däremot är resterna med en hög grad av negativ korrelation vanligtvis rester med olika fysikalisk-kemiska egenskaper, som inte kan bytas ut utan att ändra proteinets fysikaliska Kemi. De icke-korrelerade resterna involverar rester med en särskild roll i strukturen, t.ex. vissa rester som ofta är involverade i katalys. Vi tror att observationen att prolin i vår studie beter sig på samma sätt som polära rester är relaterad till den strukturella rollen som prolinrester och dess preferens för slingor och svängar. Den alaninscreening som ofta används i proteintekniska projekt innebär substitution av rester till alanin, baserat på antagandet att alanin är en `neutral’ Rest. Våra data visar dock att alanin har en hög negativ korrelation med alla utom de icke-polära resterna. Vi föreslår därför användning av till exempel serin som ersättning för rester som är negativt korrelerade med alanin.
i författarnas åsikt ger detta dokument viktig ny information om proteinstrukturorganisation. Proteinytan bör ses som en flerskiktad strukturell egenskap hos proteinet, där varje skikt har sin specifika sammansättning och resulterande egenskaper. Denna enkla nyckelobservation tror vi kommer att vara av stor betydelse för många proteintekniska strategier som riktar sig mot modifiering av lösningsmedelsexponerade rester.
netto relativ laddning i lager av proteinstrukturer med olika lösningsmedelstillgänglighet (ACC). Den relativa nettoavgiften definieras som nettoavgiften per rest som finns i ett visst lager (antal positiva laddningar – antal negativa laddningar/antal rester). Asparaginsyra och glutaminsyra anses vara negativa, arginin, lysin och protonerad histidinpositiv (prickad linje). Den fasta linjen inkluderar alla ovan nämnda rester utom histidin.
netto relativ laddning i lager av proteinstrukturer med olika lösningsmedelstillgänglighet (ACC). Den relativa nettoavgiften definieras som nettoavgiften per rest som finns i ett visst lager (antal positiva laddningar – antal negativa laddningar/antal rester). Asparaginsyra och glutaminsyra anses vara negativa, arginin, lysin och protonerad histidinpositiv (prickad linje). Den fasta linjen inkluderar alla ovan nämnda rester utom histidin.
de betydligt över – eller underrepresenterade grannpar. Alla rester har en lösningsmedelstillgänglighet högre än 20%. Avståndet i XXL mellan resterna ges längs den vertikala axeln. Rött och grönt representerar områden där antalet par är mindre respektive högre än förväntat. A) tryptofan, B) glycin, C) prolin, D) histidin, e) lysin, F) asparaginsyra.
de betydligt över – eller underrepresenterade grannpar. Alla rester har en lösningsmedelstillgänglighet högre än 20%. Avståndet i XXL mellan resterna ges längs den vertikala axeln. Rött och grönt representerar områden där antalet par är mindre respektive högre än förväntat. A) tryptofan, B) glycin, C) prolin, D) histidin, e) lysin, F) asparaginsyra.
över – och underrepresenterade grannpar som en funktion av lösningsmedelstillgänglighet (ACC) och avstånd (Xhamster). Avståndet mellan resterna anges längs den vertikala axeln och lösningsmedlets tillgänglighet längs den horisontella axeln. A) lysin-asparaginsyra; B) glutaminsyra-asparaginsyra; C) tryptofan-glutaminsyra; D) tryptofan–asparaginsyra; E) histidin–asparaginsyra; F) serin–histidin.
över – och underrepresenterade grannpar som en funktion av lösningsmedelstillgänglighet (ACC) och avstånd (Xhamster). Avståndet mellan resterna anges längs den vertikala axeln och lösningsmedlets tillgänglighet längs den horisontella axeln. A) lysin–asparaginsyra; B) glutaminsyra–asparaginsyra; C) tryptofan–glutaminsyra; D) tryptofan–asparaginsyra; E) histidin–asparaginsyra; F) serin–histidin.
korrelation mellan fördelningen av aminosyror i proteiner. Korrelationen beräknas baserat på aminosyrasammansättningen av de olika skikten av lösningsmedelstillgänglighetsskiktet i proteinstrukturen. De gröna områdena representerar positiv korrelation, medan de röda områdena representerar negativ korrelation. Områden med låg grad av korrelation är i vitt.
korrelation mellan fördelningen av aminosyror i proteiner. Korrelationen beräknas baserat på aminosyrasammansättningen av de olika skikten av lösningsmedelstillgänglighetsskiktet i proteinstrukturen. De gröna områdena representerar positiv korrelation, medan de röda områdena representerar negativ korrelation. Områden med låg grad av korrelation är i vitt.
till vilken korrespondens ska adresseras. E-post: [email protected]
P. H. J. tackar Norges forskningsråd för ekonomiskt stöd (NFR-116316/410). S. B. P. uttrycker sin tacksamhet för ekonomiskt stöd från Obelsk Familiefond såväl som m Bisexl-2.
Andrade, M. A.,O ‘ Donoghue,S. I. och Rost, B. (
)
,
,
–525.
Bairoch, A. och Apweiler, R. (
)
,
,
-36.
Bernstein, F. C., Koetzle, T. F., Williams, G. J., Meyer, E. E., Jr, Brice, M. D., Rodgers, J. R.,Kennard, O., Shimanouchi, T. och Tasumi, M. (
)
,
,
–542.
Bhavnani, M., Lloyd, D., Bhattacharyya, A., Marples, J., Elton, P. och Worwood, M. (
)
,
,
-710.
Brocchieri, L. och Karlin, S. (
)
,
,
-12140.
Bryant, S. H. och Amzel, L. M. (
)
,
,
-52.
Burley, S. K. och Petsko, G. A. (
)
,
,
-28.
Chandonia, J. M. och Karplus, M. (
)
,
,
-306.
Chothia, C. (
)
,
,
–14.
Chou, P. Y. och Fasman, G. D. (
)
,
,
–276.
Deane, C. M.,Allen, F. H., Taylor, R. och Blundell, T. L. (
)
,
,
–1028.
Dodge, C., Schneider, R. och Sander, C. (
)
,
,
–315.
Donnelly, D., Overington, J. P. och Blundell, T. L. (
)
,
,
–653.
Dyson, H. J.,Jeng, M. F., Tennant, L. L., Slaby, I., Lindell, M., Cui, D. S., Kuprin, S. och Holmgren, A.(
)
,
,
-2636.
Giletto, A. Och Pace, C. N. (
)
,
,
-13384.
Goldman, N., Thorne, J. L. Och Jones, D. T. (
)
,
,
-458.
Golovanov, A. P., Volynsky, P. E., Ermakova, S. B. Och Arseniev, A. S. (
)
,
,
–40.
Hobohm, U. Och Sander, C. (
)
,
,
–524.
Hobohm, U., Scharf, M., Schneider, R. och Sander, C. (
)
,
,
–417.
Holbrook, S. R., Muskal, S. M. Och Kim, S. H. (
)
,
,
–665.
Jones, D. T. (
)
,
,
–202.
McGrath, M. E., Vasquez, J. R., Craik, C. S., Yang, A. S., Honig, B. Och Fletterick, R. J. (
)
,
,
-3064.
Miller, S., Janin, J., Lesk, A. M. och Chothia, C. (
)
,
,
–656.
Miyazawa, S. och Jernigan, R. L. (
)
,
,
–278.
Miyazawa, S. och Jernigan, R. L. (
)
,
,
–644.
Miyazawa, S. och Jernigan, R. L. (
)
,
,
-356.
Mucchielli-Giorgi, M. H., Tuffery, P. och Hazout, S. (
)
,
,
–193.
Overington, J., Donnelly, D., Johnson, M. S., S. A. och Blundell, T. L. (
)
,
,
–226.
Petersen, M. T. N., Jonson, P. H. och Petersen, S. B. (
)
,
,
–548.
Petersen, S. B.,Jonson, P. H.,Fojan, P.,Petersen, E. I.,Petersen, M. T. N.,Hansen, S., Ishak,R. J. och Hough, E. (
)
,
,
–26.
Rost, B. Och Sander, C. (
)
,
,
-226.
Thompson, M. J. och Goldstein, R. A. (
)
,
,
-47.
Vonderviszt, F., M Jacobtrai, G. och Simon,I. (
)
,
,
-492.
Wako, H. och Blundell, T. L. (
)
,
,
-708.
Wojcik, J., Mornon, J. P. och Chomilier, J. (
)
,
,
-1490.