et kritisk syn På konservative mutasjoner
Abstrakt
ved å analysere overflatesammensetningen av et sett med protein 3d-strukturer, supplert med spådd overflatesammensetningsinformasjon for homologe proteiner, har vi funnet betydelig bevis for en lagsammensetning av proteinstrukturer. I de innerste og ytterste delene av proteiner er det en netto negativ ladning, mens midten har en netto positiv ladning. I tillegg indikerer våre funn at begrepet konservativ mutasjon trenger betydelig revisjon, for eksempel ble det funnet svært forskjellige romlige preferanser for glutaminsyre og asparaginsyre. Alanin screening ofte brukt i protein engineering prosjekter innebærer substitusjon av rester til alanin, basert på antagelsen om at alanin er en ‘nøytral’ rester. Imidlertid har alanin en høy negativ korrelasjon med alle, men ikke-polare rester. Vi foreslår derfor bruk av for eksempel serin som erstatning for rester som er negativt korrelert med alanin.
Innledning
ved folding av en peptidkjede i EN 3d-proteinstruktur, overføres noen rester fra et polart miljø til et mer ikke-polart miljø i det indre av det foldede proteinet. Denne overføringen drives av de termodynamiske egenskapene til aminosyrene og løsningsmidlet. Gjennom molekylær evolusjon har naturen valgt for egnet funksjon og stabilitet av det resulterende proteinet. For små til mellomstore proteiner – i den brettede strukturen-er bare noen få rester helt begravet (Chothia, 1976; Miller et al., 1987; Petersen et al., 1998), mens de fleste rester bare er delvis begravet. Variasjonen i løsningsmiddeltilgjengelighet er avhengig av egenskapene til den aktuelle rest og reflekteres i aminosyresammensetningen gjennom hele proteinstrukturen. Disse forskjellene i løsemiddeltilgjengelighetsprofilen har funnet brede applikasjoner i ulike strukturprediksjonsmetoder ( Holbrook et al.( 1990 ; Rost Og Sander, 1994; Thompson Og Goldstein, 1996 ). Også bruken av miljøspesifikke substitusjonsmatriser (Donnelly et al.(1994; Wako Og Blundell, 1994) har vist seg å være verdifulle. Den sekvensielle nabolaget av aminosyrer har blitt undersøkt tidligere ( Vonderviszt et al., 1986) og bruken har blitt funnet i for eksempel loop prediction (Wojcik et al., 1999 ) og sekundær struktur prediksjon (Chou Og Fasman, 1978; Chandonia og Karplus, 1999; Jones, 1999). Ingen signifikant korrelasjon mellom rester sekvensiell nabo preferanse ble oppdaget.
det romlige nabolaget rundt individuelle rester har også tidligere blitt undersøkt ( Burley Og Petsko, 1985; Bryant Og Amzel, 1987; Miyazawa og Jernigan, 1993; Petersen et al., 1999 ). Videre har romlige kontakter blitt studert for å utlede kontaktpotensialer for de forskjellige aminosyreinteraksjonene ( Brocchieri Og Karlin, 1995; Miyazawa og Jernigan, 1996, 1999). Den vanlige strategien er å studere antall kontakter innenfor en gitt avstandsavbrudd. Litteraturen synes imidlertid blottet for undersøkelser av avstandsavhengige kontakter og også rapporter som benytter den innebygde informasjonen om løsningsmiddeltilgjengeligheten til de involverte rester.
en to-stats prediksjon av løsemiddel tilgjengelighet korrelasjon mellom hydrofobisitet, begravet kontakt tilbøyelighet og plasseringen i prediksjon vinduet har blitt rapportert (Mucchielli-Giorgi et al . , 1999 ). Det beskriver imidlertid ikke noen sammenheng mellom individuelle restfordelinger.
det er viktig å kunne skille mellom korrekt foldede og feilfoldede modellstrukturer. Det har blitt påpekt at potensielle energibaserte metoder ikke diskriminerer godt mellom brettede og misfoldede strukturer. Men strukturelle trekk som begravd polar overflate ( Overington et al., 1992) og antall polare kontakter ( Bryant Og Amzel, 1987; Golovanov et al., 1999) har vist seg verdifull.
i proteinteknikk brukes begrepet konservative mutasjoner ofte. Den generelle ideen er at en substitusjon av en aminosyre med en annen aminosyre med lignende fysisk-kjemiske egenskaper ikke vil påvirke proteinets stabilitet og funksjon. Nåværende papir viser at romlige preferanser for lignende rester kan være dramatisk forskjellige i proteinstrukturer under lignende omstendigheter (i denne sammenheng løsningsmiddeltilgjengelighet).
resultatene fra naboanalysen vil være verdifulle i modellvalidering, som et verktøy for strukturprediksjon og spesielt som en veiledning i søket etter stabilitetsfremmende mutasjoner.
Metoder
sekvensene som brukes er en delmengde av 25% sekvensidentitetssettet av ikke-homologe strukturer ( Hobohm et al., 1992 ; Hobohm Og Sander, 1994) avledet fra PROTEINSTRUKTUREN databank PDB (Bernstein et al., 1977 ). Bare enkeltkjedede proteinsekvenser ble brukt. Det resulterende datasettet besto av 336 enkeltkjedesekvenser med en maksimal parvis sekvensidentitet på 25%. Delmengden ble utvidet ved bruk av de tilsvarende HSSP-filer ( Dodge et al., 1998 ). Det totale datasettet inneholdt 8379 justerte sekvenser og 1 415 986 rester. Dette tilsvarer 6,7% av alle rester i VERSJON 34 AV SWISS-PROT (Bairoch Og Apweiler, 1997 ). Lengden på sekvensene var mellom 64 og 1017 rester. Oppløsningen på Røntgenstrukturene som ble brukt varierte mellom 1.0 og 3.0 Å, med et gjennomsnitt på 2.0 Å. Videre inneholdt delmengden 31 strukturer løst AV NMR. Imidlertid ble alle hydrogen-atomkoordinater kassert. For å se etter en mulig skjevhet introdusert ved bruk av homologe sekvenser fullstendig analyse ble gjort med og uten de justerte sekvenser. Ingen signifikante forskjeller ble observert, selv om den reduserte størrelsen på det minste av de to datasettene, som forventet, ga opphav til mer støy.
de romlige naboene til hver rest ble bestemt basert på løsemiddeltilgjengelighet og romlig avstand. Løsemiddel tilgjengelighet ble tatt fra de respektive HSSP-filer ( Dodge et al., 1998 ). For hver overflaterest ble de nærliggende overflaterester gruppert i henhold til deres avstand til det aktuelle residuet. Avstanden mellom to rester ble beregnet som den korteste avstanden mellom settet av alle mulige par atomer i de to restene. Vi antar at justeringen i HSSP-filen innebærer at naboer i hovedsekvensen også er naboer i de justerte sekvensene, og at løsningsmiddeltilgjengeligheten er bevart ( Andrade et al., 1998; Goldman et al., 1998 ). Forventet antall nabo interaksjoner mellom rester av type i og j beregnes ved
1
hvor xi og xj er fraksjonen av aminosyre i og j i datasettet for avstandsområdet d og ved en løsningsmiddeltilgjengelighet større enn cut-off ACC og N0 er det totale antall observerte nabokontakter. Poengsummen, Sij / d, ACC, beregnes av
2
dette gir en negativ score for disfavoured nabo-par og en positiv score for favoriserte interaksjoner. Poengverdien Sij / D, ACC kan transformeres til en tilsynelatende termodynamisk parameter ved multiplikasjon MED RT .
nettoladningen i hvert lag av proteinet ble beregnet. Asparaginsyre og glutaminsyre anses som negativt ladet og arginin og lysin anses som positivt ladet. Histidin anses enten som uladet eller positivt ladet. Den relative nettokostnaden, Δ qrel, definerer vi som
3
Hvor NPositive er antall positive rester, NNegative antall negative rester og NTotal det totale antall rester i det aktuelle laget.
The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2cae, 2aaa, 1byb, 1smd, 2myr, 3cox, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oxy, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo og 1kcw.
Resultater og diskusjon
fordelingen av ladede rester i forskjellige lag av protein 3d-strukturen og den totale nettoladningen er vist I Figur 1 . I de innerste og ytterste delene av proteiner er det en netto negativ ladning, mens midten har en netto positiv ladning. Denne tilsynelatende trelags struktur med vekslende ladning utsette negativt ladet ytterste laget til løsningsmidlet er interessant. En slik organisasjon vil sikre et visst nivå av radial ladningsnøytralisering, og kan muligens bidra til tett pakking av proteinet. På samme måte kan denne ladningsorganisasjonen av overflatelaget gi viktig elektrostatisk veiledning under foldingshendelsen. Omvendt vil endring av pH til sure eller alkaliske forhold hvor undergrupper av titrerbare rester blir uladet destabilisere pakningen av rester på overflaten av proteinet. Begravde, sure aminosyrer finnes i flere forskjellige proteinstrukturer, og disse rester spiller viktige funksjonelle roller i for eksempel trypsin (McGrath et al., 1992), ribonuklease T1 (Giletto og Pace, 1999) og tioredoksin (Dyson Et al., 1997; Bhavnani et al., 2000 ). Den rapporterte trelagsstrukturen observeres både med og uten den justerte sekvensen og er derfor ikke forårsaket av en bias introdusert ved bevaring av de begravde, ladede gruppene i en proteinfamilie.
de romlige naboene rundt hver type rester ble beregnet uten diskriminering for løsningsmiddeltilgjengelighet. Med de bemerkelsesverdige unntakene av tryptofan og cystein ble aminosyrer ikke ofte observert som romlige naboer til identiske resttyper. Denne trenden var ikke avhengig av valg av avstandsavbrudd (resultater ikke vist). Forskjellene i distribusjon var bemerkelsesverdig små mellom de forskjellige aminosyrene for en 8 Å avstandsavbrudd, noe som tyder på at 8 Å er en stor nok avstand for at fordelingen skal bli uavhengig av den sentrale restens natur. Denne observasjonen førte til at det ble brukt 8 Å som den største avstanden mellom naboer som ble undersøkt i detalj.
Figur 2 viser skårverdiene for alle aminosyre nabopar som involverer tryptofan, glysin, alanin, prolin, serin, histidin, lysin og asparaginsyre for nabopar med minst 20% tilgjengelighet av oppløsningsvæske. Resultatene for de andre aminosyrene er tilgjengelige på vår hjemmeside ( http://www.bio.auc.dk/ ). Score verdier er beregnet på samme måte for andre løsemiddel tilgjengelighet cut-offs. Den aromatiske rest tryptofan er en av bare to rester som viser en klar preferanse for kontakter med samme resttype (den andre er cystein). Også interaksjoner med de andre aromatiske rester foretrekkes. Interessant synes samspillet mellom tryptofan og de to sure rester (asparaginsyre og glutaminsyre) forskjellige. Mens tryptofan og glutaminsyre observeres sjeldnere enn forventet, observeres motsatt for tryptofan og asparaginsyre. Glysin viser den typiske negative poengsummen for interaksjoner med samme resttype. I tillegg ser det ut til at glycin ikke har naboer i det nære romlige nabolaget (≤3.5 Å). Denne underrepresentasjonen av naboer i nærheten er enda tydeligere for proline. Vi tolker denne underrepresentasjonen som et tegn på preferansen for sløyfen som prolinrester har. Mangelen på interaksjoner med alle andre aminosyrer i nærheten peker på at de fleste kontakter er med løsningsmiddelmolekyler. Proline har imidlertid en overflod av kontakter på en større avstand (4-5 Å). Histidin er interessant ved at det viser tegn på dets aromatiske egenskaper, gjennom preferanse for kontakt med aromatiske rester (~3,5 Å) og dets polariserbare natur, gjennom foretrukket kontakt med de negativt ladede rester (~3 Å). Basisk aminosyrelysin har som forventet en klar negativ score for kontakt med andre lysiner. De gunstige elektrostatiske interaksjonene med de sure aminosyrene er tydelige.
Noen av de mest interessante parinteraksjonene er vist i Figur 3 . Figur 3A viser saltbroparet lysin-asparaginsyre. Den sterke overrepresentasjonen sett ved 3 Å separasjon er i samsvar med det klassiske saltbro-konseptet. Overrepresentasjonen av lysin-asparaginsyrepar i de mest eksponerte lagene med oppløsningsvæske observert ved 5,5 til 6 Å er uventet. Vi foreslår at ladningsnett på proteinoverflaten kan forårsake denne observasjonen. I Figur 3B er resultatet for glutaminsyre–asparaginsyreparet vist. Den mest åpenbare funksjonen er forventet underrepresentasjon av dette paret. Men nær proteinoverflaten ser den samme begrensningen ikke ut til å være tilstede. Igjen foreslår vi at overflaten ligger lade nettverk bidrar til denne observasjonen. I Figur 3C Og D er aminosyreparene tryptofan-glutaminsyre og tryptofan–asparaginsyre vist. Den vanlige troen på at en glutaminsyre til asparaginsyremutasjon er konservativ, er i strid med observasjonene som vises. Tryptofan-glutaminsyreparet er svært underrepresentert i de svært løsningsmiddeleksponerte lagene av proteinene. Overraskende kan det samme ikke sies for tryptofan-asparaginsyreparet, hvor en overrepresentasjon observeres for 3,5 til 6 Å avstandsintervall. Lignende, men mindre uttalt, observasjon ble gjort for tyrosin-glutaminsyre og tyrosin-asparaginsyrepar. Det ble ikke observert signifikante forskjeller mellom parene fenylalanin–glutaminsyre og fenylalanin–asparaginsyre. Den eneste forskjellen mellom glutaminsyre og asparaginsyre er lengden på sidekjeden. Felles for både tryptofan og tyrosin er deres polariserbarhet, i motsetning til fenylalanin. Vi tror at overflatelokaliserte tryptofaner involvert i å definere proteinfunksjonalitet er polarisert av deres lokale elektrostatiske miljø. Selv om vi ikke kan gi en kvantitativ forklaring, er det sannsynlig at forskjellene mellom den forskjellige kjedelengden av glutaminsyre og asparaginsyre kan foretrekke nærhet til tryptofan. Det har vist seg at asparaginsyre har en tendens til å ha gunstige interaksjoner mellom sidekjeden karbonylgruppen og ryggraden karbonylgruppen ( Deane et al., 1999), noe som resulterer i en ringlignende struktur. Lignende konformasjoner er ikke observert for glutaminsyre. I Figur 3E Og F er histidin–asparaginsyre–og serin-histidin-parene vist. Siden disse tre rester utgjør det aktive stedet rester av et bredt spekter av hydrolaser de har spesiell interesse. Det er en overrepresentasjon av histidin-asparaginsyrepar i de lett tilgjengelige områdene. Avstanden er større enn den typiske avstanden som observeres i aktive spredesprekker. Den lille, men signifikante overrepresentasjonen i 3 Å-området samsvarer imidlertid med de klassiske histidin-asparaginsyreavstandene i hydrolaser. Figur 3E viser den klare preferansen for kontakter mellom begravde histidiner og asparaginsyrer. Vi tror at denne funksjonen er en viktig del av den molekylære utviklingen av de novo katalytiske steder. Lagring av mulige katalytiske ‘triader’ i ikke-funksjonelle miljøer gjør antall aminosyresubstitusjoner nødvendige for å aktivere stedet mindre.
det mest distinkte trekket I Figur 3F er den klare underrepresentasjonen av serin-histidinpar i utsatte miljøer med høy oppløsningsvæske. En svak overrepresentasjon av serin-histidin-paret er sett ved 3 Å i de mindre tilgjengelige områdene med oppløsningsvæske. Således er tilstedeværelsen av den katalytiske triaden tilsynelatende bestemt hovedsakelig av preferansen av histidin-asparaginsyreparet, selv om serin-histidin-paret avslører lignende, men mye svakere trender.
aminosyresammensetningen i hvert løsningsmiddeltilgjengelighetslag ble bestemt. Som forventet består de begravde delene av proteinene av en høyere mengde ikke-polare rester enn de mer løsningsmiddeleksponerte lagene. Korrelasjonen mellom aminosyresammensetningen ble beregnet ut fra dataene i sammensetningen av de enkelte strukturelle lagene. Aminosyrer som har lignende preferanser for løsemiddelkontakt og lokalt miljø forventes å vise en høy positiv korrelasjon på grunn av lignende trender i distribusjonen. Derfor vil aminosyrer som viser negativ korrelasjon ha forskjellige preferanser for lokalt miljø og antas derfor ikke å være kompatible, dvs. en enkelt stedmutasjon av denne typen på dette stedet anbefales ikke. Da de ikke-polare rester er rikelig i kjernen og viser en gradvis reduksjon ettersom løsningsmiddelets tilgjengelighet øker generelt, er korrelasjonen mellom de ikke-polare rester positive (Figur 4). I kontrast er de polare rester mer rikelig i de svært eksponerte delene og er derfor negativt korrelert med de ikke-polare rester. Histidin og treonin oppfører seg markant annerledes. De viser positiv korrelasjon til hverandre, men liten korrelasjon med noen av de andre kolonnene, med unntak av arginin og glycin. Dette skyldes den lave forekomsten av histidin og treonin i både de begravde og svært eksponerte områdene og deres relativt høye forekomst i de mediumeksponerte lagene. Histidin har positiv korrelasjon med to aromatiske rester, tryptofan og tyrosin, og med svakt polar treonin og polar arginin. Igjen tolker vi dette som et tegn på både de aromatiske egenskapene og ladningsegenskapene til histidin. De svake polare rester har ikke samme klare likhet i fordeling som de polare og ikke-polare rester. Prolin og serin ser ut til å være nærmere knyttet til polarrester. Den svakt polare rest alanin har positiv korrelasjon bare med de ikke-polare rester. Vi foreslår at mutasjoner mellom rester med høy positiv korrelasjon har stor sjanse for å opprettholde den termodynamiske stabiliteten TIL 3D-strukturen. Dette gjelder spesielt for ladede rester. I kontrast er rester med høy grad av negativ korrelasjon typisk rester med forskjellige fysisk-kjemiske egenskaper, som ikke kan byttes uten å endre proteinets fysiske kjemi. De ikke-korrelerte rester involverer rester med en spesiell rolle i strukturen, for eksempel noen rester som ofte er involvert i katalyse. Vi tror at observasjonen som prolin i vår studie oppfører seg på samme måte som polare rester, er relatert til den strukturelle rollen som prolinrester og dens preferanse for løkker og svinger. Alanin screening ofte brukt i protein engineering prosjekter innebærer substitusjon av rester til alanin, basert på antagelsen om at alanin er en ‘nøytral’ rester. Våre data viser imidlertid at alanin har en høy negativ korrelasjon med alle, men ikke-polare rester. Vi foreslår derfor bruk av for eksempel serin som erstatning for rester som er negativt korrelert med alanin.
etter forfatterens mening gir denne artikkelen viktig ny informasjon om proteinstrukturell organisering. Proteinoverflaten bør betraktes som et flerlags strukturelt trekk ved proteinet, hvor hvert lag har sin spesifikke sammensetning og resulterende egenskaper. Denne enkle nøkkelobservasjonen vi tror vil være av betydelig betydning for mange proteintekniske strategier som retter seg mot modifisering av løsningsmiddeleksponerte rester.
netto relativ ladning i lag av proteinstrukturer med forskjellig løsningsmiddeltilgjengelighet (ACC). Netto relativ ladning er definert som netto ladning per rest funnet i et bestemt lag (antall positive ladninger – antall negative ladninger/antall rester). Asparaginsyre og glutaminsyre anses å være negativ, arginin, lysin og protonert histidin positiv (prikket linje). Den faste linjen inkluderer alle de ovennevnte rester unntatt histidin.
netto relativ ladning i lag av proteinstrukturer med forskjellig løsningsmiddeltilgjengelighet (ACC). Netto relativ ladning er definert som netto ladning per rest funnet i et bestemt lag (antall positive ladninger – antall negative ladninger/antall rester). Asparaginsyre og glutaminsyre anses å være negativ, arginin, lysin og protonert histidin positiv (prikket linje). Den faste linjen inkluderer alle de ovennevnte rester unntatt histidin.
de betydelig over-eller underrepresenterte naboparene. Alle rester har en løsningsmiddeltilgjengelighet høyere enn 20%. Avstanden I Å mellom restene er gitt langs den vertikale aksen. Rød og grønn representerer områder hvor antall par er henholdsvis mindre og høyere enn forventet. (A) Tryptofan; (B) glycin; (C) prolin; (D) histidin; (E) lysin; (F) asparaginsyre.
de betydelig over-eller underrepresenterte naboparene. Alle rester har en løsningsmiddeltilgjengelighet høyere enn 20%. Avstanden I Å mellom restene er gitt langs den vertikale aksen. Rød og grønn representerer områder hvor antall par er henholdsvis mindre og høyere enn forventet. (A) Tryptofan; (B) glycin; (C) prolin; (D) histidin; (E) lysin; (F) asparaginsyre.
over-og underrepresenterte nabopar som funksjon av løsemiddel tilgjengelighet (ACC) og avstand (Å). Avstanden mellom resterne er gitt langs den vertikale akse og løsningsmidlet tilgjengelighet langs den horisontale akse. (A) Lysin-asparaginsyre; (B) glutaminsyre-asparaginsyre; (C) tryptofan-glutaminsyre; (D) tryptofan-asparaginsyre; (E) histidin–asparaginsyre; (F) serin–histidin.
over-og underrepresenterte nabopar som funksjon av løsemiddel tilgjengelighet (ACC) og avstand (Å). Avstanden mellom resterne er gitt langs den vertikale akse og løsningsmidlet tilgjengelighet langs den horisontale akse. (A) Lysin-asparaginsyre; (B) glutaminsyre-asparaginsyre; (C) tryptofan–glutaminsyre; (D) tryptofan–asparaginsyre; (E) histidin–asparaginsyre; (F) serin–histidin.
Korrelasjon mellom fordeling av aminosyrer i proteiner. Korrelasjonen beregnes basert på aminosyresammensetningen av de forskjellige lagene av løsningsmiddeltilgjengelighetslag av proteinstrukturen. De grønne områdene representerer positiv korrelasjon, mens de røde områdene representerer negativ korrelasjon. Områder med lav grad av korrelasjon er i hvitt.
Korrelasjon mellom fordeling av aminosyrer i proteiner. Korrelasjonen beregnes basert på aminosyresammensetningen av de forskjellige lagene av løsningsmiddeltilgjengelighetslag av proteinstrukturen. De grønne områdene representerer positiv korrelasjon, mens de røde områdene representerer negativ korrelasjon. Områder med lav grad av korrelasjon er i hvitt.
til hvem korrespondanse skal adresseres. E-post: [email protected]
P. H. J. takker Norges Forskningsråd for økonomisk støtte (NFR-116316/410). S. B. P. uttrykker sin takknemlighet for økonomisk støtte Fra Obelsk Familiefond samt Må-2.
Andrade, M. A., O ‘ Donoghue, S. I. og Rost, B. (
)
,
,
–525.
Bairoch, A. Og Apweiler, R. (
)
,
,
-36.
Bernstein, F. C., Koetzle, T. F., Williams, G. J.,Meyer,E. E., Jr, Brice, M. D., Rodgers, J. R., Kennard, O. T. og tasumi, M. (
)
,
,
–542.
I Tillegg Til Å Være En Av De Mest Kjente,Er Det Også Mulig å Få En Bedre Forståelse av Hva Som Skjer I Verden.(
)
,
,
-710.
Brocchieri, L. Og Karlin, S. (
)
,
,
-12140.
Bryant, S. H. Og Amzel, L. M. (
)
,
,
-52.
Burley, S. K. Og Petsko, G. A. (
)
,
,
-28.
Chandonia, J. M. Og Karplus, M. (
)
,
,
-306.
Trueblood, C. (
)
,
,
–14.
Chou, P. Y. Og Fasman, G. D. (
)
,
,
–276.
Deane, C. M., Allen, F. H., Taylor, R. og Blundell, T. L. (
)
,
,
–1028.
R. Og Sander, C. (
)
,
,
–315.
Donnelly, D., Overington, J. P. og Blundell, T. L. (
)
,
,
–653.
A. V., A. V., A. V., A. V., A. V.,A. v., A. v.,A. v., A. v.,A. v.,A. v., A. v., A. v., A. v., A. v. (
)
,
,
-2636.
Giletto, A. Og Pace, C. N. (
)
,
,
-13384.
Goldman, N., Thorne, J. L. Og Jones, D. T. (
)
,
,
-458.
A. V.,A. V., A. V.,A. V.,A. V., A. V., A. V., A. V., A. V., A. V., A. V., A. V., A. V., A. V. (
)
,
,
–40.
Hobohm, U. Og Sander, C. (
)
,
,
–524.
Scharf, M., Schneider, R. og Sander, C. (
)
,
,
–417.
Holbrook, S. R., Muskal, S. M. Og Kim,S. H. (
)
,
,
–665.
Jones, D. T. (
)
,
,
–202.
A. V.,A. V., A. V.,A. V., A. V.,A. V., A. V.,A. V., A. V.,A. V.,A. V., A. V., A. V., A. V., A. V., A. V., A. V., A. V., A. V., A. V. (
)
,
,
-3064.
S.,S., S.,S., S.,S.,S., S., S., S., S., S., S., S., S., S., S., S. (
)
,
,
–656.
A. V., A. Og A. V., R. L. (
)
,
,
–278.
A. V., A. Og A. V., R. L. (
)
,
,
–644.
A. V., A. Og A. V., R. L. (
)
,
,
-356.
A. V., A. V.,A. V.,A. V., A. V., A. v., A. v. (
)
,
,
–193.
Overington, J.,Donnelly, D.,Johnson, M. S., Sš, A. og Blundell, T. L. (
)
,
,
–226.
Petersen,M. T. N., Jonson, P. H. Og Petersen, S. B. (
)
,
,
–548.
A. V.,A. V., A. V.,A. v., A. v.,A. v., A. V.,A. V., A. V.,A. v., A. v.,A. v., A. v.,A. v.,A. v., A. v., A. v., A. v. (
)
,
,
–26.
Rost, B. Og Sander, C. (
)
,
,
-226.
Thompson, M. J. Og Goldstein, R. A. (
)
,
,
-47.
Vonderviszt, F., Má, G. Og Simon, I. (
)
,
,
-492.
Wako, H. Og Blundell, T. L. (
)
,
,
-708.
Wojcik, J., Mornon, J. P. og Chomilier, J. (
)
,
,
-1490.