et kritisk syn på konservative mutationer

abstrakt

ved at analysere overfladesammensætningen af et sæt protein 3D-strukturer suppleret med forudsagt overfladesammensætningsinformation for homologe proteiner har vi fundet signifikant bevis for en lagsammensætning af proteinstrukturer. I de inderste og yderste dele af proteiner er der en netto negativ ladning, mens midten har en netto positiv ladning. Derudover viser vores resultater, at begrebet konservativ mutation kræver væsentlig revision, f.eks. blev der fundet meget forskellige rumlige præferencer for glutaminsyre og asparaginsyre. Alaninscreeningen, der ofte anvendes i proteintekniske projekter, involverer substitution af rester med alanin baseret på antagelsen om, at alanin er en `neutral’ rest. Alanin har imidlertid en høj negativ korrelation med alle undtagen de ikke-polære rester. Vi foreslår derfor brugen af for eksempel serin som erstatning for de rester, der er negativt korreleret med alanin.

introduktion

ved foldning af en peptidkæde i en 3D-proteinstruktur overføres nogle rester fra et polært miljø til et mere ikke-polært miljø i det indre af det foldede protein. Denne overførsel drives af de termodynamiske egenskaber af aminosyrerne og opløsningsmidlet. Gennem molekylær evolution har naturen valgt passende funktion og stabilitet af det resulterende protein. For små til mellemstore proteiner—i den foldede struktur-er kun få rester helt begravet ( Chothia, 1976 ; Miller et al., 1987; Petersen et al., 1998), mens de fleste rester kun er delvist begravet. Variationen i opløsningsmiddeltilgængelighed afhænger af egenskaberne af den pågældende rest og afspejles i aminosyresammensætningen gennem hele proteinstrukturen. Disse forskelle i opløsningsmiddeltilgængelighedsprofilen har fundet brede anvendelser i forskellige strukturforudsigelsesmetoder ( Holbrook et al., 1990; Rost og Sander, 1994; Thompson og Goldstein, 1996 ). Også brugen af miljøspecifikke substitutionsmatricer ( Donnelly et al., 1994; Blundell, 1994) har vist sig værdifulde. Den sekventielle kvarter af aminosyrer er blevet undersøgt tidligere., 1986) og dets anvendelse er fundet i for eksempel loop prediction ( Vjcik et al., 1999) og forudsigelse af sekundær struktur (Chou og Fasman, 1978 ; Chandonia og Karplus, 1999 ; Jones, 1999 ). Ingen signifikant sammenhæng mellem rester sekventiel nabopræference blev opdaget.

det rumlige kvarter omkring individuelle rester er også tidligere blevet undersøgt (Burley og Petsko, 1985 ; Bryant og Amsel, 1987 ; 1993 ; Petersen et al., 1999 ). Desuden er rumlige kontakter blevet undersøgt for at udlede kontaktpotentialer for de forskellige aminosyreinteraktioner ( Brocchieri og Karlin, 1995 ; 1996, 1999 ). Den fælles strategi er at undersøge antallet af kontakter inden for en given afstandsafbrydelse. Litteraturen synes imidlertid at være blottet for undersøgelser af afstandafhængige kontakter og også af rapporter, der anvender den indlejrede information om opløsningsmiddeltilgængeligheden af de involverede rester.

der er rapporteret en to-tilstands forudsigelse af opløsningsmiddeltilgængelighedskorrelation mellem hydrofobicitet, nedgravet kontakttilbøjelighed og placeringen i forudsigelsesvinduet ( Mucchielli-Giorgi et al., 1999 ). Det beskriver dog ikke nogen sammenhæng mellem individuelle restfordelinger.

det er vigtigt at kunne skelne mellem korrekt foldede og forkert foldede modelstrukturer. Det er blevet påpeget, at potentielle energibaserede metoder ikke skelner godt mellem foldede og forkert foldede strukturer. Imidlertid strukturelle træk såsom begravet polar overflade ( Overington et al., 1992) og antal polære kontakter ( Bryant og Amsel, 1987 ; Golovanov et al., 1999) har vist sig værdifulde.

i proteinteknik anvendes begrebet konservative mutationer ofte. Den generelle ide er, at en substitution af en aminosyre med en anden aminosyre med lignende fysisk-kemiske egenskaber ikke vil påvirke proteinets stabilitet og funktion. Nærværende papir viser, at de rumlige præferencer for lignende rester kan være dramatisk forskellige i proteinstrukturer under lignende omstændigheder (i denne sammenhæng opløsningsmiddeltilgængelighed).

resultaterne af naboanalysen vil være værdifulde i modelvalidering, som et værktøj til strukturforudsigelse og især som en vejledning i søgen efter stabilitetsforbedrende mutationer.

metoder

de anvendte sekvenser er en delmængde af 25% sekvensidentitetssæt af ikke-homologe strukturer ( Hobohm et al., 1992 ; Hobohm og Sander, 1994) afledt af protein structure databank PDB ( Bernstein et al., 1977 ). Kun enkeltkædede proteinsekvenser blev anvendt. Det resulterende datasæt bestod af 336 enkeltkædede sekvenser med en maksimal parvis sekvensidentitet på 25%. Delmængden blev udvidet ved brug af de tilsvarende HSSP-filer ( Dodge et al., 1998 ). Det samlede datasæt indeholdt 8379 justerede sekvenser og 1 415 986 restkoncentrationer. Dette svarer til 6,7% af alle restkoncentrationer i version 34 af BAIROCH, 1997. Længden af sekvenserne var mellem 64 og 1017 rester. Opløsningen af de anvendte Røntgenstrukturer varierede mellem 1,0 og 3,0 liter, med et gennemsnit på 2,0 liter. Endvidere indeholdt delmængden 31 strukturer løst af NMR. Imidlertid blev alle hydrogenatomkoordinater kasseret. For at kontrollere for en mulig bias introduceret ved brug af de homologe sekvenser blev den komplette analyse udført med og uden de justerede sekvenser. Der blev ikke observeret nogen signifikante forskelle, skønt den reducerede størrelse af det mindste af de to datasæt som forventet gav anledning til mere støj.

de rumlige naboer for hver rest blev bestemt ud fra opløsningsmiddeltilgængelighed og rumlig afstand. Opløsningsmiddeltilgængeligheden blev taget fra de respektive HSSP-filer ( Dodge et al., 1998 ). For hver overfladerest blev de tilstødende overfladerester grupperet efter deres afstand til den pågældende rest. Afstanden mellem to rester blev beregnet som den korteste afstand blandt sættet af alle mulige par atomer i de to rester. Vi antager, at justeringen i HSSP-filen indebærer, at naboer i hovedsekvensen også er naboer i de justerede sekvenser, og at opløsningsmiddeltilgængeligheden bevares ( Andrade et al., 1998; Goldman et al., 1998 ). Det forventede antal nabointeraktioner mellem restkoncentrationer af type I og j beregnes ved

\

1

i datasættet er fraktionen af aminosyre i og j i datasættet for afstandsområdet d og ved en opløsningsmiddeltilgængelighed, der er større end cut-off ACC og N0, er det samlede antal observerede nabokontakter. Scoren, Sij / D, ACC, beregnes af

\

2

dette giver en negativ score for utilfredse nabopar og en positiv score for foretrukne interaktioner. Scoren værdi Sij / D, ACC kan omdannes til en tilsyneladende termodynamisk parameter ved multiplikation med RT .

nettoladningen i hvert lag af proteinet blev beregnet. Asparaginsyre og glutaminsyre betragtes som negativt ladet, og arginin og lysin betragtes som positivt ladet. Histidin betragtes enten som uladet eller positivt ladet. Den relative nettoladning , vi definerer som

\

3

hvor NPositive er antallet af positive rester, NNegative antallet af negative rester og NTotal det samlede antal rester i det pågældende lag.

The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2aaa, 1byb, 1smd, 2myr, 3coks, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oksi, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgv, 1aa6, 1vom, 8acn, 1kit, 1tak, 1gpb, 1bba, 1alo og 1kcv.

resultater og diskussion

fordelingen af ladede rester i forskellige lag af protein 3D-strukturen og den samlede nettoladning er vist i Figur 1 . I de inderste og yderste dele af proteiner er der en netto negativ ladning, mens midten har en netto positiv ladning. Denne tilsyneladende trelagsstruktur med vekslende ladning, der udsætter det negativt ladede yderste lag for opløsningsmidlet, er interessant. En sådan organisation vil sikre et vist niveau af radial ladningsneutralisering og kan muligvis bidrage til tæt pakning af proteinet. Ligeledes kunne denne ladningsorganisation af overfladelaget give vigtig elektrostatisk vejledning under foldebegivenheden. Omvendt vil ændring af pH til sure eller alkaliske forhold, hvor undergrupper af de titrerbare rester bliver uladede, destabilisere pakningen af rester på proteinets overflade. Begravet, sure aminosyrer kan findes i flere forskellige proteinstrukturer, og disse rester spiller vigtige funktionelle roller i for eksempel trypsin ( McGrath et al., 1992), ribonuklease T1 (Giletto og Pace, 1999) og thioredoksin ( Dyson et al., 1997; Bhavnani et al., 2000 ). Den rapporterede trelagsstruktur observeres både med og uden den justerede sekvens og er derfor ikke forårsaget af en bias introduceret af bevarelsen af de nedgravede, ladede grupper inden for en proteinfamilie.

de rumlige naboer omkring hver type rest blev beregnet uden forskelsbehandling for opløsningsmiddeltilgængelighed. Med de bemærkelsesværdige undtagelser fra tryptophan og cystein blev aminosyrer ikke ofte observeret som rumlige naboer til identiske resttyper. Denne tendens var ikke afhængig af valget af afstandsafskæring (resultater ikke vist). Forskellene i fordeling var bemærkelsesværdigt små mellem de forskellige aminosyrer for en 8-liters afstandsafskæring, hvilket tyder på, at 8-Larsen er en stor nok afstand til, at fordelingen bliver uafhængig af arten af den centrale rest. Denne observation førte til brugen af 8 liter som den største afstand mellem naboer undersøgt i detaljer.

figur 2 viser scoreværdierne for alle aminosyrenabo-par, der involverer tryptophan, glycin, alanin, prolin, serin, histidin, lysin og asparaginsyre for nabopar med mindst 20% opløsningsmiddeltilgængelighed. Resultaterne for de andre aminosyrer er tilgængelige på vores hjemmeside ( http://www.bio.auc.dk/). Scoreværdier er beregnet på samme måde for andre afskæringer af opløsningsmiddeltilgængelighed. Den aromatiske resttryptophan er en af kun to rester, der viser en klar præference for kontakter med den samme resttype (den anden er cystein). Også interaktioner med de andre aromatiske rester foretrækkes. Interessant nok virker interaktionerne mellem tryptophan og de to sure rester (asparaginsyre og glutaminsyre) forskellige. Mens tryptophan og glutaminsyre observeres mindre hyppigt end forventet, observeres det modsatte for tryptophan og asparaginsyre. Glycin viser den typiske negative score for interaktioner med den samme resttype. Glycin ser heller ikke ud til at have naboer i det tætte rumlige kvarter (3,5 liter). Denne underrepræsentation af naboer i nærheden er endnu tydeligere for proline. Vi fortolker denne underrepræsentation som et tegn på præference for loop, som prolinrester har. Manglen på interaktioner med alle andre aminosyrer i nærheden peger på, at de fleste kontakter er med opløsningsmiddelmolekyler. Proline har dog en overflod af kontakter på en større afstand (4-5 liter). Histidin er interessant, fordi det viser tegn på dets aromatiske egenskaber gennem præference for kontakter med aromatiske rester (~3,5 liter) og dets polariserbare natur gennem foretrukne kontakter med de negativt ladede rester (~3 liter). Den basiske aminosyre lysin har som forventet en klar negativ score for kontakter med andre lysiner. De gunstige elektrostatiske interaktioner med de sure aminosyrer er tydelige.

nogle af de mest interessante parinteraktioner er vist i figur 3 . Figur 3a viser saltbroparret lysin–asparaginsyre. Den stærke overrepræsentation, der ses ved 3-liters adskillelse, er i overensstemmelse med det klassiske salt bridge-koncept. Overrepræsentationen af lysin-asparaginsyrepar i de mest solventeksponerede lag observeret ved 5,5 til 6 liter er uventet. Vi foreslår, at ladningsnetværk på proteinoverfladen kan forårsage denne observation. I figur 3b vises resultatet for glutaminsyre–asparaginsyreparret. Den mest oplagte funktion er den forventede underrepræsentation af dette par. Tæt på proteinoverfladen ser den samme begrænsning imidlertid ikke ud til at være til stede. Igen foreslår vi, at overfladeplacerede ladningsnetværk bidrager til denne observation. I figurerne 3C og D er aminosyreparrene tryptophan–glutaminsyre og tryptophan–asparaginsyre vist. Den almindelige tro på, at en glutaminsyre til asparaginsyremutation er konservativ, er i strid med de viste observationer. Tryptophan-glutaminsyreparret er stærkt underrepræsenteret i de stærkt opløsningsmiddeleksponerede lag af proteinerne. Overraskende nok kan det samme ikke siges for tryptophan–asparaginsyreparet, hvor der observeres en overrepræsentation for 3,5 til 6 liter-afstandsintervallet. Lignende, men mindre udtalt, observation blev foretaget for tyrosin–glutaminsyre og tyrosin–asparaginsyrepar. Der blev ikke observeret signifikante forskelle mellem phenylalanin–glutaminsyre og phenylalanin–asparaginsyrepar. Den eneste forskel mellem glutaminsyren og asparaginsyren er længden af sidekæden. Fælles for både tryptophan og tyrosin er deres polariserbarhed i modsætning til phenylalanin. Vi mener, at overfladeplacerede tryptofaner, der er involveret i at definere proteinfunktionalitet, polariseres af deres lokale elektrostatiske miljø. Selvom vi ikke kan give en kvantitativ forklaring, er det plausibelt, at forskellene mellem den forskellige kædelængde af glutaminsyre og asparaginsyre kan foretrække nærheden til tryptophan. Det er vist, at asparaginsyre har en tendens til at have gunstige interaktioner mellem sidekædecarbonylgruppen og rygradscarbonylgruppen ( Deane et al., 1999), hvilket resulterer i en ringlignende struktur. Lignende konformationer er ikke observeret for glutaminsyre. I figurerne 3E og F vises histidin–asparaginsyre–og serin-histidin-parrene. Da disse tre restkoncentrationer udgør restkoncentrationerne på det aktive sted i en lang række hydrolaser, har de særlig interesse. Der er en overrepræsentation af histidin-asparaginsyrepar i de meget tilgængelige opløsningsmiddelområder. Afstanden er større end den typiske afstand, der observeres i aktive stedsprækker. Imidlertid er den lille, men signifikante, overrepræsentation i 3-kar–området i overensstemmelse med de klassiske histidin-asparaginsyreafstande i hydrolaser. Figur 3e viser den klare præference for kontakter mellem nedgravede histidiner og asparaginsyrer. Vi mener, at denne funktion er en vigtig del af den molekylære udvikling af de novo katalytiske steder. Opbevaring af mulige katalytiske ‘triader’ I ikke-funktionelle miljøer gør antallet af aminosyresubstitutioner, der er nødvendige for at aktivere stedet, mindre.

det mest tydelige træk i figur 3F er den klare underrepræsentation af serin-histidinpar i stærkt opløsningsmiddeleksponerede miljøer. En svag overrepræsentation af serin-histidin-paret ses ved 3 liter i de mindre tilgængelige opløsningsmiddelområder. Således bestemmes tilstedeværelsen af den katalytiske triade tilsyneladende for det meste af præferencen af histidin–asparaginsyreparet, selvom serin–histidinparet afslører lignende, men meget svagere tendenser.

aminosyresammensætningen af hvert opløsningsmiddeltilgængelighedslag blev bestemt. Som forventet består de nedgravede dele af proteinerne af en højere mængde ikke-polære rester end de mere opløsningsmiddeleksponerede lag. Korrelationen mellem aminosyresammensætningen blev beregnet ud fra dataene for sammensætningen af de enkelte strukturelle lag. Aminosyrer, der har lignende præferencer for opløsningsmiddelkontakt og lokalt miljø, forventes at vise en høj positiv korrelation på grund af lignende tendenser i deres distribution. Derfor vil aminosyrer, der viser negativ korrelation, have forskellige præferencer for det lokale miljø og menes derfor ikke at være kompatible, dvs.en enkelt stedsmutation af denne type på dette sted anbefales ikke. Da de ikke-polære rester er rigelige i kernen og viser et gradvist fald, når opløsningsmiddeltilgængeligheden generelt øges, er korrelationen mellem de ikke-polære rester positiv (figur 4 ). I modsætning hertil er de polære rester mere rigelige i de stærkt eksponerede dele og er derfor negativt korreleret med de ikke-polære rester. Histidin og threonin opfører sig markant anderledes. De viser positiv korrelation med hinanden, men lidt korrelation med nogen af de andre kolonner, med undtagelse af arginin og glycin. Dette skyldes den lave forekomst af histidin og threonin i både de nedgravede og stærkt udsatte områder og deres relativt høje forekomst i de mediumeksponerede lag. Histidin har en positiv korrelation med to aromatiske rester, tryptophan og tyrosin, og med den svagt polære threonin og den polære arginin. Igen fortolker vi dette som et tegn på både de aromatiske egenskaber og ladningsegenskaberne for histidin. De svagt polære rester har ikke den samme klare lighed i fordelingen som de polære og ikke-polære rester. Prolin og serin synes at være tættere forbundet med de polære rester. Den svagt polære rest alanin har kun positiv korrelation med de ikke-polære rester. Vi foreslår, at mutationer mellem rester med høj positiv korrelation har stor chance for at opretholde den termodynamiske stabilitet i 3D-strukturen. Dette gælder især for ladede rester. I modsætning hertil er rester med en høj grad af negativ korrelation typisk rester med forskellige fysisk-kemiske egenskaber, som ikke kan udskiftes uden at ændre proteinets fysiske kemi. De ikke-korrelerede rester involverer rester med en særlig rolle i strukturen, f.eks. nogle rester, der ofte er involveret i katalyse. Vi mener, at observationen om, at prolin i vores undersøgelse opfører sig på samme måde som polære rester, er relateret til den strukturelle rolle af prolinrester og dens præference for sløjfer og sving. Alaninscreeningen, der ofte anvendes i proteintekniske projekter, involverer substitution af rester med alanin baseret på antagelsen om, at alanin er en `neutral’ rest. Vores data viser imidlertid, at alanin har en høj negativ korrelation med alle undtagen de ikke-polære rester. Vi foreslår derfor brugen af for eksempel serin som erstatning for de rester, der er negativt korreleret med alanin.

efter forfatterens mening giver dette papir vigtige nye oplysninger om proteinstrukturel organisation. Proteinoverfladen skal ses som et flerlags strukturelt træk ved proteinet, hvor hvert lag har sin specifikke sammensætning og resulterende egenskaber. Denne enkle nøgleobservation mener vi vil være af væsentlig betydning for mange proteintekniske strategier, der er målrettet mod modifikation af opløsningsmiddeleksponerede rester.

Fig. 1.

den relative nettoladning i lag af proteinstrukturer med forskellig opløsningsmiddeltilgængelighed (ACC). Den relative nettoladning defineres som nettoladningen pr.Rest, der findes i et bestemt lag (antal positive ladninger – antal negative ladninger/antal rester). Asparaginsyre og glutaminsyre anses for at være negative, arginin, lysin og protoneret histidin-positive (stiplet linje). Den faste linje omfatter alle ovennævnte rester undtagen histidin.

Fig. 1.

den relative nettoladning i lag af proteinstrukturer med forskellig opløsningsmiddeltilgængelighed (ACC). Den relative nettoladning defineres som nettoladningen pr.Rest, der findes i et bestemt lag (antal positive ladninger – antal negative ladninger/antal rester). Asparaginsyre og glutaminsyre anses for at være negative, arginin, lysin og protoneret histidin-positive (stiplet linje). Den faste linje omfatter alle ovennævnte rester undtagen histidin.

Fig. 2.

de betydeligt over – eller underrepræsenterede nabopar. Alle rester har en opløsningsmiddeltilgængelighed højere end 20%. Afstanden I kg mellem resterne er angivet langs den lodrette akse. Rød og grøn repræsenterer områder, hvor antallet af par er henholdsvis mindre og højere end forventet. A) Tryptophan, B) glycin, C) prolin, d) histidin, e) lysin, f) asparaginsyre.

Fig. 2.

de betydeligt over – eller underrepræsenterede nabopar. Alle rester har en opløsningsmiddeltilgængelighed højere end 20%. Afstanden I kg mellem resterne er angivet langs den lodrette akse. Rød og grøn repræsenterer områder, hvor antallet af par er henholdsvis mindre og højere end forventet. A) Tryptophan, B) glycin, C) prolin, d) histidin, e) lysin, f) asparaginsyre.

Fig. 3.

over – og underrepræsenterede nabopar som en funktion af opløsningsmiddeltilgængelighed (ACC) og afstand (liter). Afstanden mellem resterne er angivet langs den lodrette akse og opløsningsmiddeltilgængeligheden langs den vandrette akse. A) lysin-asparaginsyre B) glutaminsyre-asparaginsyre C) tryptophan-glutaminsyre; D) tryptophan–asparaginsyre E) histidin–asparaginsyre F) serin–histidin.

Fig. 3.

over – og underrepræsenterede nabopar som en funktion af opløsningsmiddeltilgængelighed (ACC) og afstand (liter). Afstanden mellem resterne er angivet langs den lodrette akse og opløsningsmiddeltilgængeligheden langs den vandrette akse. A) lysin–asparaginsyre B) glutaminsyre–asparaginsyre C) tryptophan–glutaminsyre D) tryptophan–asparaginsyre E) histidin–asparaginsyre f) serin–histidin.

Fig. 4.

korrelation mellem distribution af aminosyrer i proteiner. Korrelationen beregnes ud fra aminosyresammensætningen af de forskellige lag af opløsningsmiddeltilgængelighedslag af proteinstrukturen. De grønne områder repræsenterer positiv korrelation, mens de røde områder repræsenterer negativ korrelation. Områder med lav grad af korrelation er i hvidt.

Fig. 4.

korrelation mellem distribution af aminosyrer i proteiner. Korrelationen beregnes ud fra aminosyresammensætningen af de forskellige lag af opløsningsmiddeltilgængelighedslag af proteinstrukturen. De grønne områder repræsenterer positiv korrelation, mens de røde områder repræsenterer negativ korrelation. Områder med lav grad af korrelation er i hvidt.

1

til hvem korrespondance skal adresseres. E-mail: [email protected]

P. H. J. takker Norges Forskningsråd for økonomisk støtte (NFR-116316/410). S. B. P. udtrykker sin taknemmelighed for økonomisk støtte fra Obelsk Familiefond såvel som M. Krisl-2.

Andrade, M. A., O ‘ Donoghue, S. I. og Rost, B. (

1998

)

J. Mol. Biol.

,

276

,

517

–525.

Bairoch,A. (

1997

)

nukleinsyrer Res.

,

25

,

31

-36.

Det Er En Af De Mest Almindelige Årsager Til,At Der Er Tale Om En Alvorlig Sygdom, Der Er Opstået Som Følge Af,At Der Er Tale Om En Alvorlig Sygdom, Der Er Opstået Som Følge Af,At Der Er Tale Om En Alvorlig Sygdom., Shimanouchi, T. og Tasumi, M. (

1977

)

J. Mol. Biol.

,

112

,

535

–542.

Bhavnani, M., Lloyd, D., Bhattacharyya, A., Marples, J., Elton,P. (

2000

)

Gut

,

46

,

707

-710.

Brocchieri, L. og Karlin, S. (

1995

)

Proc. Natl Acad. Sci. USA

,

92

,

12136

-12140.

Bryant, S. H. og Amsel, L. M. (

1987

)

Int. J. Pept. Protein Res.

,

29

,

46

-52.

Burley, S. K. og Petsko, G. A. (

1985

)

videnskab

,

229

,

23

-28.

Chandonia, J. M. Og Karplus, M. (

1999

)

proteiner

,

35

,

293

-306.

Chothia, C. (

1976

)

J. Mol. Biol.

,

105

,

1

–14.

Chou, P. Y. og Fasman, G. D. (

1978

)

Annu. Pastor Biochem.

,

47

,

251

–276.

Deane, C. M., Allen, F. H., Taylor, R. Og Blundell, T. L. (

1999

)

Protein Eng.

,

12

,

1025

–1028.

Dodge, C., Schneider, R. Og Sander, C. (

1998

)

nukleinsyrer Res.

,

26

,

313

–315.

Donnelly, D., Overington, J. P. og Blundell, T. L. (

1994

)

Protein Eng.

,

7

,

645

–653.

Dyson, H. J., Jeng, M. F., Tennant, L. L.,Slaby, I.,Lindell, M.,Cui, D. S.,Kuprin,S. og Holmgren, A. (

1997

)

biokemi

,

36

,

2622

-2636.

Giletto, A. Og Pace, C. N. (

1999

)

biokemi

,

38

,

13379

-13384.

Goldman, N., Thorne, J. L. og Jones, D. T. (

1998

)

genetik

,

149

,

445

-458.

Golovanov, A. P., Volynsky, P. E., Ermakova, S. B. Og Arseniev, A. S. (

1999

)

Protein Eng.

,

12

,

31

–40.

Hobohm, U. Og Sander, C. (

1994

)

Protein Sci.

,

3

,

522

–524.

Hobohm, U., Scharf, M., Schneider, R. Og Sander, C. (

1992

)

Protein Sci.

,

1

,

409

–417.

Holbrook, S. R., Muskal, S. M. Og Kim,S. H. (

1990

)

Protein Eng.

,

3

,

659

–665.

Jones, D. T. (

1999

)

J. Mol. Biol.

,

292

,

195

–202.

McGrath, M. E.,M. E., J. R., Craik, C. S., Yang,A. S., Honig, B. Og Fletterick, R. J. (

1992

)

biokemi

,

31

,

3059

-3064.

Miller, S., Janin, J., Lesk, A. M. Og Chothia, C. (

1987

)

J. Mol. Biol.

,

196

,

641

–656.

S. og Jernigan, R. L. (

1993

)

Protein Eng.

,

6

,

267

–278.

S. og Jernigan, R. L. (

1996

)

J. Mol. Biol.

,

256

,

623

–644.

S. og Jernigan, R. L. (

1999

)

proteiner

,

36

,

347

-356.

Mucchielli-Giorgi, M. H., Tuffery,P. (

1999

)

Theor. Chim. Acta.

,

101

,

186

–193.

Overington, J., Donnelly, D., Johnson, M. S.,S. (

1992

)

Protein Sci.

,

1

,

216

–226.

Petersen, M. T. N., Jonson, P. H. og Petersen, S. B. (

1999

)

Protein Eng.

,

12

,

535

–548.

Petersen, S. B., Jonson, P. H., Fojan, P., Petersen, E. I., Petersen, M. T. N.,Hansen, S.,Ishak,R. J. og Hough, E. (

1998

)

J. Biotechnol.

,

66

,

11

–26.

Rost, B. Og Sander, C. (

1994

)

proteiner

,

20

,

216

-226.

Thompson, M. J. og Goldstein, R. A. (

1996

)

proteiner

,

25

,

38

-47.

Vondervist, F., M. K., G. Og Simon,I. (

1986

)

Int. J. Pept. Protein Res.

,

27

,

483

-492.

H. og Blundell, T. L. (

1994

)

J. Mol. Biol.

,

238

,

693

-708.

J. J., Mornon, J. P. og Chomilier, J. (

1999

)

J. Mol. Biol.

,

289

,

1469

-1490.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.