kritický pohled na konzervativní mutace

Abstrakt

díky analýze složení povrchu ze sady protein 3D struktur, doplněný předpověděl povrch kompoziční informace pro homologní proteiny, jsme našli významný důkaz pro vrstvu složení proteinových struktur. V nejvnitřnějších a nejvzdálenějších částech proteinů je čistý záporný náboj, zatímco střed má čistý kladný náboj. Kromě toho naše zjištění naznačují, že koncept konzervativní mutace vyžaduje podstatnou revizi, např. byly nalezeny velmi odlišné prostorové preference pro kyselinu glutamovou a kyselinu asparagovou. Screening alaninu často používaný v projektech bílkovinného inženýrství zahrnuje substituci reziduí na alanin, na základě předpokladu, že alanin je “neutrální” zbytek. Alanin má však vysokou negativní korelaci se všemi kromě nepolárních zbytků. Navrhujeme proto použití například serinu jako náhražky zbytků, které negativně korelují s alaninem.

Úvod

Při skládání peptidový řetězec do 3D struktury proteinů, některé zbytky jsou převedeny z polárního prostředí do více nepolární prostředí v interiéru složené bílkoviny. Tento přenos je poháněn termodynamickými vlastnostmi aminokyselin a rozpouštědla. V průběhu molekulární evoluce Příroda zvolila pro vhodnou funkci a stabilitu výsledného proteinu. U malých až středně velkých proteinů – ve složené struktuře – je zcela pohřbeno pouze několik zbytků (Chothia, 1976; Miller a kol., 1987; Petersen et al., 1998), zatímco většina zbytků je pohřbena pouze částečně. Změna přístupnosti rozpouštědla závisí na vlastnostech daného zbytku a odráží se ve složení aminokyselin v celé struktuře proteinu. Tyto rozdíly v profilu přístupnosti rozpouštědel nalezly široké uplatnění v různých metodách predikce struktury (Holbrook et al . , 1990; Rost and Sander, 1994; Thompson and Goldstein, 1996). Také použití substitučních matic specifických pro životní prostředí (Donnelly et al., 1994; Wako a Blundell, 1994) se ukázaly jako cenné. Sekvenční sousedství aminokyselin bylo zkoumáno dříve ( Vonderviszt et al., 1986) a jeho použití bylo nalezeno například v predikci smyčky (Wojcik et al., 1999 ) a predikce sekundární struktury ( Chou a Fasman, 1978 ; Chandonia a Karplus, 1999 ; Jones, 1999 ). Nebyla zjištěna žádná významná korelace mezi reziduemi sekvenční preference sousedů.

prostorové sousedství kolem jednotlivých reziduí je také již dříve zkoumány ( Burley a Petsko, 1985 ; Bryant a Amzel, 1987 ; Miyazawa a Jernigan, 1993 ; Petersen et al., 1999 ). Dále byly studovány prostorové kontakty pro odvození kontaktních potenciálů pro různé interakce aminokyselin (Brocchieri a Karlin, 1995; Miyazawa a Jernigan, 1996, 1999). Společnou strategií je studovat počet kontaktů v rámci dané vzdálenosti cut-off. Zdá se však, že literatura postrádá zkoumání vzdálených kontaktů a také zpráv využívajících vložené informace o dostupnosti příslušných reziduí rozpouštědly.

dvou států předpověď rozpouštědla dostupnost korelace mezi hydrofobicita, pohřben kontakt sklon a umístění v predikci okna byla hlášena ( Mucchielli-Giorgi et al., 1999 ). Nepopisuje však žádnou korelaci mezi jednotlivými distribucemi reziduí.

je důležité rozlišovat mezi správně složenými a špatně složenými modelovými strukturami. Bylo zdůrazněno, že potenciální energetické metody nerozlišují dobře mezi složenými a špatně složenými strukturami. Strukturální rysy, jako je pohřbený polární povrch (Overington et al . , 1992) a počet polárních kontaktů (Bryant a Amzel, 1987 ; Golovanov et al., 1999) se ukázaly jako cenné.

v proteinovém inženýrství se často používá koncept konzervativních mutací. Obecná myšlenka je, že substituce aminokyseliny jinou aminokyselinou s podobnými fyzikálně-chemickými vlastnostmi neovlivní stabilitu a funkci proteinu. Tento dokument ukazuje, že prostorové preference pro podobné zbytky mohou být výrazně odlišné v proteinových struktur za podobných okolností (v této souvislosti rozpouštědla dostupnost).

výsledky soused analýzy budou cenné při validaci modelu, jako nástroje pro predikce struktury a zejména jako vodítko při hledání stability, posílení mutací.

metody

použité sekvence jsou podmnožinou 25% sady identit sekvencí nehomologních struktur (Hobohm et al . , 1992 ; Hobohm and Sander, 1994) odvozený z databáze proteinové struktury PDB (Bernstein et al., 1977 ). Byly použity pouze proteinové sekvence s jedním řetězcem. Výsledný datový soubor sestával z 336 jednořetězcových sekvencí s maximální identitou párových sekvencí 25%. Podmnožina byla rozšířena pomocí odpovídajících hssp souborů (Dodge et al., 1998 ). Celkový soubor dat obsahoval 8379 zarovnaných sekvencí a 1 415 986 zbytků. To odpovídá 6,7% všech reziduí ve verzi 34 Swiss-PROT (Bairoch a Apweiler, 1997). Délka sekvencí byla mezi 64 a 1017 zbytky. Rozlišení použitých rentgenových struktur se pohybovalo mezi 1,0 a 3,0 Å, v průměru 2,0 Å. Dále podmnožina obsahovala 31 struktur řešených NMR. Všechny souřadnice atomu vodíku však byly vyřazeny. Pro kontrolu možného zkreslení zavedeného použitím homologních sekvencí byla provedena kompletní analýza s zarovnanými sekvencemi i bez nich. Nebyly pozorovány žádné významné rozdíly, ačkoli Snížená velikost menší ze dvou datových souborů, jak se očekávalo, vedla k většímu šumu.

prostorové sousedy každého zbytku byly stanoveny na základě přístupnosti rozpouštědla a prostorové vzdálenosti. Přístupnost rozpouštědla byla převzata z příslušných souborů HSSP (Dodge et al., 1998 ). Pro každý povrchový zbytek byly sousední povrchové zbytky seskupeny podle jejich vzdálenosti od dotyčného zbytku. Vzdálenost mezi dvěma zbytky byla vypočtena jako nejkratší vzdálenost mezi sadou všech možných párů atomů ve dvou zbytcích. Předpokládáme, že zarovnání v souboru HSSP znamená, že sousedé v hlavní sekvenci jsou také sousedé v zarovnaných sekvencích a že Přístupnost rozpouštědla je zachována (Andrade et al . , 1998; Goldman a kol., 1998 ). Očekávaný počet soused interakce mezi zbytky typ i a j se vypočítá

\

1

kde xi a xj jsou frakce amino kyseliny i a j v dataset pro rozsah vzdálenosti d a na rozpouštědla dostupnost větší než cut-off, ACC a N0 je celkový počet pozorovaných soused kontakty. Skóre Sij|d,ACC , se vypočte podle

\

2

To dává záporné skóre znevýhodněných soused-pair a pozitivní skóre za příznivých interakcí. Hodnota skóre Sij / d, ACC může být transformována na zdánlivý termodynamický parametr vynásobením RT .

byl vypočítán čistý náboj v každé vrstvě proteinu. Kyselina asparagová a kyselina glutamová jsou považovány za negativně nabité a arginin a lysin jsou považovány za pozitivně nabité. Histidin je buď považován za nenabitý nebo pozitivně nabitý. Relativní náboj, Δ qrel , definujeme jako

\

3

kde NPositive je počet pozitivních zbytky, NNegative počet záporných reziduí a NTotal celkový počet reziduí v tom, že určité vrstvy.

The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2cae, 2aaa, 1byb, 1smd, 2myr, 3cox, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oxy, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo a 1kcw.

Výsledky a diskuse

rozdělení nabitých zbytků v různých vrstvách bílkovin 3D strukturu a celkový náboj jsou zobrazeny na Obrázku 1 . V nejvnitřnějších a nejvzdálenějších částech proteinů je čistý záporný náboj, zatímco střed má čistý kladný náboj. Tato zdánlivá třívrstvá struktura se střídavým nábojem, který vystavuje záporně nabitou vnější vrstvu rozpouštědlu, je zajímavá. Taková organizace zajistí určitou úroveň neutralizace radiálního náboje, a může případně přispět k těsnému zabalení proteinu. Podobně by tato organizace náboje povrchové vrstvy mohla poskytnout důležité elektrostatické vedení během skládání. Naopak změna pH na kyselé nebo alkalické podmínky, při kterých se podmnožiny titrovatelných zbytků nabijí, destabilizuje balení zbytků na povrchu proteinu. Pohřbené, kyselé aminokyseliny lze nalézt v několika různých proteinových strukturách a tyto zbytky hrají důležitou funkční roli například v trypsinu (McGrath et al . , 1992), ribonukleáza T1 (Giletto a Pace, 1999) a thioredoxin (Dyson et al., 1997 ; Bhavnani a kol., 2000 ). Hlášené tři vrstvy struktura je pozorována jak s a bez zarovnané sekvence, a proto není způsobena zaujatost představen zachování pohřben, nabité skupiny v rámci proteinové rodiny.

prostorové sousedy kolem každého typu rezidua byly vypočteny bez jakékoli diskriminace pro přístupnost rozpouštědel. S významnými výjimkami tryptofanu a cysteinu, aminokyseliny nebyly často pozorovány jako prostorové sousedy identických typů reziduí. Tento trend nebyl závislý na volbě vzdálenosti cut-off (výsledky nejsou zobrazeny). Rozdíly v distribuci byly pozoruhodně malé mezi různými aminokyselinami pro mezní vzdálenost 8 Å, což naznačuje, že 8 Å je dostatečně velká vzdálenost, aby se distribuce stala nezávislou na povaze centrálního zbytku. Toto pozorování vedlo k použití 8 Å jako největší vzdálenosti mezi sousedy podrobně zkoumanými.

Obrázek 2 ukazuje skóre hodnoty pro všechny aminokyseliny soused páry, které tryptofan, glycin, alanin, prolin, serin, histidin, lysin a kyselina asparagová pro souseda páry s alespoň 20% rozpouštědla dostupnost. Výsledky ostatních aminokyselin jsou k dispozici na naší domovské stránce ( http://www.bio.auc.dk/). Hodnoty skóre byly vypočteny podobně pro jiné mezní hodnoty přístupnosti rozpouštědel. Aromatický zbytek tryptofan je jedním z pouhých dvou reziduí vykazujících jasnou preferenci pro kontakty se stejným typem reziduí (druhým je cystein). Výhodné jsou také interakce s ostatními aromatickými zbytky. Zajímavé je, že interakce mezi tryptofanem a dvěma kyselými zbytky (kyselina asparagová a kyselina glutamová) se zdají odlišné. Zatímco tryptofan a kyselina glutamová jsou pozorovány méně často, než se očekávalo, opak je pozorován u tryptofanu a kyseliny asparagové. Glycin vykazuje typické negativní skóre pro interakce se stejným typem reziduí. Zdá se také, že glycin nemá sousedy v těsném prostorovém sousedství (≤3,5 Å). Toto nedostatečné zastoupení sousedů v blízkosti je pro proline ještě jasnější. Tuto nedostatečnou reprezentaci interpretujeme jako znamení preference smyčky, kterou mají zbytky prolinu. Nedostatek interakcí se všemi ostatními aminokyselinami v jeho okolí ukazuje na většinu kontaktů s molekulami rozpouštědla. Proline má však množství kontaktů ve větší vzdálenosti (4-5 Å). Histidin je zajímavé v tom, že ukazuje známky své aromatické vlastnosti, a to prostřednictvím preference pro kontakty s aromatickými zbytky (~3.5 Å), a jeho polarisable přírody, přes preferované kontakty s negativně nabité zbytky (~3 Å). Základní aminokyselina lysin má podle očekávání jasné negativní skóre pro kontakty s jinými lysiny. Příznivé elektrostatické interakce s kyselými aminokyselinami jsou zřejmé.

některé z nejzajímavějších párových interakcí jsou znázorněny na obrázku 3 . Obrázek 3A znázorňuje pár solného můstku lysin-kyselina asparagová. Silné nadměrné zastoupení pozorované při oddělení 3 Å je v souladu s klasickým konceptem solného mostu. Nadměrné zastoupení párů kyseliny lysin–asparagové v nejvíce exponovaných vrstvách rozpouštědla pozorovaných při 5,5 až 6 Å je neočekávané. Navrhujeme, aby nabíjecí sítě na povrchu proteinu mohly způsobit toto pozorování. Na obrázku 3B je znázorněn výsledek pro pár kyselina glutamová–asparagová. Nejviditelnějším rysem je očekávané nedostatečné zastoupení tohoto páru. Zdá se však, že v blízkosti proteinového povrchu není stejné omezení. Opět navrhujeme, aby k tomuto pozorování přispívaly povrchové nábojové sítě. Na obrázcích 3C a D jsou znázorněny páry aminokyselin tryptofan–glutamová kyselina a kyselina tryptofan–asparagová. Společné přesvědčení, že mutace kyseliny glutamové na kyselinu asparagovou je konzervativní, je v rozporu s uvedenými pozorováními. Dvojice kyseliny tryptofan-glutamová je ve vysoce rozpouštědlově exponovaných vrstvách proteinů velmi málo zastoupena. Překvapivě totéž nelze říci pro pár kyseliny tryptofan-asparagová, kde je pozorována nadměrná reprezentace pro interval vzdálenosti 3, 5 až 6 Å. Podobné, ale méně výrazné, pozorování bylo provedeno pro páry kyseliny tyrosin–glutamové a kyseliny tyrosin–asparagové. Mezi páry fenylalanin–glutamová a kyselina fenylalanin–asparagová nebyly pozorovány žádné významné rozdíly. Jediný rozdíl mezi kyselinou glutamovou a kyselinou asparagovou je délka postranního řetězce. Společné pro tryptofan i tyrosin je jejich polarisabilita, na rozdíl od fenylalaninu. Věříme, že povrchově umístěné tryptofany, které se podílejí na definování funkčnosti proteinů, jsou polarizovány místním elektrostatickým prostředím. I když nemůžeme poskytnout kvantitativní vysvětlení, je pravděpodobné, že rozdíly mezi jednotlivými délka řetězce kyseliny glutamové a asparagové kyseliny mohou dát přednost na blízkost tryptofan. Bylo prokázáno, že kyselina asparagová má tendenci mít příznivé interakce mezi karbonylovou skupinou postranního řetězce a páteřní karbonylovou skupinou (Deane et al . , 1999), což má za následek prstencovou strukturu. Podobné konformace nebyly pozorovány u kyseliny glutamové. Na obrázcích 3E A F jsou znázorněny páry histidin–asparagová kyselina a serin–histidin. Vzhledem k tomu, že tyto tři rezidua představují rezidua aktivního místa širokého spektra hydroláz, mají zvláštní zájem. Existuje nadměrné zastoupení párů kyseliny histidin-asparagové ve vysoce přístupných oblastech s rozpouštědly. Vzdálenost je větší než typická vzdálenost pozorovaná v aktivních štěrbinách. Malé, ale významné nadměrné zastoupení v rozmezí 3 Å však odpovídá klasickým vzdálenostem kyseliny histidin-asparagové v hydrolázách. Obrázek 3E ukazuje jasnou preferenci kontaktů mezi pohřbenými histidiny a kyselinami asparagovými. Věříme, že tato vlastnost je důležitou součástí molekulárního vývoje de novo katalytických míst. Ukládání možných katalytických “triád” v nefunkčních prostředích snižuje počet substitucí aminokyselin nezbytných k aktivaci místa.

nejvýraznějším rysem na Obrázku 3F je jasné, pod-zastoupení serin–histidin páry ve vysoce solventní vystaveny prostředí. Slabé nadměrné zastoupení páru serin-histidin je pozorováno při 3 Å v méně přístupných oblastech s rozpouštědly. Přítomnost katalytické triády je tedy zjevně určena většinou preferencí páru kyseliny histidin-asparagové, i když pár serin-histidin odhaluje podobné, ale mnohem slabší trendy.

bylo stanoveno složení aminokyselin každé vrstvy přístupnosti rozpouštědla. Jak se očekávalo, pohřbené části proteinů jsou složeny z vyššího množství nepolárních zbytků než vrstvy vystavené rozpouštědlům. Korelace mezi složením aminokyselin byla vypočtena z údajů o složení jednotlivých strukturních vrstev. Očekává se, že aminokyseliny, které mají podobné preference pro kontakt s rozpouštědlem a místní prostředí, vykazují vysokou pozitivní korelaci kvůli podobným trendům v jejich distribuci. Proto, aminokyselin vykazuje negativní korelaci budou mít různé preference pro místní prostředí, a nejsou proto věřil být kompatibilní, tj. jedné mutace webu tohoto typu na tomto místě se nedoporučuje. Jako nepolární rezidua jsou bohaté na jádro a ukázat postupný pokles jako rozpouštědlo dostupnost se zvyšuje v obecné korelace mezi nepolární rezidua je kladná (Obrázek 4 ). Naproti tomu polární zbytky jsou hojnější ve vysoce exponovaných částech, a proto negativně korelují s nepolárními zbytky. Histidin a threonin se chovají výrazně odlišně. Vykazují pozitivní vzájemnou korelaci, ale malou korelaci s některým z ostatních sloupců, s výjimkou argininu a glycinu. To je způsobeno nízkým výskytem histidinu a threoninu v pohřbených i vysoce exponovaných oblastech a jejich relativně vysokým výskytem ve středně exponovaných vrstvách. Histidin má pozitivní korelaci se dvěma aromatickými zbytky, tryptofanem a tyrosinem, a se slabě polárním threoninem a polárním argininem. Opět to interpretujeme jako známku jak aromatických vlastností, tak nábojových vlastností histidinu. Slabě polární rezidua nemají v distribuci stejnou jasnou podobnost jako polární a nepolární rezidua. Zdá se, že prolin a serin úzce souvisejí s polárními zbytky. Slabě polární zbytek alanin má pozitivní korelaci pouze s nepolárními zbytky. Navrhujeme, že mutace mezi zbytky s vysokou pozitivní korelaci mají vysokou šanci na udržení termodynamické stability 3D struktury. To platí zejména pro nabité zbytky. Naproti tomu rezidua s vysokým stupněm negativní korelace jsou typicky rezidua s různými fyzikálně-chemickými vlastnostmi, které nelze zaměnit bez změny fyzikální chemie proteinu. Nekorelované rezidua zahrnují rezidua se zvláštní úlohou ve struktuře, např. některé zbytky často zapojené do katalýzy. Věříme, že pozorování, že se prolin v naší studii chová podobně jako polární zbytky, souvisí se strukturní úlohou prolinových zbytků a jejich preferencí pro smyčky a obraty. Screening alaninu často používaný v projektech bílkovinného inženýrství zahrnuje substituci reziduí na alanin, na základě předpokladu, že alanin je “neutrální” zbytek. Naše data však ukazují, že alanin má vysokou negativní korelaci se všemi kromě nepolárních zbytků. Navrhujeme proto použití například serinu jako náhražky zbytků, které negativně korelují s alaninem.

podle názoru autorů předkládaný článek poskytuje nové důležité informace o strukturní organizaci proteinů. Povrch proteinu by měl být považován za vícevrstvý strukturální rys proteinu, kde každá vrstva má své specifické složení a výsledné vlastnosti. Tento jednoduchý klíč pozorování věříme, že bude mít značný význam pro mnoho proteinového inženýrství strategie, které se zaměřují změna rozpouštědla vystaveny zbytky.

obr. 1.

čistý relativní náboj ve vrstvách proteinových struktur s různou přístupností rozpouštědel (ACC). Čistý relativní náboj je definován jako čistý náboj na zbytek nalezený v určité vrstvě (počet kladných nábojů-počet záporných nábojů/počet reziduí). Kyselina asparagová a kyselina glutamová jsou považovány za negativní, arginin, lysin a protonované histidin pozitivní (tečkovaná čára). Pevná linie zahrnuje všechny výše uvedené zbytky kromě histidinu.

obr. 1.

čistý relativní náboj ve vrstvách proteinových struktur s různou přístupností rozpouštědel (ACC). Čistý relativní náboj je definován jako čistý náboj na zbytek nalezený v určité vrstvě (počet kladných nábojů-počet záporných nábojů/počet reziduí). Kyselina asparagová a kyselina glutamová jsou považovány za negativní, arginin, lysin a protonované histidin pozitivní (tečkovaná čára). Pevná linie zahrnuje všechny výše uvedené zbytky kromě histidinu.

obr. 2.

významně nadměrné nebo nedostatečně zastoupené sousedské páry. Všechny zbytky mají Přístupnost rozpouštědla vyšší než 20%. Vzdálenost v Å mezi zbytky je dána podél svislé osy. Červená a zelená představují oblasti, kde je počet párů menší a vyšší, než se očekávalo. A) tryptofan; B) glycin; C) prolin; D) histidin; E) lysin; F) kyselina asparagová.

obr. 2.

významně nadměrné nebo nedostatečně zastoupené sousedské páry. Všechny zbytky mají Přístupnost rozpouštědla vyšší než 20%. Vzdálenost v Å mezi zbytky je dána podél svislé osy. Červená a zelená představují oblasti, kde je počet párů menší a vyšší, než se očekávalo. A) tryptofan; B) glycin; C) prolin; D) histidin; E) lysin; F) kyselina asparagová.

obr. 3.

nad-a pod-reprezentované sousedské páry jako funkce přístupnosti rozpouštědla (ACC)a vzdálenosti (Å). Vzdálenost mezi zbytky je dána podél svislé osy a přístupností rozpouštědla podél vodorovné osy. A) kyselina lysin-asparagová; B) kyselina glutamová-kyselina asparagová; C) kyselina tryptofan-glutamová; D) kyselina tryptofan-asparagová; E) kyselina histidin-asparagová; F) serin-histidin.

obr. 3.

nad-a pod-reprezentované sousedské páry jako funkce přístupnosti rozpouštědla (ACC)a vzdálenosti (Å). Vzdálenost mezi zbytky je dána podél svislé osy a přístupností rozpouštědla podél vodorovné osy. A) kyselina lysin-asparagová; B) kyselina glutamová–kyselina asparagová; C) kyselina tryptofan–glutamová; D) kyselina tryptofan–asparagová; E) kyselina histidin–asparagová; F) serin–histidin.

obr. 4.

korelace mezi distribucí aminokyselin v proteinech. Korelace se vypočítá na základě složení aminokyselin různých vrstev vrstvy přístupnosti rozpouštědla proteinové struktury. Zelené plochy představují pozitivní korelaci, zatímco červené oblasti představují negativní korelaci. Oblasti s nízkým stupněm korelace jsou bílé.

obr. 4.

korelace mezi distribucí aminokyselin v proteinech. Korelace se vypočítá na základě složení aminokyselin různých vrstev vrstvy přístupnosti rozpouštědla proteinové struktury. Zelené plochy představují pozitivní korelaci, zatímco červené oblasti představují negativní korelaci. Oblasti s nízkým stupněm korelace jsou bílé.

1

komu by měla být adresována korespondence. E-mail: [email protected]

P. H. J. děkuje výzkumné Radě Norska za finanční podporu (NFR-116316/410). S. B. P. vyjadřuje vděčnost za finanční podporu Obelsk Familiefond, stejně jako Mål-2.

Andrade,M. a., O ‘ donoghue,S. I. a Rost,B.(

1998

)

J. Mol. Biol.

,

276

,

517

–525.

Bairoch,A. a Apweiler,R.(

1997

)

Nukleové Kyseliny Res.

,

25

,

31

-36.

Bernstein,F. C., Koetzle,T. F., Williams,G. J., Meyer,E. E., Jr., Brice,M. D., Rodgers,J. R., Kennard,O. Šimanouchi, T. A Tasumi, m.(

1977

)

J. Mol. Biol.

,

112

,

535

–542.

Bhavnani,M., Lloyd,D., Bhattacharyya,A., Marples,J., Elton,P. a Worwood,M.(

2000

)

Gut

,

46

,

707

-710.

Brocchieri, L. A Karlín, s.(

1995

)

Proc. Natl Acad. Věda. USA

,

92

,

12136

-12140.

Bryant, S. H. a Amzel, L. M.(

1987

)

Int. J. Pept. Protein Res.

,

29

,

46

-52.

Burley,S. K. a Petsko,G. a.(

1985

)

Věda

,

229

,

23

-28.

Chandonia,J. M. a Karplus,M.(

1999

)

Proteiny

,

35

,

293

-306.

Chothia,C.(

1976

)

J. Mol. Biol.

,

105

,

1

–14.

Chou,P. Y. a Fasman,G. D.(

1978

)

Annu. Páter Biochem.

,

47

,

251

–276.

Deane,C. M., Allen,F. H., Taylor,R. a Blundell,T. L.(

1999

)

Protein Eng.

,

12

,

1025

–1028.

Dodge,C., Schneider,R. a Sander,C.(

1998

)

Nukleové Kyseliny Res.

,

26

,

313

–315.

Donnelly,D., Overington,J. P. a Blundell,T. L.(

1994

)

Protein Eng.

,

7

,

645

–653.

Dyson,H. J., Jeng,M. F., Tennant,L. L., Slaby,I., Lindell,M., Cui,D. S., Kuprin,a. S. Holmgren,A.(

1997

)

Biochemie

,

36

,

2622

-2636.

Giletto,A. a Pace, C. N. (

1999

)

Biochemie

,

38

,

13379

-13384.

Goldman,N., Thorne,J. L., Jones,D. T. (

1998

)

Genetika

,

149

,

445

-458.

Golovanov,a. P., Volynsky,P. E. Ermakova,S. B. a Arseniev,A. S.(

1999

)

Protein Eng.

,

12

,

31

–40.

Hobohm, U. a Sander, C. (

1994

)

Protein Sci.

,

3

,

522

–524.

Hobohm, u., Scharf, m., Schneider, R. a Sander, C.(

1992

)

Protein Sci.

,

1

,

409

–417.

Holbrook,S. R., Muskal,S. M. a Kim,S. H.(

1990

)

Protein Eng.

,

3

,

659

–665.

Jones,D. T. (

1999

)

J. Mol. Biol.

,

292

,

195

–202.

McGrath,M. E., Vasquez,J. R., Craik,C. S., Yang,A. S., Honig,v. B. a Fletterick,R. J.(

1992

)

Biochemie

,

31

,

3059

-3064.

Miller,S., Janine,J., J., A. M. a Chothia,C.(

1987

)

J. Mol. Biol.

,

196

,

641

–656.

Miyazawa,a. S. Jernigan,R. L.(

1993

)

Protein Eng.

,

6

,

267

–278.

Miyazawa,a. S. Jernigan,R. L.(

1996

)

J. Mol. Biol.

,

256

,

623

–644.

Miyazawa,a. S. Jernigan,R. L.(

1999

)

Proteiny

,

36

,

347

-356.

Mucchielli-Giorgi,M. H., Tuffery,P. a Hazout,a. S.(

1999

)

Teorie. Chime. Padělání.

,

101

,

186

–193.

Overington,J., Donnelly,D., Johnson,M. S., SŠali,A. a Blundell,T. L.(

1992

)

Protein Sci.

,

1

,

216

–226.

Petersen,M. T. N., Jonson,P. H. a Petersen,S. B.(

1999

)

Protein Eng.

,

12

,

535

–548.

Petersen,S. B., Jonson,P. H., Fojan,P., Petersen,E. I., Petersen,M. T. N., Hansen,S., Ishak,R. J. a Hough,E. (

1998

)

J. Biotechnol.

,

66

,

11

–26.

Rost,B. a Sander,C.(

1994

)

Proteiny

,

20

,

216

-226.

Thompson,M., J. Goldsteinová,R. a.(

1996

)

Proteiny

,

25

,

38

-47.

Vonderviszt,F., Mátrai,G. a Simon,I.(

1986

)

Int. J. Pept. Protein Res.

,

27

,

483

-492.

Wako,H. a Blundell,T. L.(

1994

)

J. Mol. Biol.

,

238

,

693

-708.

Wojcik,J., Mornon,J. P. a Chomilier,J.(

1999

)

J. Mol. Biol.

,

289

,

1469

-1490.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.