a critical view on conservative mutations

Abstract

analizując skład powierzchniowy zestawu struktur 3D białek, uzupełniony o przewidywane informacje o składzie powierzchniowym dla białek homologicznych, znaleźliśmy istotne dowody na warstwowy skład struktur białkowych. W najbardziej wewnętrznej i zewnętrznej części białek znajduje się ładunek ujemny netto,podczas gdy środek ma ładunek dodatni netto. Ponadto nasze ustalenia wskazują, że koncepcja mutacji konserwatywnej wymaga istotnej rewizji, np. stwierdzono bardzo różne preferencje przestrzenne dla kwasu glutaminowego i asparaginowego. Badanie przesiewowe alaniny często stosowane w projektach inżynierii białek polega na zastąpieniu pozostałości alaniną, opierając się na założeniu, że alanina jest pozostałością “neutralną”. Jednak alanina ma wysoką ujemną korelację ze wszystkimi, poza pozostałościami niepolarnymi. Dlatego proponujemy zastosowanie np. seryny jako substytutu reszt, które są ujemnie skorelowane z alaniną.

wprowadzenie

po złożeniu łańcucha peptydowego w strukturę białka 3D, niektóre pozostałości są przenoszone ze środowiska polarnego do środowiska bardziej niepolarnego we wnętrzu złożonego białka. Ten transfer jest napędzany przez termodynamiczne właściwości aminokwasów i rozpuszczalnika. W trakcie ewolucji molekularnej natura wybrała odpowiednią funkcję i stabilność powstałego białka. W przypadku małych i średnich białek—w złożonej strukturze-tylko kilka pozostałości jest całkowicie zakopanych ( Chothia , 1976; Miller et al., 1987; Petersen et al., 1998), podczas gdy większość pozostałości jest tylko częściowo zakopana. Zmiana dostępności rozpuszczalnika zależy od właściwości danej pozostałości i znajduje odzwierciedlenie w składzie aminokwasów w całej strukturze białka. Te różnice w profilu dostępności rozpuszczalnika znalazły szerokie zastosowanie w różnych metodach przewidywania struktury (Holbrook et al., 1990 ; Rost and Sander, 1994; Thompson and Goldstein, 1996). Również zastosowanie specyficznych dla środowiska matryc substytucyjnych (Donnelly et al., 1994; Wako i Blundell, 1994) okazały się cenne. Sekwencyjne sąsiedztwo aminokwasów było wcześniej badane (Vonderviszt et al., 1986) i jego zastosowanie znalazło na przykład w przewidywaniu pętli ( Wójcik et al., 1999) oraz przewidywania struktury wtórnej ( Chou i Fasman, 1978 ; Chandonia i Karplus, 1999 ; Jones, 1999). Nie stwierdzono istotnej korelacji pomiędzy sekwencyjnymi preferencjami sąsiadujących pozostałości.

przestrzenne sąsiedztwo wokół pojedynczych pozostałości również było wcześniej badane (Burley and Petsko, 1985; Bryant and Amzel, 1987 ; Miyazawa and Jernigan, 1993; Petersen et al., 1999 ). Ponadto badano kontakty przestrzenne w celu uzyskania potencjałów kontaktowych dla różnych interakcji aminokwasowych (Brocchieri i Karlin, 1995 ; Miyazawa i Jernigan, 1996 , 1999 ). Wspólną strategią jest badanie liczby kontaktów w danej odległości. Jednak literatura wydaje się pozbawiona badań nad odległymi kontaktami, a także raportów wykorzystujących wbudowane informacje o dostępności rozpuszczalników związanych z pozostałościami.

zgłoszono dwustanową prognozę korelacji dostępności rozpuszczalnika między hydrofobowością, skłonnością do Zakopanego kontaktu i lokalizacją w oknie przewidywania(Mucchielli-Giorgi et al., 1999 ). Nie opisuje jednak żadnej korelacji między poszczególnymi rozkładami pozostałości.

ważne jest, aby móc rozróżniać między prawidłowo złożonymi i źle złożonymi strukturami modelu. Zwrócono uwagę, że metody oparte na potencjalnej energii nie rozróżniają dobrze między złożonymi i źle złożonymi strukturami. Jednak cechy strukturalne, takie jak zakopana powierzchnia polarna ( Overington et al., 1992) i liczba kontaktów polarnych ( Bryant and Amzel, 1987; Golovanov et al., 1999 ) okazały się cenne.

w inżynierii białek często stosuje się pojęcie mutacji konserwatywnych. Ogólna idea jest taka, że podstawienie aminokwasu innym aminokwasem o podobnych właściwościach fizykochemicznych nie wpłynie na stabilność i funkcję białka. W niniejszej pracy wykazano, że preferencje przestrzenne dla podobnych pozostałości mogą być diametralnie różne w strukturach białkowych w podobnych okolicznościach (w tym kontekście dostępność rozpuszczalników).

wyniki analizy sąsiada będą cenne w walidacji modelu, jako narzędzie do przewidywania struktury, a zwłaszcza jako przewodnik w poszukiwaniu mutacji zwiększających stabilność.

metody

stosowane sekwencje są podzbiorem 25% zbioru identyczności sekwencji struktur niehomologicznych (Hobohm et al., 1992 ; Hobohm and Sander, 1994) Pochodzące ze struktury białka PDB (Bernstein et al., 1977 ). Zastosowano tylko jednołańcuchowe sekwencje białkowe. Powstały zbiór danych składał się z 336 sekwencji jedno łańcuchowych o maksymalnej identyczności parowej 25%. Podzbiór został rozszerzony poprzez zastosowanie odpowiednich plików HSSP (Dodge et al., 1998 ). Całkowity zestaw danych zawierał 8379 wyrównanych sekwencji i 1 415 986 pozostałości. Odpowiada to 6,7% wszystkich pozostałości w wersji 34 SWISS-PROT (Bairoch i Apweiler, 1997). Długość sekwencji wynosiła od 64 do 1017 reszt. Rozdzielczość użytych struktur rentgenowskich wahała się między 1,0 A 3,0 Å, Ze średnią 2,0 Å. Ponadto podzbiór zawierał 31 struktur rozwiązanych przez NMR. Jednak wszystkie współrzędne wodoru i atomu zostały odrzucone. W celu sprawdzenia możliwego odchylenia wprowadzonego przez zastosowanie sekwencji homologicznych przeprowadzono kompletną analizę z wyrównanymi sekwencjami i bez nich. Nie zaobserwowano znaczących różnic, chociaż Zmniejszony rozmiar mniejszego z dwóch zestawów danych, zgodnie z oczekiwaniami, spowodował większy hałas.

przestrzenne sąsiedztwo każdej pozostałości określono na podstawie dostępności rozpuszczalnika i odległości przestrzennej. Dostępność rozpuszczalnika została pobrana z odpowiednich plików HSSP(Dodge et al., 1998 ). Dla każdej pozostałości powierzchniowej sąsiadujące pozostałości powierzchniowe zgrupowano według ich odległości od danej pozostałości. Odległość między dwoma reszt została obliczona jako Najkrótsza odległość między zbiorem wszystkich możliwych par atomów w dwóch reszt. Zakładamy, że wyrównanie w pliku HSSP oznacza, że sąsiedzi w głównej sekwencji są również sąsiadami w wyrównanych sekwencjach i że dostępność rozpuszczalnika jest zachowana (Andrade et al., 1998; Goldman et al., 1998 ). Oczekiwaną liczbę oddziaływań sąsiadujących pomiędzy pozostałościami typu i I j oblicza się na podstawie

\

1

gdzie xi i xj są frakcją aminokwasu i I j w zbiorze danych dla zakresu odległości d, a przy dostępie rozpuszczalnika większym niż granica ACC, a N0 jest całkowitą liczbą obserwowanych kontaktów sąsiadujących. Wynik, Sij / D, ACC, jest obliczany przez

\

2

daje to ujemny wynik dla nieprzystosowanych par sąsiadów i dodatni wynik dla preferowanych interakcji. Wartość wyniku Sij / D, ACC można przekształcić w pozorny parametr termodynamiczny przez mnożenie przez RT .

obliczono ładunek netto w każdej warstwie białka. Kwas asparaginowy i kwas glutaminowy są uważane za naładowane ujemnie, a arginina i lizyna są uważane za naładowane dodatnio. Histydyna jest albo uważany za uncharged lub dodatnio naładowany. Względny ładunek netto, Δ qrel, definiujemy jako

\

3

w przypadku gdy NPositive oznacza liczbę dodatnich pozostałości, NNegative liczbę ujemnych pozostałości, a NTotal całkowitą liczbę pozostałości w danej warstwie.

The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2cae, 2aaa, 1byb, 1smd, 2myr, 3cox, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oxy, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo i 1kcw.

wyniki i dyskusja

rozkład naładowanych pozostałości w różnych warstwach struktury 3D białka i całkowity ładunek netto przedstawiono na fig .1. W najbardziej wewnętrznej i zewnętrznej części białek znajduje się ładunek ujemny netto,podczas gdy środek ma ładunek dodatni netto. Ta pozorna trójwarstwowa struktura z naprzemiennym ładunkiem wystawiająca ujemnie naładowaną zewnętrzną warstwę na rozpuszczalnik jest interesująca. Taka organizacja zapewni pewien poziom neutralizacji ładunku promieniowego i może przyczynić się do szczelnego pakowania białka. Podobnie ta organizacja ładunku warstwy powierzchniowej może zapewnić ważne prowadzenie elektrostatyczne podczas składania. Odwrotnie, zmiana pH na kwaśne lub zasadowe warunki, w których podzbiory pozostałości miareczkowanych stają się nieobciążone, destabilizuje pakowanie pozostałości na powierzchni białka. Zakopane, kwaśne aminokwasy można znaleźć w kilku różnych strukturach białkowych, a te pozostałości odgrywają ważną rolę funkcjonalną, na przykład w trypsynie (McGrath et al., 1992), rybonukleaza T1 ( Giletto and Pace, 1999) i tioredoksyna ( Dyson et al., 1997; Bhavnani et al., 2000 ). Opisywana trójwarstwowa struktura jest obserwowana zarówno z wyrównaną sekwencją, jak i bez niej, a zatem nie jest spowodowana odchyleniem wprowadzonym przez zachowanie zakopanych, naładowanych grup w rodzinie białek.

przestrzenne sąsiedztwo wokół każdego rodzaju pozostałości obliczono bez rozróżniania dostępności rozpuszczalników. Z godnymi uwagi wyjątkami tryptofanu i cysteiny, aminokwasy nie były często obserwowane jako przestrzenne sąsiedztwo identycznych typów pozostałości. Tendencja ta nie była uzależniona od wyboru granicy odległości (wyniki nie zostały pokazane). Różnice w dystrybucji były wyjątkowo małe między różnymi aminokwasami dla odcięcia odległości 8 Å, co sugeruje, że 8 Å jest wystarczająco dużą odległością, aby Dystrybucja stała się niezależna od Natury centralnej reszty. Obserwacja ta doprowadziła do zastosowania 8 Å jako największej odległości między sąsiadami zbadanymi szczegółowo.

fig.2 Przedstawia wartości score dla wszystkich par sąsiadujących aminokwasów obejmujących tryptofan, glicynę, alaninę, prolinę, serynę, histydynę, lizynę i kwas asparaginowy dla par sąsiadujących z co najmniej 20% dostępnością rozpuszczalnika. Wyniki dla innych aminokwasów są dostępne na naszej stronie internetowej ( http://www.bio.auc.dk/ ). Podobnie obliczono wartości punktowe dla innych odcięć dostępności rozpuszczalnika. Pozostałość aromatyczna tryptofanu jest jedną z zaledwie dwóch pozostałości wykazujących wyraźne preferencje w kontaktach z tym samym typem pozostałości (drugą jest cysteina). Preferowane są również interakcje z innymi pozostałościami aromatycznymi. Co ciekawe, interakcje między tryptofanem a dwoma kwasowymi pozostałościami (kwasem asparaginowym i kwasem glutaminowym) wydają się różne. Podczas gdy tryptofan i kwas glutaminowy są obserwowane rzadziej niż oczekiwano, odwrotnie jest w przypadku tryptofanu i kwasu asparaginowego. Glicyna wykazuje typowy wynik ujemny dla interakcji z tym samym typem pozostałości. Ponadto glicyna nie wydaje się mieć sąsiadów w bliskim sąsiedztwie przestrzennym (≤3,5 Å). Ta niedostateczna reprezentacja bliskich sąsiadów jest jeszcze wyraźniejsza dla proline. Tę niedostateczną reprezentację interpretujemy jako znak preferencji dla pętli, jaką mają reszty prolinowe. Brak interakcji ze wszystkimi innymi aminokwasami w jego pobliżu wskazuje na większość kontaktów z cząsteczkami rozpuszczalnika. Jednak prolina ma obfitość kontaktów na większych odległościach (4-5 Å). Histydyna jest interesująca tym, że wykazuje oznaki swoich właściwości aromatycznych, poprzez preferowanie kontaktów z pozostałościami aromatycznymi (~3,5 Å) i jej polaryzowalny charakter, poprzez preferowane kontakty z ujemnie naładowanymi pozostałościami (~3 Å). Zasadowy aminokwas lizyna ma, zgodnie z oczekiwaniami, wyraźny ujemny wynik dla kontaktów z innymi lizynami. Korzystne oddziaływanie elektrostatyczne z aminokwasami kwaśnymi jest oczywiste.

niektóre z najciekawszych interakcji pary są pokazane na rysunku 3 . Rysunek 3A przedstawia parę mostków solnych lizyna-kwas asparaginowy. Silna over-reprezentacja widziana przy 3 Å separacji jest zgodna z klasyczną koncepcją mostu solnego. Nadmierna reprezentacja par lizyny i kwasu asparaginowego w najbardziej narażonych na działanie rozpuszczalnika warstwach obserwowana przy 5,5 do 6 Å jest nieoczekiwana. Proponujemy, że sieci ładowania na powierzchni białka mogą spowodować taką obserwację. Na fig. 3B przedstawiono wynik pary kwas glutaminowy-kwas asparaginowy. Najbardziej oczywistą cechą jest oczekiwana niedostateczna reprezentacja tej pary. Jednak blisko powierzchni białka to samo ograniczenie nie wydaje się być obecne. Ponownie proponujemy, aby sieci ładunków zlokalizowanych powierzchniowo przyczyniały się do tej obserwacji. Na fig. 3C i D przedstawiono pary aminokwasów tryptofan–kwas glutaminowy i tryptofan–kwas asparaginowy. Powszechne przekonanie, że mutacja kwasu glutaminowego w kwas asparaginowy jest konserwatywna, jest sprzeczne z przedstawionymi obserwacjami. Para tryptofan-kwas glutaminowy jest bardzo słabo reprezentowana w silnie narażonych na działanie rozpuszczalników warstwach białek. Zaskakujące jest to, że tego samego nie można powiedzieć o parze tryptofan–kwas asparaginowy, gdzie obserwuje się nadmierną reprezentację dla odstępu od 3,5 do 6 Å. Podobną, ale mniej wyraźną obserwację przeprowadzono dla par kwasu tyrozyny-glutaminowego i kwasu tyrozyny-asparaginowego. Nie zaobserwowano istotnych różnic pomiędzy parami fenyloalanina–kwas glutaminowy i fenyloalanina–kwas asparaginowy. Jedyną różnicą między kwasem glutaminowym a kwasem asparaginowym jest długość łańcucha bocznego. Wspólna zarówno dla tryptofanu, jak i tyrozyny jest ich polaryzowalność, w przeciwieństwie do fenyloalaniny. Uważamy, że zlokalizowane na powierzchni tryptofany zaangażowane w definiowanie funkcjonalności białek są spolaryzowane przez lokalne środowisko elektrostatyczne. Chociaż nie możemy podać ilościowego wyjaśnienia, jest prawdopodobne, że różnice między różnymi długościami łańcucha kwasu glutaminowego i kwasu asparaginowego mogą faworyzować bliskość tryptofanu. Wykazano, że kwas asparaginowy ma tendencję do korzystnych interakcji między grupą karbonylową łańcucha bocznego a grupą karbonylową szkieletu (Deane i wsp . , 1999), w wyniku czego powstała struktura przypominająca pierścień. Nie obserwowano podobnych konformacji dla kwasu glutaminowego. Na fig. 3E I F przedstawiono pary histydyna-kwas asparaginowy i seryna-histydyna. Ponieważ te trzy pozostałości stanowią pozostałości w miejscu aktywnym szerokiego zakresu hydrolaz, mają one szczególne znaczenie. Występuje nadmierna reprezentacja par kwasu histydyna-asparaginowego w obszarach o dużym dostępie rozpuszczalnika. Odległość jest większa niż typowa odległość obserwowana w szczelinach aktywnych. Jednak mała, ale znacząca, nadprezentacja w zakresie 3 Å jest zgodna z klasycznymi odległościami kwasu histydynowo-asparaginowego w hydrolazach. Rysunek 3E pokazuje wyraźne preferowanie kontaktów między zakopanymi histydynami a kwasami asparaginowymi. Uważamy, że ta cecha jest ważną częścią ewolucji molekularnej miejsc katalitycznych de novo. Przechowywanie możliwych katalitycznych “Triad” w niefunkcjonalnych środowiskach sprawia, że liczba podstawień aminokwasów niezbędnych do aktywacji miejsca jest mniejsza.

najbardziej wyraźną cechą na fig. 3F jest wyraźna niedostateczna reprezentacja par seryna-histydyna w środowiskach silnie narażonych na działanie rozpuszczalników. Słaba nadreprezentacja pary seryna-histydyna jest obserwowana przy 3 Å w mniej dostępnych rozpuszczalnikach. Tak więc obecność triady katalitycznej najwyraźniej jest determinowana głównie przez Preferencje pary histydyna-kwas asparaginowy, chociaż para seryna-histydyna ujawnia podobne, ale znacznie słabsze tendencje.

oznaczono skład aminokwasowy każdej warstwy dostępności rozpuszczalnika. Zgodnie z oczekiwaniami Zakopane części białek składają się z większej ilości pozostałości niepolarnych niż warstwy bardziej narażone na działanie rozpuszczalnika. Korelację pomiędzy składem aminokwasowym obliczono na podstawie danych o składzie poszczególnych warstw strukturalnych. Oczekuje się, że aminokwasy, które mają podobne preferencje dotyczące kontaktu z rozpuszczalnikiem i środowiska lokalnego, wykazują wysoką dodatnią korelację ze względu na podobne trendy w ich dystrybucji. W związku z tym aminokwasy wykazujące ujemną korelację będą miały różne preferencje dla lokalnego środowiska i dlatego uważa się, że nie są kompatybilne, tzn. pojedyncza mutacja tego typu w tym miejscu nie jest zalecana. Ponieważ pozostałości niepolarne są obfite w rdzeniu i wykazują stopniowy spadek wraz ze wzrostem dostępności rozpuszczalnika, korelacja między pozostałościami niepolarnymi jest dodatnia (Fig. 4). W przeciwieństwie do tego, pozostałości polarne są bardziej obfite w wysoce narażonych częściach, a zatem są ujemnie skorelowane z pozostałościami niepolarnymi. Histydyna i treonina zachowują się znacznie inaczej. Wykazują one dodatnią korelację ze sobą, ale niewielką korelację z którąkolwiek z pozostałych kolumn, z wyjątkiem argininy i glicyny. Jest to spowodowane niskim występowaniem histydyny i treoniny zarówno w obszarach zakopanych, jak i wysoce narażonych oraz ich stosunkowo wysokim występowaniem w średnio narażonych warstwach. Histydyna wykazuje dodatnią korelację z dwoma pozostałościami aromatycznymi, tryptofanem i tyrozyną oraz słabo polarną treoniną i polarną argininą. Ponownie interpretujemy to jako znak zarówno właściwości aromatycznych, jak i właściwości ładunku histydyny. Słabo polarne pozostałości nie mają takiego samego wyraźnego podobieństwa w dystrybucji jak pozostałości polarne i niepolarne. Prolina i seryna wydają się być bliżej spokrewnione z pozostałościami polarnymi. Słabo polarna pozostałość alaniny ma dodatnią korelację tylko z pozostałościami niepolarnymi. Proponujemy, że mutacje pomiędzy resztami o wysokiej dodatniej korelacji mają dużą szansę na utrzymanie stabilności termodynamicznej struktury 3D. Dotyczy to w szczególności naładowanych pozostałości. Natomiast pozostałości o wysokim stopniu korelacji ujemnej są zazwyczaj pozostałościami o różnych właściwościach fizykochemicznych, których nie można wymieniać bez zmiany Chemii Fizycznej białka. Niezrównane pozostałości obejmują pozostałości, które odgrywają szczególną rolę w strukturze, np. niektóre pozostałości często biorą udział w katalizie. Uważamy, że obserwacja, że prolina w naszych badaniach zachowuje się podobnie do reszt polarnych, jest związana z strukturalną rolą reszt prolinowych i ich preferencją dla pętli i zwojów. Badanie przesiewowe alaniny często stosowane w projektach inżynierii białek polega na zastąpieniu pozostałości alaniną, opierając się na założeniu, że alanina jest pozostałością “neutralną”. Jednak nasze dane pokazują, że alanina ma wysoką ujemną korelację ze wszystkimi, poza pozostałościami niepolarnymi. Dlatego proponujemy zastosowanie np. seryny jako substytutu reszt, które są ujemnie skorelowane z alaniną.

w opinii autorów niniejsza praca dostarcza istotnych nowych informacji na temat struktury białek. Powierzchnia białka powinna być postrzegana jako wielowarstwowa cecha strukturalna białka, gdzie każda warstwa ma swój specyficzny skład i wynikające z tego cechy. Ta prosta kluczowa obserwacja, naszym zdaniem, będzie miała istotne znaczenie dla wielu strategii inżynierii białek, które ukierunkowane są na modyfikację pozostałości narażonych na działanie rozpuszczalnika.

1.

ładunek względny netto w warstwach struktur białkowych o różnej dostępności rozpuszczalnika (ACC). Ładunek względny netto definiuje się jako ładunek netto za pozostałość znalezioną w danej warstwie (liczba ładunków dodatnich – liczba ładunków ujemnych/liczba pozostałości). Kwas asparaginowy i kwas glutaminowy są uważane za ujemne, arginina, lizyna i protonowana histydyna dodatnie (linia kropkowana). Linia stała zawiera wszystkie wyżej wymienione pozostałości z wyjątkiem histydyny.

Fig. 1.

ładunek względny netto w warstwach struktur białkowych o różnej dostępności rozpuszczalnika (ACC). Ładunek względny netto definiuje się jako ładunek netto za pozostałość znalezioną w danej warstwie (liczba ładunków dodatnich – liczba ładunków ujemnych/liczba pozostałości). Kwas asparaginowy i kwas glutaminowy są uważane za ujemne, arginina, lizyna i protonowana histydyna dodatnie (linia kropkowana). Linia stała zawiera wszystkie wyżej wymienione pozostałości z wyjątkiem histydyny.

Fig. 2.

znacznie powyżej lub poniżej reprezentowanych par sąsiadów. Wszystkie pozostałości mają dostępność rozpuszczalnika wyższą niż 20%. Odległość w Å między pozostałościami jest podana wzdłuż osi pionowej. Czerwony i zielony reprezentują obszary, w których liczba par jest odpowiednio mniejsza i wyższa niż oczekiwano. A) tryptofan; B) glicyna; C) prolina; d) histydyna; E) lizyna; f) kwas asparaginowy.

Fig. 2.

znacznie powyżej lub poniżej reprezentowanych par sąsiadów. Wszystkie pozostałości mają dostępność rozpuszczalnika wyższą niż 20%. Odległość w Å między pozostałościami jest podana wzdłuż osi pionowej. Czerwony i zielony reprezentują obszary, w których liczba par jest odpowiednio mniejsza i wyższa niż oczekiwano. A) tryptofan; B) glicyna; C) prolina; d) histydyna; E) lizyna; f) kwas asparaginowy.

Fig. 3.

nad – i pod-reprezentowane pary sąsiadów jako funkcja dostępności rozpuszczalnika (ACC) i odległości (Å). Odległość między pozostałościami jest podana wzdłuż osi pionowej, a dostęp rozpuszczalnika wzdłuż osi poziomej. A) lizyna-kwas asparaginowy; B) kwas glutaminowy-kwas asparaginowy; C) tryptofan-kwas glutaminowy; D) kwas tryptofan-asparaginowy; E) kwas histydyna–asparaginowy; F) seryna-histydyna.

Fig. 3.

nad – i pod-reprezentowane pary sąsiadów jako funkcja dostępności rozpuszczalnika (ACC) i odległości (Å). Odległość między pozostałościami jest podana wzdłuż osi pionowej, a dostęp rozpuszczalnika wzdłuż osi poziomej. A) lizyna–kwas asparaginowy; B) kwas glutaminowy–kwas asparaginowy; C) tryptofan–kwas glutaminowy; D) kwas tryptofan–asparaginowy; E) histydyna–kwas asparaginowy; F) seryna-histydyna.

Fig. 4.

korelacja pomiędzy dystrybucją aminokwasów w białkach. Korelację oblicza się na podstawie składu aminokwasowego różnych warstw warstwy dostępności rozpuszczalnika struktury białka. Obszary zielone reprezentują korelację dodatnią, podczas gdy obszary czerwone reprezentują korelację ujemną. Obszary o niskim stopniu korelacji są białe.

Fig. 4.

korelacja pomiędzy dystrybucją aminokwasów w białkach. Korelację oblicza się na podstawie składu aminokwasowego różnych warstw warstwy dostępności rozpuszczalnika struktury białka. Obszary zielone reprezentują korelację dodatnią, podczas gdy obszary czerwone reprezentują korelację ujemną. Obszary o niskim stopniu korelacji są białe.

1

do kogo należy kierować korespondencję. E-mail: [email protected]

P. H. J. dziękuje Norweskiej Radzie ds. badań naukowych za wsparcie finansowe (NFR-116316/410). S. B. P. wyraża wdzięczność za wsparcie finansowe ze strony Obelsk Familiefond oraz Mål-2.

Andrade, M. A., O ‘ Donoghue, S. I. and Rost, B. (

1998

)

J. Mol. Biol.

,

276

,

517

–525.

Bairoch, A. and Apweiler, R. (

1997

)

kwasy nukleinowe Res.

,

25

,

31

-36.

Bernstein, F. C., Koetzle, T. F., Williams, G. J., Meyer, E. E., Jr, Brice, M. D., Rodgers, J. R., Kennard, O., Shimanouchi, T. and Tasumi,M. (

1977

)

J. Mol. Biol.

,

112

,

535

–542.

Bhavnani, M., Lloyd, D.,Bhattacharyya, A., Marples, J., Elton, P. and Worwood, M. (

2000

)

Gut

,

46

,

707

-710.

Brocchieri, L. I Karlin, S. (

1995

)

Proc. Natl Acad. Sci. USA

,

92

,

12136

-12140.

Bryant, S. H. i Amzel, L. M. (

1987

)

Int. J. Pept. Protein Res.

,

29

,

46

-52.

Burley, S. K. i Petsko, G. A. (

1985

)

Nauka

,

229

,

23

-28.

Chandonia, J. M. and Karplus, M. (

1999

)

białka

,

35

,

293

-306.

Chothia, C. (

1976

)

J. Mol. Biol.

,

105

,

1

–14.

Chou, P. Y. and Fasman, G. D. (

1978

)

Annu. Rev. Biochem.

,

47

,

251

–276.

Deane, C. M., Allen, F. H., Taylor, R. and Blundell, T. L. (

1999

)

białko inż.

,

12

,

1025

–1028.

Dodge,C., Schneider, R. i Sander, C. (

1998

)

kwasy nukleinowe Res.

,

26

,

313

–315.

Donnelly, D., Overington, J. P. and Blundell, T. L. (

1994

)

białko inż.

,

7

,

645

–653.

Dyson, H. J., Jeng, M. F., Tennant, L. L., Slaby, I., Lindell, M., Cui, D. S., Kuprin, S. and Holmgren,A. (

1997

)

Biochemia

,

36

,

2622

-2636.

Giletto, A. and Pace, C. N. (

1999

)

Biochemia

,

38

,

13379

-13384.

Goldman, N., Thorne, J. L. and Jones, D. T. (

1998

)

genetyka

,

149

,

445

-458.

Golovanov, A. P., Volynsky, P. E., Ermakova, S. B. and Arseniev, A. S. (

1999

)

białko inż.

,

12

,

31

–40.

Hobohm, U. I Sander, C. (

1994

)

Protein Sci.

,

3

,

522

–524.

Hobohm, U., Scharf, M.,Schneider, R. and Sander, C. (

1992

)

Protein Sci.

,

1

,

409

–417.

Holbrook, S. R., Muskal, S. M. and Kim, S. H. (

1990

)

białko inż.

,

3

,

659

–665.

Jones, D. T. (

1999

)

J. Mol. Biol.

,

292

,

195

–202.

McGrath, M. E., Vasquez, J. R., Craik, C. S.,Yang, A. S., Honig, B. and Fletterick, R. J. (

1992

)

Biochemia

,

31

,

3059

-3064.

Miller, S., Janin, J.,Lesk, A. M. and Chothia, C. (

1987

)

J. Mol. Biol.

,

196

,

641

–656.

Miyazawa, S. and Jernigan, R. L. (

1993

)

białko inż.

,

6

,

267

–278.

Miyazawa, S. and Jernigan, R. L. (

1996

)

J. Mol. Biol.

,

256

,

623

–644.

Miyazawa, S. and Jernigan, R. L. (

1999

)

białka

,

36

,

347

-356.

Mucchielli-Giorgi, M. H., Tuffery, P. and Hazout, S. (

1999

)

Theor. Chim. Acta.

,

101

,

186

–193.

Overington, J., Donnelly, D., Johnson, M. S., SŠali, A. and Blundell, T. L. (

1992

)

Protein Sci.

,

1

,

216

–226.

Petersen, M. T. N., Jonson, P. H. and Petersen, S. B. (

1999

)

białko inż.

,

12

,

535

–548.

Petersen, S. B., Jonson, P. H.,Fojan, P.,Petersen, E. I.,Petersen, M. T. N.,Hansen, S.,Ishak, R. J. and Hough, E. (

1998

)

J. Biotechnol.

,

66

,

11

–26.

Rost, B. I Sander, C. (

1994

)

białka

,

20

,

216

-226.

Thompson, M. J. and Goldstein, R. A. (

1996

)

białka

,

25

,

38

-47.

Vonderviszt, F., Mátrai, G. and Simon, I. (

1986

)

Int. J. Pept. Protein Res.

,

27

,

483

-492.

Waco H. I Blundell T. L. (

1994

)

J. Mol. Biol.

,

238

,

693

-708.

Wójcik, J.Polski, Mornon, J.W.P. i Chomilje, J. (

1999

)

J. Mol. Biol.

,

289

,

1469

-1490.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.