Uma visão crítica sobre conservador mutações

Resumo

analisando a superfície de composição de um conjunto de estruturas 3D de proteínas, complementada com o previsto superfície informações de composição de proteínas homólogas, temos encontrado evidências significativas para uma camada de composição de estruturas de proteínas. Nas partes mais interiores e exteriores das proteínas há uma carga negativa líquida, enquanto o meio tem uma carga positiva líquida. Além disso, as nossas descobertas indicam que o conceito de mutação conservadora necessita de uma revisão substancial, por exemplo, foram encontradas preferências espaciais muito diferentes para o ácido glutâmico e o ácido aspártico. O rastreio da alanina frequentemente utilizado em projectos de engenharia proteica envolve a substituição de resíduos pela alanina, com base no pressuposto de que a alanina é um resíduo “neutro”. No entanto, a alanina tem uma alta correlação negativa com todos, menos com os resíduos não-polares. Propomos, portanto, a utilização, por exemplo, da serina como substituto dos resíduos que estão negativamente correlacionados com a alanina.

introdução

ao dobrar uma cadeia peptídica numa estrutura proteica 3D, alguns resíduos são transferidos de um ambiente polar para um ambiente mais não polar no interior da proteína dobrada. Esta transferência é impulsionada pelas propriedades termodinâmicas dos aminoácidos e do solvente. Ao longo da evolução molecular, a natureza selecionou para função adequada e estabilidade da proteína resultante. Para proteínas pequenas a médias-na estrutura dobrada-apenas alguns resíduos são totalmente enterrados ( Chothia, 1976 ; Miller et al., 1987 ; Petersen et al., 1998), enquanto a maioria dos resíduos são apenas parcialmente enterrados. A variação da acessibilidade dos solventes depende das propriedades do resíduo em questão e reflecte-se na composição dos aminoácidos em toda a estrutura proteica. Estas diferenças no perfil de acessibilidade de solventes têm encontrado amplas aplicações em vários métodos de predição de estruturas (Holbrook et al., 1990 ; Rost and Sander, 1994 ; Thompson and Goldstein, 1996). Além disso, a utilização de matrizes de substituição específicas do ambiente ( Donnelly et al., 1994; Wako e Blundell, 1994) provaram ser valiosos. A vizinhança sequencial dos aminoácidos foi investigada anteriormente ( Vonderviszt et al., 1986 ) e a sua utilização tem sido encontrada, por exemplo, na previsão de loop (Wojcik et al., 1999) and secondary structure prediction ( Chou and Fasman, 1978 ; Chandonia and Karplus, 1999 ; Jones, 1999). Não foi descoberta nenhuma correlação significativa entre resíduos de preferência de vizinhança sequencial.

a vizinhança espacial em torno de resíduos individuais também foi previamente investigada ( Burley e Petsko, 1985; Bryant e Amzel, 1987; Miyazawa e Jernigan, 1993 ; Petersen et al., 1999 ). Além disso, foram estudados contactos espaciais para derivar potenciais de contacto para as diferentes interacções dos aminoácidos ( Brocchieri e Karlin, 1995 ; Miyazawa e Jernigan , 1996, 1999 ). A estratégia comum consiste em estudar o número de contactos dentro de um determinado limite de distância. No entanto, a literatura parece desprovida de investigações de contactos independentes e também de relatórios utilizando a informação embutida da acessibilidade solvente dos resíduos envolvidos.

a two-state prediction of solvent accessibility correlation between hydrophobicity, buried contact propensity and the location in the prediction window has been reported ( Mucchielli-Giorgi et al., 1999 ). No entanto, não descreve qualquer correlação entre distribuições individuais de resíduos.

é importante ser capaz de discriminar entre estruturas de modelos corretamente dobradas e mal dobradas. Tem sido salientado que os métodos potenciais baseados na energia não discriminam bem entre estruturas dobradas e mal dobradas. No entanto, características estruturais como a superfície polar enterrada (Overington et al., 1992) e número de contactos polares ( Bryant e Amzel, 1987 ; Golovanov et al., 1999) provaram ser valiosas.

na engenharia proteica é frequentemente utilizado o conceito de mutações conservadoras. A ideia geral é que a substituição de um aminoácido por outro aminoácido com propriedades físico-químicas semelhantes não influenciará a estabilidade e a função da proteína. O presente artigo mostra que as preferências espaciais por resíduos semelhantes podem ser dramaticamente diferentes em estruturas proteicas em circunstâncias semelhantes (neste contexto, acessibilidade de solventes).

os resultados da análise de vizinhos serão valiosos na validação do modelo, como uma ferramenta para a predição da estrutura e, especialmente, como um guia na busca de mutações para melhorar a estabilidade.

Methods

the sequences used are a subset of the 25% sequence identity set of non-homologous structures (Hobohm et al., 1992 ; Hobohm and Sander, 1994) derived from the protein structure databank PDB ( Bernstein et al., 1977 ). Apenas foram utilizadas sequências proteicas de cadeia simples. O conjunto de dados resultante consistiu em 336 sequências de cadeia única com uma identidade de sequência emparelhada máxima de 25%. O subconjunto foi expandido através do uso dos arquivos hssp correspondentes ( Dodge et al., 1998 ). O conjunto total de dados continha 8379 sequências alinhadas e 1 415 986 resíduos. Isto corresponde a 6,7% de todos os resíduos na versão 34 da SWISS-PROT ( Bairoch e Apweiler, 1997 ). O comprimento das sequências foi entre 64 e 1017 resíduos. A resolução das estruturas de raios X usadas variou entre 1.0 E 3.0 Å, com uma média de 2.0 Å. Além disso, o subconjunto continha 31 estruturas resolvidas por RMN. No entanto, todas as coordenadas hidrogênio-átomo foram descartadas. Para verificar um possível viés introduzido pelo uso das sequências homólogas, a análise completa foi feita com e sem as sequências alinhadas. Não foram observadas diferenças significativas, embora a dimensão reduzida do menor dos dois conjuntos de dados, como esperado, tenha dado origem a mais ruído.

os vizinhos geográficos de cada resíduo foram determinados com base na acessibilidade dos solventes e na distância espacial. A acessibilidade do solvente foi retirada dos respectivos ficheiros HSSP (Dodge et al., 1998 ). Para cada resíduo de superfície, os resíduos de superfície vizinhos foram agrupados de acordo com a sua Distância em relação ao resíduo em questão. A distância entre dois resíduos foi calculada como a distância mais curta entre o conjunto de todos os possíveis pares de átomos nos dois resíduos. Supomos que o alinhamento no arquivo HSSP implica que vizinhos na sequência principal também são vizinhos nas sequências alinhadas e que a acessibilidade solvente é conservada ( Andrade et al., 1998; Goldman et al., 1998 ). O número esperado de vizinho interações entre os resíduos do tipo i e j são calculados por

\

1

onde xi e xj são a fração de aminoácidos i e j no conjunto de dados para a faixa de distância d e em um solvente acessibilidade maior do que o cut-off de ACC e N0 é o número total de observado próximo contatos. A pontuação, Sij / D, ACC, é calculada por

\

2

isto dá uma pontuação negativa para pares vizinhos desfavorecidos e uma pontuação positiva para as interacções favorecidas. O valor da pontuação Sij / D, ACC pode ser transformado em um parâmetro termodinâmico aparente pela multiplicação com RT .A carga líquida em cada camada da proteína foi calculada . O ácido aspártico e o ácido glutâmico são considerados negativamente carregados e a arginina e a lisina são consideradas positivamente carregadas. Histidina é considerada como não carregada ou positivamente carregada. A relativa carga líquida, Δ qrel , definimos como

\

3

onde NPositive é o número positivo de resíduos, NNegative o número de negativa de resíduos e NTotal o número total de resíduos em uma determinada camada.

The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2cae, 2aaa, 1byb, 1smd, 2myr, 3cox, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oxy, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo e 1kcw.

resultados e discussão

a distribuição de resíduos carregados em diferentes camadas da estrutura proteica 3D e a carga líquida total são mostradas na Figura 1 . Nas partes mais interiores e exteriores das proteínas há uma carga negativa líquida, enquanto o meio tem uma carga positiva líquida. Esta aparente estrutura de três camadas com carga alternada expondo a camada externa negativamente carregada ao solvente é interessante. Esta organização garantirá um certo nível de neutralização da carga radial e poderá eventualmente contribuir para uma embalagem apertada da proteína. Do mesmo modo, esta organização da carga da camada superficial poderia fornecer uma orientação electrostática importante durante o evento de dobragem. Inversamente, a alteração do pH para condições ácidas ou alcalinas nas quais os subconjuntos dos resíduos tituláveis não são carregados desestabilizará a embalagem de resíduos à superfície da proteína. Enterrados, aminoácidos ácidos podem ser encontrados em várias estruturas proteicas diferentes e estes resíduos desempenham papéis funcionais importantes em, por exemplo, tripsina ( McGrath et al., 1992), ribonuclease T1 ( Giletto and Pace, 1999 ) e tioredoxina (Dyson et al., 1997 ; Bhavnani et al., 2000 ). A estrutura relatada de três camadas é observada tanto com quanto sem a sequência alinhada e, portanto, não é causada por um viés introduzido pela conservação dos grupos enterrados, carregados dentro de uma família de proteínas.

os vizinhos geográficos em torno de cada tipo de resíduo foram calculados sem qualquer discriminação quanto à acessibilidade dos solventes. Com as notáveis exceções de triptofano e cisteína, aminoácidos não foram frequentemente observados como vizinhos espaciais de tipos de resíduos idênticos. Esta tendência não dependia da escolha do corte de distância (resultados não apresentados). As diferenças de distribuição foram notavelmente pequenas entre os diferentes aminoácidos para um corte de 8 Å distância, sugerindo que 8 Å é uma distância suficientemente grande para que a distribuição se torne independente da natureza do resíduo central. Esta observação levou à utilização de 8 Å como a maior distância entre vizinhos investigados em pormenor.

A Figura 2 mostra os valores de todos os pares vizinhos de aminoácidos que envolvem triptofano, glicina, alanina, prolina, serina, histidina, lisina e ácido aspártico para pares vizinhos com, pelo menos, 20% de acessibilidade aos solventes. Os resultados para os outros aminoácidos estão disponíveis na nossa página inicial (http://www.bio.auc.dk/). Os valores de pontuação foram calculados da mesma forma para outros cortes de acessibilidade de solventes. O resíduo aromático triptofano é um dos dois únicos resíduos mostrando uma clara preferência por contatos com o mesmo tipo de resíduo (o outro é cisteína). Também são preferidas interacções com outros resíduos aromáticos. Curiosamente, as interacções entre o triptofano e os dois resíduos ácidos (ácido aspártico e ácido glutâmico) parecem diferentes. Embora o triptofano e o ácido glutâmico sejam observados com menor frequência do que o esperado, observa-se o oposto para o triptofano e o ácido aspártico. A glicina apresenta a pontuação negativa típica para interacções com o mesmo tipo de resíduo. Além disso, a glicina não parece ter vizinhos na vizinhança espacial próxima (≤3,5 Å). Esta sub-representação de vizinhos próximos é ainda mais clara para prolina. Interpretamos esta sub-representação como um sinal da preferência por loop que os resíduos da prolina têm. A falta de interações com todos os outros aminoácidos nas suas proximidades apontam para a maioria dos contactos com moléculas de solvente. No entanto, proline tem uma abundância de contatos a uma distância maior (4-5 Å). Histidina é interessante porque mostra sinais de suas propriedades aromáticas, através da preferência por contatos com resíduos aromáticos (~3.5 Å), e sua natureza polarizável, através de contatos preferidos com os resíduos carregados negativamente (~3 Å). O aminoácido básico da lisina tem, como esperado, uma pontuação negativa clara para contactos com outras lisinas. As interacções electrostáticas favoráveis com os aminoácidos ácidos são evidentes.

algumas das interações de pares mais interessantes são mostradas na Figura 3 . A figura 3A mostra o par de Ponte salina ácido lisina-aspártico. A forte sobre-representação vista na separação de 3 Å é consistente com o conceito clássico de Ponte de sal. A sobre-representação dos pares de ácido lisina–aspártico nas camadas mais expostas com solventes observadas entre 5,5 e 6 Å é inesperada. Propomos que as redes de carga na superfície proteica possam causar esta observação. Na figura 3B apresenta–se o resultado do par ácido glutâmico-ácido aspártico. A característica mais óbvia é a sub-representação esperada deste par. No entanto, perto da superfície proteica, a mesma restrição não parece estar presente. Mais uma vez, propomos que as redes de carga localizadas na superfície contribuam para esta observação. Nas figuras 3C e D são apresentados os pares de aminoácidos ácido triptofano–glutâmico e ácido triptofano–aspártico. A crença comum de que uma mutação de ácido glutâmico para ácido aspártico é conservadora é contrária às observações mostradas. O par ácido triptofano-glutâmico é altamente sub-representado nas camadas altamente expostas com solvente das proteínas. Surpreendentemente, o mesmo não pode ser dito para o par ácido triptofano–aspártico, onde uma sobre-representação é observada para o intervalo de 3,5 a 6 Å distância. Observações semelhantes, mas menos pronunciadas, foram feitas para os pares de ácido tirosina–glutâmico e ácido tirosina–aspártico. Não se observaram diferenças significativas entre os pares de ácido fenilalanina–glutâmico e fenilalanina–aspártico. A única diferença entre o ácido glutâmico e o ácido aspártico é o comprimento da cadeia lateral. Comum tanto ao triptofano quanto à tirosina é a sua polarisabilidade, em contraste com a fenilalanina. Acreditamos que os triptofanos localizados na superfície envolvidos na definição da funcionalidade das proteínas são polarizados pelo seu ambiente eletrostático local. Embora não possamos fornecer uma explicação quantitativa, é plausível que as diferenças entre o comprimento da cadeia diferente de ácido glutâmico e ácido aspártico possam dar preferência à proximidade do triptofano. Tem sido demonstrado que o ácido aspártico tem uma tendência a ter interações favoráveis entre a cadeia lateral do grupo carbonila e a espinha dorsal do grupo carbonila ( Deane et al., 1999), resultando em uma estrutura em anel. Não foram observadas conformações semelhantes para o ácido glutâmico. Nas figuras 3E e F são apresentados os pares histidina–aspártico e serina–histidina. Uma vez que estes três resíduos constituem os resíduos activos do local de uma vasta gama de hidrolases, têm um interesse especial. Existe uma representação excessiva de pares de ácido histidina–aspártico nas áreas altamente acessíveis aos solventes. A distância é maior do que a distância típica observada em fendas de locais ativos. No entanto, a pequena, mas significativa, sobre-representação na faixa de 3 Å está em conformidade com as distâncias clássicas de ácido histidina–aspártico nas hidrolases. A figura 3E mostra a clara preferência por contactos entre histidinas enterradas e ácidos aspárticos. Acreditamos que esta característica é uma parte importante da evolução molecular dos sítios catalíticos de novo. Armazenar “tríades” catalíticas possíveis em ambientes não funcionais torna menor o número de substituições de aminoácidos necessárias para activar o local.

A característica mais distinta na figura 3F é a clara sub-representação dos pares de serina–histidina em ambientes altamente expostos a solventes. Uma fraca sobre–representação do par serina-histidina é vista a 3 Å nas áreas menos acessíveis com solventes. Assim, a presença da tríade catalítica aparentemente é determinada principalmente pela preferência do par ácido histidina–aspártico, embora o par serina–histidina revele tendências semelhantes, mas muito mais fracas.Foi determinada a composição de aminoácidos de cada camada de acessibilidade de solventes . Como esperado, as partes enterradas das proteínas são compostas por uma maior quantidade de resíduos não polares do que as camadas mais expostas ao solvente. A correlação entre a composição dos aminoácidos foi calculada a partir dos dados da composição das camadas estruturais individuais. Espera-se que os aminoácidos que têm preferências semelhantes para o contacto com solventes e o ambiente local apresentem uma elevada correlação positiva devido a tendências semelhantes na sua distribuição. Assim, os aminoácidos que apresentam correlação negativa terão diferentes preferências para o ambiente local e, portanto, não são considerados compatíveis, ou seja, não se recomenda uma única mutação deste tipo neste local. Como os resíduos não polares são abundantes no núcleo e mostram uma diminuição gradual à medida que a acessibilidade do solvente aumenta em geral, a correlação entre os resíduos não polares é positiva (Figura 4 ). Em contraste, os resíduos polares são mais abundantes nas partes altamente expostas e, portanto, estão negativamente correlacionados com os resíduos não polares. A histidina e a treonina comportam-se de forma marcadamente diferente. Eles mostram correlação positiva entre si, mas pouca correlação com qualquer uma das outras colunas, com exceção de arginina e glicina. Isto é causado pela baixa ocorrência de histidina e treonina tanto nas áreas enterradas como altamente expostas e pela sua relativamente elevada ocorrência nas camadas médias expostas. A histidina tem uma correlação positiva com dois resíduos aromáticos, triptofano e tirosina, e com a treonina fracamente polar e a arginina polar. Novamente interpretamos isto como um sinal tanto das propriedades aromáticas quanto das propriedades de carga de histidina. Os resíduos polares fracamente polares não têm a mesma clara semelhança de distribuição que os resíduos polares e não polares. A prolina e a serina parecem estar mais estreitamente relacionadas com os resíduos polares. O resíduo fracamente polar alanina tem correlação positiva apenas com os resíduos não-polares. Propomos que as mutações entre os resíduos com alta correlação positiva tenham uma alta chance de manter a estabilidade termodinâmica da estrutura 3D. Isto é particularmente verdade para os resíduos carregados. Em contraste, os resíduos com um elevado grau de correlação negativa são tipicamente resíduos com diferentes propriedades físico-químicas, que não podem ser trocados sem alterar a química física da proteína. Os resíduos não correlacionados envolvem resíduos com um papel especial na estrutura, por exemplo, alguns resíduos frequentemente envolvidos na catálise. Acreditamos que a observação que proline em nosso estudo se comporta de forma semelhante aos resíduos polares está relacionada com o papel estrutural dos resíduos prolinos e sua preferência por loops e voltas. O rastreio da alanina frequentemente utilizado em projectos de engenharia proteica envolve a substituição de resíduos pela alanina, com base no pressuposto de que a alanina é um resíduo “neutro”. No entanto, os nossos dados mostram que a alanina tem uma elevada correlação negativa com todos, menos com os resíduos não polares. Propomos, portanto, a utilização, por exemplo, da serina como substituto dos resíduos que estão negativamente correlacionados com a alanina.

na opinião dos autores, o presente artigo fornece novas informações importantes sobre a organização estrutural das proteínas. A superfície proteica deve ser vista como uma característica estrutural multi-camadas da proteína, onde cada camada tem sua composição específica e características resultantes. Esta simples observação chave que acreditamos será de importância significativa para muitas estratégias de engenharia proteica que visam a modificação de resíduos expostos a solventes.

Fig. 1.

a carga relativa líquida em camadas de estruturas proteicas com diferentes acessos aos solventes (ACC). A carga relativa líquida é definida como a carga líquida por resíduo encontrada numa determinada camada (número de encargos positivos – número de encargos negativos/número de resíduos). O ácido aspártico e o ácido glutâmico são considerados negativos, arginina, lisina e histidina protonada positiva (linha pontilhada). A linha sólida inclui todos os resíduos acima mencionados, exceto histidina.

Fig. 1.

a carga relativa líquida em camadas de estruturas proteicas com diferentes acessos aos solventes (ACC). A carga relativa líquida é definida como a carga líquida por resíduo encontrada numa determinada camada (número de encargos positivos – número de encargos negativos/número de resíduos). O ácido aspártico e o ácido glutâmico são considerados negativos, arginina, lisina e histidina protonada positiva (linha pontilhada). A linha sólida inclui todos os resíduos acima mencionados, exceto histidina.

Fig. 2.

os pares vizinhos significativamente sobre ou sub – representados. Todos os resíduos têm uma acessibilidade de solventes superior a 20%. A distância em Å entre os resíduos é dada ao longo do eixo vertical. O vermelho e o verde representam áreas onde o número de pares é menor e maior do que o esperado, respectivamente. A) triptofano; B) glicina; c) prolina; D) histidina; e) lisina; F) ácido aspártico.

Fig. 2.

os pares vizinhos significativamente sobre ou sub – representados. Todos os resíduos têm uma acessibilidade de solventes superior a 20%. A distância em Å entre os resíduos é dada ao longo do eixo vertical. O vermelho e o verde representam áreas onde o número de pares é menor e maior do que o esperado, respectivamente. A) triptofano; B) glicina; c) prolina; D) histidina; e) lisina; F) ácido aspártico.

Fig. 3.

pares vizinhos super e sub – representados em função da acessibilidade dos solventes (ACC) e distância (Å). A distância entre os resíduos é dada ao longo do eixo vertical e a acessibilidade do solvente ao longo do eixo horizontal. A) ácido lisina-aspártico; B) ácido glutâmico-ácido aspártico; C) ácido triptofano-glutâmico; D) ácido triptofano–aspártico; e) ácido histidina–aspártico; F) serina–histidina.

Fig. 3.

pares vizinhos super e sub – representados em função da acessibilidade dos solventes (ACC) e distância (Å). A distância entre os resíduos é dada ao longo do eixo vertical e a acessibilidade do solvente ao longo do eixo horizontal. A) ácido lisina-aspártico; B) ácido glutâmico–ácido aspártico; C) ácido triptofano–glutâmico; D) ácido triptofano–aspártico; E) ácido histidina–aspártico; F) serina–histidina.

Fig. 4.

correlação entre a distribuição de aminoácidos nas proteínas. A correlação é calculada com base na composição de aminoácidos das diferentes camadas de camada de acessibilidade de solventes da estrutura proteica. As áreas verdes representam correlação positiva, enquanto as áreas vermelhas representam correlação negativa. As áreas com baixo grau de correlação estão em branco.

Fig. 4.

correlação entre a distribuição de aminoácidos nas proteínas. A correlação é calculada com base na composição de aminoácidos das diferentes camadas de camada de acessibilidade de solventes da estrutura proteica. As áreas verdes representam correlação positiva, enquanto as áreas vermelhas representam correlação negativa. As áreas com baixo grau de correlação estão em branco.

1

a quem se deve dirigir a correspondência. E-mail: [email protected]

P. H. J. agradece ao Conselho de Investigação da Noruega o apoio financeiro (NFR-116316/410). S. B. P. expressa sua gratidão pelo apoio financeiro da Obelsk Familiefond bem como Mål-2.

Andrade,M. A., O’Donoghue,S. I. e Rost,B. (

1998

)

J. Mol. Biol.

,

276

,

517

–525.

Bairoch,A. e Apweiler,R. (

1997

)

Ácidos Nucléicos Res.

,

25

,

31

-36.

Bernstein,F. C., Koetzle,T. F., Williams,G. J., Meyer,E. E.,Jr, Brice,M. D., Rodgers,J. R., Kennard,O., Shimanouchi, T. and Tasumi, M. (

1977

)

J. Mol. Biol.

,

112

,

535

–542.

Bhavnani,M., Lloyd,D., Bhattacharyya,A., Marples,J., Elton,P. e Worwood,M. (

2000

)

Intestino

,

46

,

707

-710.

Brocchieri,L. e Karlin,S. (

1995

)

Proc. Natl Acad. Ciência. EUA

,

92

,

12136

-12140.

Bryant,S. H. e Amzel,L. M. (

1987

)

Int. J. Pept. Protein Res.

,

29

,

46

-52.

Burley,S. K. e Petsko,G. A. (

1985

)

Ciência

,

229

,

23

-28.

Chandonia,J. M. e Karplus,M. (

1999

)

Proteínas

,

35

,

293

-306.

Chothia,C. (

1976

)

J. Mol. Biol.

,

105

,

1

–14.

Chou,P. Y. e Fasman,G. D. (

1978

)

Annu. Rev. Biochem.

,

47

,

251

–276.

Deane,C. M., Allen,F. H., Taylor,R. e Blundell,T. L. (

1999

)

Proteína Eng.

,

12

,

1025

–1028.

Dodge,C., Schneider,R. Sander,C. (

1998

)

Ácidos Nucléicos Res.

,

26

,

313

–315.

Donnelly,D., Overington,J. P. e Blundell,T. L. (

1994

)

Proteína Eng.

,

7

,

645

–653.

Dyson,H. J., Jeng,M. F., Tennant,L. L., Slaby,I., Lindell,M., Cui,D. S., Kuprin,S. e Holmgren,A. (

1997

)

Bioquímica

,

36

,

2622

-2636.

Giletto,A. e Ritmo,C. N. (

1999

)

Bioquímica

,

38

,

13379

-13384.

Goldman,N., Thorne,J. L. e Jones,D. T. (

1998

)

Genética

,

149

,

445

-458.

Golovanov,A. P., Volynsky,E. P. E., Ermakova,S. B. e Arseniev,A. S. (

1999

)

Proteína Eng.

,

12

,

31

–40.

Hobohm,U. e Sander,C. (

1994

)

Proteína Sci.

,

3

,

522

–524.

Hobohm,U., Scharf,M., Schneider,R. Sander,C. (

1992

)

Proteína Sci.

,

1

,

409

–417.

Holbrook,S. R., Muskal,S. M. e Kim,S. H. (

1990

)

Proteína Eng.

,

3

,

659

–665.

Jones,D. T. (

1999

)

J. Mol. Biol.

,

292

,

195

–202.

McGrath,M. E., Vasquez,J. R., Craik,C. S., Yang,A. S., Honig,B. e Fletterick,R. J. (

1992

)

Bioquímica

,

31

,

3059

-3064.

Miller,S., Janin,J., Lesk,A. M. e Chothia,C. (

1987

)

J. Mol. Biol.

,

196

,

641

–656.

Miyazawa,S. e Jernigan,R. L. (

1993

)

Proteína Eng.

,

6

,

267

–278.

Miyazawa,S. e Jernigan,R. L. (

1996

)

J. Mol. Biol.

,

256

,

623

–644.

Miyazawa,S. e Jernigan,R. L. (

1999

)

Proteínas

,

36

,

347

-356.

Mucchielli-Giorgi,M. H., Tuffery,P. e Hazout,S. (

1999

)

Oou. Chim. Acta.

,

101

,

186

–193.

Overington,J. Donnelly,D., Johnson,M. S., SŠali,A. e Blundell,T. L. (

1992

)

Proteína Sci.

,

1

,

216

–226.

Petersen,M. T. N., Jonson,P. H. e Petersen,S. B. (

1999

)

Proteína Eng.

,

12

,

535

–548.

Petersen,S. B., Jonson,P. H., Fojan,P., Petersen,E. I., Petersen,M. T. N., Hansen,S., Ishak,R. J. e Hough,E. (

1998

)

J. Biotechnol.

,

66

,

11

–26.

Rost,B. e Sander,C. (

1994

)

Proteínas

,

20

,

216

-226.

Thompson,M. J. e Goldstein,R. A. (

1996

)

Proteínas

,

25

,

38

-47.

Vonderviszt,F., Mátrai,G. e Simon,I. (

1986

)

Int. J. Pept. Protein Res.

,

27

,

483

-492.

Wako,H. e Blundell,T. L. (

1994

)

J. Mol. Biol.

,

238

,

693

-708.

Wojcik,J., Mornon,J. P. e Chomilier,J. (

1999

)

J. Mol. Biol.

,

289

,

1469

-1490.

Deixe uma resposta

O seu endereço de email não será publicado.