Una visión crítica de mutaciones conservadoras
Resumen
Al analizar la composición de la superficie de un conjunto de estructuras proteicas 3D, complementada con información de composición de la superficie prevista para proteínas homólogas, hemos encontrado evidencia significativa de una composición de capas de estructuras proteicas. En las partes más internas y externas de las proteínas hay una carga neta negativa, mientras que en la parte media hay una carga neta positiva. Además, nuestros hallazgos indican que el concepto de mutación conservadora necesita una revisión sustancial, por ejemplo, se encontraron preferencias espaciales muy diferentes para el ácido glutámico y el ácido aspártico. El cribado de alanina a menudo utilizado en proyectos de ingeniería de proteínas implica la sustitución de residuos por alanina, basándose en la suposición de que la alanina es un residuo “neutro”. Sin embargo, la alanina tiene una alta correlación negativa con todos los residuos, excepto los no polares. Por lo tanto, proponemos el uso de, por ejemplo, la serina como sustituto de los residuos que están correlacionados negativamente con la alanina.
Introducción
Al plegar una cadena de péptidos en una estructura de proteína 3D, algunos residuos se transfieren de un entorno polar a un entorno más no polar en el interior de la proteína plegada. Esta transferencia es impulsada por las propiedades termodinámicas de los aminoácidos y el disolvente. A lo largo de la evolución molecular, la naturaleza ha seleccionado la función y estabilidad adecuadas de la proteína resultante. Para proteínas de tamaño pequeño a mediano, en la estructura plegada, solo unos pocos residuos están totalmente enterrados (Chothia, 1976 ; Miller et al., 1987; Petersen et al., 1998), mientras que la mayoría de los residuos están enterrados solo parcialmente. La variación en la accesibilidad al disolvente depende de las propiedades del residuo en cuestión y se refleja en la composición de aminoácidos en toda la estructura proteica. Estas diferencias en el perfil de accesibilidad de disolventes han encontrado amplias aplicaciones en varios métodos de predicción de estructuras (Holbrook et al., 1990; Rost y Sander, 1994; Thompson y Goldstein, 1996). Además, el uso de matrices de sustitución específicas del entorno (Donnelly et al., 1994; Wako y Blundell, 1994) han demostrado ser valiosas. La vecindad secuencial de los aminoácidos se ha investigado previamente ( Vonderviszt et al., 1986)y su uso se ha encontrado, por ejemplo, en la predicción de bucles (Wojcik et al., 1999) y predicción de estructuras secundarias ( Chou y Fasman, 1978 ; Chandonia y Karplus, 1999 ; Jones, 1999). No se descubrió una correlación significativa entre la preferencia secuencial de vecinos de los residuos.
La vecindad espacial alrededor de residuos individuales también se ha investigado previamente (Burley y Petsko, 1985 ; Bryant y Amzel, 1987 ; Miyazawa y Jernigan, 1993 ; Petersen et al., 1999 ). Además, se han estudiado los contactos espaciales para derivar potenciales de contacto para las diferentes interacciones de aminoácidos (Brocchieri y Karlin, 1995 ; Miyazawa y Jernigan, 1996 , 1999 ). La estrategia común consiste en estudiar el número de contactos dentro de un límite de distancia determinado. Sin embargo, la bibliografía parece carecer de investigaciones sobre contactos dependientes de la distancia y también de informes que utilizan la información incorporada de la accesibilidad de los solventes a los residuos involucrados.
Se ha reportado una predicción de dos estados de la correlación de accesibilidad al disolvente entre hidrofobicidad, propensión al contacto enterrado y la ubicación en la ventana de predicción(Mucchielli-Giorgi et al., 1999 ). Sin embargo, no describe ninguna correlación entre las distribuciones individuales de residuos.
Es importante poder discriminar entre estructuras de modelo correctamente plegadas y mal plegadas. Se ha señalado que los métodos potenciales basados en la energía no discriminan bien entre estructuras plegadas y mal plegadas. Sin embargo, características estructurales como la superficie polar enterrada (Overington et al., 1992) y número de contactos polares ( Bryant y Amzel, 1987; Golovanov et al., 1999) han demostrado ser valiosas.
En ingeniería de proteínas se utiliza con frecuencia el concepto de mutaciones conservadoras. La idea general es que la sustitución de un aminoácido por otro aminoácido con propiedades físico-químicas similares no influirá en la estabilidad y función de la proteína. El presente trabajo muestra que las preferencias espaciales para residuos similares pueden ser dramáticamente diferentes en estructuras proteicas en circunstancias similares (en este contexto, accesibilidad a disolventes).
Los resultados del análisis de vecinos serán valiosos para la validación de modelos, como herramienta para la predicción de estructuras y, especialmente, como guía en la búsqueda de mutaciones potenciadoras de la estabilidad.
Métodos
Las secuencias utilizadas son un subconjunto del conjunto de identidad de secuencia del 25% de estructuras no homólogas ( Hobohm et al., 1992 ; Hobohm y Sander, 1994 ) derivado del banco de datos de estructura de proteínas PDB (Bernstein et al., 1977 ). Solo se utilizaron secuencias de proteínas de cadena única. El conjunto de datos resultante consistió en 336 secuencias de una sola cadena con una identidad máxima de secuencia en pares del 25%. El subconjunto se expandió mediante el uso de los archivos HSSP correspondientes (Dodge et al., 1998 ). El conjunto total de datos contenía 8.379 secuencias alineadas y 1.415.986 residuos. Esto corresponde al 6,7% de todos los residuos en la versión 34 de SWISS-PROT (Bairoch y Apweiler, 1997 ). La longitud de las secuencias fue de entre 64 y 1017 residuos. La resolución de las estructuras de rayos X utilizadas varió entre 1,0 y 3,0 Å, con un promedio de 2,0 Å. Además, el subconjunto contenía 31 estructuras resueltas por RMN. Sin embargo, todas las coordenadas de átomo de hidrógeno fueron descartadas. Para verificar un posible sesgo introducido por el uso de las secuencias homólogas, se realizó un análisis completo con y sin las secuencias alineadas. No se observaron diferencias significativas, aunque el tamaño reducido de los dos conjuntos de datos más pequeños, como se esperaba, dio lugar a más ruido.
Los vecinos espaciales de cada residuo se determinaron en función de la accesibilidad al disolvente y la distancia espacial. La accesibilidad al disolvente se tomó de los respectivos archivos HSSP (Dodge et al., 1998 ). Para cada residuo de superficie, los residuos de superficie vecinos se agruparon en función de su distancia al residuo en cuestión. La distancia entre dos residuos se calculó como la distancia más corta entre el conjunto de todos los pares posibles de átomos en los dos residuos. Asumimos que la alineación en el archivo HSSP implica que los vecinos en la secuencia principal también son vecinos en las secuencias alineadas y que se conserva la accesibilidad al disolvente ( Andrade et al., 1998; Goldman et al., 1998 ). El número esperado de interacciones vecinas entre residuos de tipo i y j se calcula por
1
donde xi y xj son la fracción de aminoácidos i y j en el conjunto de datos para el rango de distancia d y a una accesibilidad de disolvente mayor que el ACC y N0 de corte es el número total de contactos vecinos observados. La puntuación, Sij / d, ACC, se calcula por
2
Esto da una puntuación negativa para los pares de vecinos desfavorecidos y una puntuación positiva para las interacciones favorecidas. El valor de puntuación Sij|d,ACC se puede transformar en un parámetro termodinámico aparente mediante multiplicación con RT .
Se calculó la carga neta en cada capa de la proteína. El ácido aspártico y el ácido glutámico se consideran cargados negativamente y la arginina y la lisina se consideran cargados positivamente. La histidina se considera no cargada o cargada positivamente. La carga neta relativa, Δ qrel, la definimos como
3
donde NPositivo es el número de residuos positivos, NNegativo el número de residuos negativos y nTotal el número total de residuos en esa capa en particular.
The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gnd, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2cae, 2aaa, 1byb, 1smd, 2myr, 3cox, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oxi, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo y 1kcw.
Resultados y discusión
La distribución de residuos cargados en diferentes capas de la estructura proteica 3D y la carga neta total se muestran en la Figura 1 . En las partes más internas y externas de las proteínas hay una carga neta negativa, mientras que en la parte media hay una carga neta positiva. Esta aparente estructura de tres capas con carga alterna que expone la capa más externa cargada negativamente al disolvente es interesante. Tal organización asegurará un cierto nivel de neutralización de la carga radial, y posiblemente puede contribuir a un embalaje apretado de la proteína. Del mismo modo, esta organización de carga de la capa superficial podría proporcionar una guía electrostática importante durante el evento de plegado. Por el contrario, cambiar el pH a condiciones ácidas o alcalinas en las que subconjuntos de los residuos titulables no se cargan desestabilizará el embalaje de los residuos en la superficie de la proteína. Los aminoácidos ácidos enterrados se pueden encontrar en varias estructuras proteicas diferentes y estos residuos desempeñan un papel funcional importante en, por ejemplo, la tripsina ( McGrath et al., 1992), ribonucleasa T1 ( Giletto y Pace, 1999) y tiorredoxina ( Dyson et al., 1997; Bhavnani et al., 2000 ). La estructura de tres capas reportada se observa tanto con como sin la secuencia alineada y, por lo tanto, no es causada por un sesgo introducido por la conservación de los grupos enterrados y cargados dentro de una familia de proteínas.
Los vecinos espaciales alrededor de cada tipo de residuo se calcularon sin discriminación por la accesibilidad a los disolventes. Con las notables excepciones del triptófano y la cisteína, los aminoácidos no se observaron con frecuencia como vecinos espaciales de tipos de residuos idénticos. Esta tendencia no dependía de la elección del límite de distancia (no se muestran los resultados). Las diferencias en la distribución fueron notablemente pequeñas entre los diferentes aminoácidos para una distancia de corte de 8 Å, lo que sugiere que 8 Å es una distancia lo suficientemente grande para que la distribución se independice de la naturaleza del residuo central. Esta observación llevó al uso de 8 Å como la mayor distancia entre vecinos investigada en detalle.
La Figura 2 muestra los valores de puntuación para todos los pares vecinos de aminoácidos que involucran triptófano, glicina, alanina, prolina, serina, histidina, lisina y ácido aspártico para pares vecinos con al menos un 20% de accesibilidad al disolvente. Los resultados de los otros aminoácidos están disponibles en nuestra página de inicio ( http://www.bio.auc.dk/). Los valores de puntuación se han calculado de manera similar para otros valores límite de accesibilidad a disolventes. El residuo aromático triptófano es uno de los dos residuos que muestran una clara preferencia por los contactos con el mismo tipo de residuo (el otro es cisteína). También se prefieren las interacciones con otros residuos aromáticos. Curiosamente, las interacciones entre el triptófano y los dos residuos ácidos (ácido aspártico y ácido glutámico) parecen diferentes. Mientras que el triptófano y el ácido glutámico se observan con menos frecuencia de lo esperado, se observa lo contrario para el triptófano y el ácido aspártico. La glicina muestra la puntuación negativa típica para las interacciones con el mismo tipo de residuo. Además, la glicina no parece tener vecinos en el vecindario espacial cercano (≤3,5 Å). Esta infrarrepresentación de vecinos cercanos es aún más clara para prolina. Interpretamos esta infrarrepresentación como un signo de la preferencia por el bucle que tienen los residuos de prolina. La falta de interacciones con todos los demás aminoácidos en su vecindad apunta a que la mayoría de los contactos están con moléculas de solventes. Sin embargo, prolina tiene una abundancia de contactos a una distancia mayor (4-5 Å). La histidina es interesante porque muestra signos de sus propiedades aromáticas, a través de la preferencia por los contactos con residuos aromáticos (~3,5 Å), y su naturaleza polarizable, a través de los contactos preferidos con los residuos con carga negativa (~3 Å). El aminoácido básico lisina tiene, como era de esperar, una clara puntuación negativa para contactos con otras lisinas. Las interacciones electrostáticas favorables con los aminoácidos ácidos son evidentes.
Algunas de las interacciones de pares más interesantes se muestran en la Figura 3 . La Figura 3A representa el par puente salino lisina-ácido aspártico. La fuerte sobrerrepresentación que se observa en la separación de 3 Å es consistente con el concepto clásico de puente de sal. La sobrerrepresentación de pares de ácido lisina–aspártico en las capas más expuestas a disolventes observadas entre 5,5 y 6 Å es inesperada. Proponemos que las redes de carga en la superficie de la proteína podrían causar esta observación. En la Figura 3B se muestra el resultado del par ácido glutámico-ácido aspártico. La característica más obvia es la infrarrepresentación esperada de este par. Sin embargo, cerca de la superficie de la proteína, la misma restricción no parece estar presente. Una vez más, proponemos que las redes de carga ubicadas en superficie están contribuyendo a esta observación. En las Figuras 3C y D se muestran los pares de aminoácidos triptófano–ácido glutámico y triptófano–ácido aspártico. La creencia común de que una mutación de ácido glutámico a ácido aspártico es conservadora es contraria a las observaciones mostradas. El par de ácido triptófano-glutámico está muy infrarrepresentado en las capas de proteínas expuestas a disolventes. Sorprendentemente, no se puede decir lo mismo del par ácido triptófano–aspártico, donde se observa una sobrerrepresentación para el intervalo de distancia de 3,5 a 6 Å. Se hicieron observaciones similares, pero menos pronunciadas, para los pares de ácido tirosina-glutámico y ácido tirosina-aspártico. No se observaron diferencias significativas entre los pares fenilalanina–ácido glutámico y fenilalanina–ácido aspártico. La única diferencia entre el ácido glutámico y el ácido aspártico es la longitud de la cadena lateral. Común tanto al triptófano como a la tirosina es su polarisabilidad, en contraste con la fenilalanina. Creemos que los triptófanos ubicados en la superficie que participan en la definición de la funcionalidad de las proteínas están polarizados por su entorno electrostático local. Aunque no podemos proporcionar una explicación cuantitativa, es plausible que las diferencias entre las diferentes longitudes de cadena del ácido glutámico y el ácido aspártico puedan dar preferencia a la proximidad al triptófano. Se ha demostrado que el ácido aspártico tiene una tendencia a tener interacciones favorables entre el grupo carbonilo de la cadena lateral y el grupo carbonilo de la columna vertebral(Deane et al., 1999), resultando en una estructura en forma de anillo. No se han observado conformaciones similares para el ácido glutámico. En las Figuras 3E y F se muestran los pares histidina-ácido aspártico y serina-histidina. Dado que estos tres residuos constituyen los residuos del sitio activo de una amplia gama de hidrolasas, tienen un interés particular. Hay una sobrerrepresentación de pares de ácido histidina–aspártico en las áreas altamente solventes accesibles. La distancia es mayor que la distancia típica observada en grietas de sitios activos. Sin embargo, la pequeña, pero significativa, sobre-representación en el rango de 3 Å se ajusta a las distancias clásicas de ácido histidina–aspártico en hidrolasas. La Figura 3E muestra la clara preferencia por los contactos entre histidinas enterradas y ácidos aspárticos. Creemos que esta característica es una parte importante de la evolución molecular de los sitios catalíticos de novo. El almacenamiento de posibles “tríadas” catalíticas en entornos no funcionales reduce el número de sustituciones de aminoácidos necesarias para activar el sitio.
La característica más distintiva de la Figura 3F es la clara infrarrepresentación de pares de serina–histidina en ambientes expuestos a gran cantidad de solventes. Se observa una débil sobre-representación del par serina-histidina a los 3 Å en las áreas menos solventes accesibles. Por lo tanto, la presencia de la tríada catalítica aparentemente está determinada principalmente por la preferencia del par de ácido histidina–aspártico, aunque el par de serina–histidina revela tendencias similares, pero mucho más débiles.
Se determinó la composición de aminoácidos de cada capa de accesibilidad de disolvente. Como era de esperar, las partes enterradas de las proteínas están compuestas de una mayor cantidad de residuos no polares que las capas expuestas con más solventes. La correlación entre la composición de aminoácidos se calculó a partir de los datos de la composición de las capas estructurales individuales. Se espera que los aminoácidos que tienen preferencias similares para el contacto con disolventes y el entorno local muestren una alta correlación positiva debido a tendencias similares en su distribución. Por lo tanto, los aminoácidos que muestran una correlación negativa tendrán diferentes preferencias para el entorno local y, por lo tanto, no se cree que sean compatibles, es decir, no se recomienda una mutación de este tipo en un solo sitio en este lugar. Como los residuos no polares son abundantes en el núcleo y muestran una disminución gradual a medida que aumenta la accesibilidad al disolvente en general, la correlación entre los residuos no polares es positiva (Figura 4 ). En contraste, los residuos polares son más abundantes en las partes altamente expuestas y, por lo tanto, están correlacionados negativamente con los residuos no polares. La histidina y la treonina se comportan de manera marcadamente diferente. Muestran una correlación positiva entre sí, pero poca correlación con cualquiera de las otras columnas, con la excepción de arginina y glicina. Esto es causado por la baja incidencia de histidina y treonina en las áreas enterradas y altamente expuestas y su relativamente alta incidencia en las capas expuestas medias. La histidina tiene correlación positiva con dos residuos aromáticos, triptófano y tirosina, y con la treonina débilmente polar y la arginina polar. Una vez más, interpretamos esto como un signo de las propiedades aromáticas y las propiedades de carga de la histidina. Los residuos débilmente polares no tienen la misma similitud clara en la distribución que los residuos polares y no polares. La prolina y la serina parecen estar más estrechamente relacionadas con los residuos polares. El residuo débilmente polar alanina tiene correlación positiva solo con los residuos no polares. Proponemos que las mutaciones entre residuos con alta correlación positiva tienen una alta probabilidad de mantener la estabilidad termodinámica de la estructura 3D. Esto es particularmente cierto en el caso de los residuos cargados. Por el contrario, los residuos con un alto grado de correlación negativa son típicamente residuos con diferentes propiedades físico-químicas, que no pueden intercambiarse sin cambiar la química física de la proteína. Los residuos no correlacionados implican residuos con un papel especial en la estructura, por ejemplo, algunos residuos que a menudo participan en la catálisis. Creemos que la observación de que la prolina en nuestro estudio se comporta de manera similar a los residuos polares está relacionada con el papel estructural de los residuos de prolina y su preferencia por bucles y giros. El cribado de alanina a menudo utilizado en proyectos de ingeniería de proteínas implica la sustitución de residuos por alanina, basándose en la suposición de que la alanina es un residuo “neutro”. Sin embargo, nuestros datos muestran que la alanina tiene una alta correlación negativa con todos los residuos, excepto los no polares. Por lo tanto, proponemos el uso de, por ejemplo, la serina como sustituto de los residuos que están correlacionados negativamente con la alanina.
En opinión de los autores, el presente artículo proporciona información nueva e importante sobre la organización estructural de las proteínas. La superficie de la proteína debe verse como una característica estructural de múltiples capas de la proteína, donde cada capa tiene su composición específica y las características resultantes. Creemos que esta simple observación clave será de gran importancia para muchas estrategias de ingeniería de proteínas que apuntan a la modificación de residuos expuestos a disolventes.
La carga relativa neta en capas de estructuras proteicas con diferente accesibilidad a disolventes (ACC). La carga relativa neta se define como la carga neta por residuo encontrada en una capa determinada (número de cargas positivas – número de cargas negativas/número de residuos). El ácido aspártico y el ácido glutámico se consideran negativos, la arginina, la lisina y la histidina protonada positivos (línea punteada). La línea sólida incluye todos los residuos antes mencionados, excepto la histidina.
La carga relativa neta en capas de estructuras proteicas con diferente accesibilidad a disolventes (ACC). La carga relativa neta se define como la carga neta por residuo encontrada en una capa determinada (número de cargas positivas – número de cargas negativas/número de residuos). El ácido aspártico y el ácido glutámico se consideran negativos, la arginina, la lisina y la histidina protonada positivos (línea punteada). La línea sólida incluye todos los residuos antes mencionados, excepto la histidina.
Los pares vecinos significativamente sobrerrepresentados o subrepresentados. Todos los residuos tienen una accesibilidad al disolvente superior al 20%. La distancia en Å entre los residuos se indica a lo largo del eje vertical. El rojo y el verde representan áreas donde el número de pares es menor y mayor de lo esperado, respectivamente. A) Triptófano; B) glicina; C) prolina; D) histidina; E) lisina; F) ácido aspártico.
Los pares vecinos significativamente sobrerrepresentados o subrepresentados. Todos los residuos tienen una accesibilidad al disolvente superior al 20%. La distancia en Å entre los residuos se indica a lo largo del eje vertical. El rojo y el verde representan áreas donde el número de pares es menor y mayor de lo esperado, respectivamente. A) Triptófano; B) glicina; C) prolina; D) histidina; E) lisina; F) ácido aspártico.
Pares vecinos sobrerrepresentados e infrarrepresentados en función de la accesibilidad al disolvente (ACC) y la distancia (Å). La distancia entre los residuos se indica a lo largo del eje vertical y la accesibilidad del disolvente a lo largo del eje horizontal. A) Ácido lisina-aspártico; B) ácido glutámico-ácido aspártico; C) ácido triptófano-glutámico; D) ácido triptófano-aspártico; E) ácido histidina-aspártico; F) serina–histidina.
Pares vecinos sobrerrepresentados e infrarrepresentados en función de la accesibilidad al disolvente (ACC) y la distancia (Å). La distancia entre los residuos se indica a lo largo del eje vertical y la accesibilidad del disolvente a lo largo del eje horizontal. A) Ácido lisina–aspártico; B) ácido glutámico–ácido aspártico; C) ácido triptófano–glutámico; D) ácido triptófano–aspártico; E) ácido histidina–aspártico; F) serina–histidina.
Correlación entre la distribución de aminoácidos en proteínas. La correlación se calcula en base a la composición de aminoácidos de las diferentes capas de capa de accesibilidad de solventes de la estructura de la proteína. Las áreas verdes representan una correlación positiva, mientras que las áreas rojas representan una correlación negativa. Las áreas con bajo grado de correlación están en blanco.
Correlación entre la distribución de aminoácidos en proteínas. La correlación se calcula en base a la composición de aminoácidos de las diferentes capas de capa de accesibilidad de solventes de la estructura de la proteína. Las áreas verdes representan una correlación positiva, mientras que las áreas rojas representan una correlación negativa. Las áreas con bajo grado de correlación están en blanco.
A quién debe dirigirse la correspondencia. Correo electrónico: [email protected]
P. H. J. agradece al Consejo de Investigación de Noruega su apoyo financiero (NFR-116316/410). S. B. P. expresa su gratitud por el apoyo financiero de Obelsk Familiefond, así como de Mål-2.
Andrade,M. A., O’Donoghue,S. I. y Rost,B. (
)
,
,
–525.
Bairoch,A. y Apweiler,R. (
)
,
,
-36.
Bernstein, F. C., Koetzle, T. F., Williams, G. J., Meyer, E. E.,Jr, Brice, M. D., Rodgers, J. R., Kennard, O., Shimanouchi, T. y Tasumi,M. (
)
,
,
–542.
Bhavnani,M., Lloyd,D., Bhattacharyya,A., Marples,J., Elton,P. y Worwood,M. (
)
,
,
-710.
Brocchieri,L. y Karlin,S. (
)
,
,
-12140.
Bryant,S. H. and Amzel, L. M. (
)
,
,
-52.
Burley,S. K. y Petsko,G. A. (
)
,
,
-28.
Chandonia,J. M. y Karplus,M. (
)
,
,
-306.
Chothia,C. (
)
,
,
–14.
Chou,P. Y. y Fasman,G. D. (
)
,
,
–276.
Deane, C. M.,Allen, F. H.,Taylor, R. and Blundell, T. L. (
)
,
,
–1028.
Dodge,C., Schneider,R. y Sander,C. (
)
,
,
–315.
Donnelly,D., Overington,J. P. y Blundell,T. L. (
)
,
,
–653.
Dyson,H. J., Jeng,M. F., Tennant,L. L., Slaby,I., Lindell,M., Cui,D. S., Kuprin,S. y Holmgren,A. (
)
,
,
-2636.
Giletto,A. y Ritmo,C. N. (
)
,
,
-13384.
Goldman,N., Thorne,J. L. y Jones,D. T. (
)
,
,
-458.
Golovanov,A. P., Volynsky,P. E., Ermakova,S. B. y Arseniev,A. S. (
)
,
,
–40.
Hobohm,U. y Sander,C. (
)
,
,
–524.
Hobohm, U.,Scharf, M., Schneider, R. and Sander, C. (
)
,
,
–417.
Holbrook,S. R., Muskal,S. M. y Kim,S. H. (
)
,
,
–665.
Jones,D. T. (
)
,
,
–202.
McGrath,M. E., Vásquez,J. R., Craik,C. S., Yang,A. S., Honig,B. y Fletterick,R. J. (
)
,
,
-3064.
Miller,S., Janin,J., Lesk,A. M. y Chothia,C. (
)
,
,
–656.
Miyazawa,S. y Jernigan,R. L. (
)
,
,
–278.
Miyazawa,S. y Jernigan,R. L. (
)
,
,
–644.
Miyazawa,S. y Jernigan,R. L. (
)
,
,
-356.
Mucchielli-Giorgi,M. H., Tuffery,P. y Hazout,S. (
)
,
,
–193.
Overington, J., Donnelly, D., Johnson, M. S., SŠali, A. and Blundell, T. L. (
)
,
,
–226.
Petersen,M. T. N., Jonson,P. H. y Petersen,S. B. (
)
,
,
–548.
Petersen, S. B., Jonson, P. H., Fojan, P., Petersen, E. I., Petersen, M. T. N., Hansen, S., Ishak, R. J. and Hough, E. (
)
,
,
–26.
Rost,B. y Sander,C. (
)
,
,
-226.
Thompson,M. J. y Goldstein,R. A. (
)
,
,
-47.
Vonderviszt,F., Mátrai,G. y Simón,I. (
)
,
,
-492.
Wako,H. y Blundell,T. L. (
)
,
,
-708.
Wojcik,J., Mornon,J. P. y Chomilier,J. (
)
,
,
-1490.