Vue critique sur les mutations conservatrices

Résumé

En analysant la composition de surface d’un ensemble de structures protéiques 3D, complétée par des informations de composition de surface prédites pour les protéines homologues, nous avons trouvé des preuves significatives d’une composition de couche de structures protéiques. Dans les parties les plus internes et les plus externes des protéines, il y a une charge négative nette, tandis que le milieu a une charge positive nette. De plus, nos résultats indiquent que le concept de mutation conservatrice nécessite une révision substantielle, par exemple des préférences spatiales très différentes ont été trouvées pour l’acide glutamique et l’acide aspartique. Le criblage de l’alanine souvent utilisé dans les projets d’ingénierie des protéines implique la substitution de résidus à l’alanine, en partant de l’hypothèse que l’alanine est un résidu “neutre”. Cependant, l’alanine a une corrélation négative élevée avec tous les résidus non polaires sauf les résidus polaires. Nous proposons donc l’utilisation, par exemple, de la sérine comme substitut des résidus négativement corrélés avec l’alanine.

Introduction

Lors du pliage d’une chaîne peptidique en une structure protéique 3D, certains résidus sont transférés d’un environnement polaire à un environnement plus non polaire à l’intérieur de la protéine pliée. Ce transfert est entraîné par les propriétés thermodynamiques des acides aminés et du solvant. Tout au long de l’évolution moléculaire, la nature a choisi la fonction et la stabilité appropriées de la protéine résultante. Pour les protéines de petite à moyenne taille — dans la structure pliée – seuls quelques résidus sont totalement enfouis (Chothia, 1976; Miller et al., 1987; Petersen et coll., 1998), alors que la plupart des résidus ne sont que partiellement enfouis. La variation de l’accessibilité au solvant dépend des propriétés du résidu en question et se reflète dans la composition en acides aminés dans toute la structure protéique. Ces différences dans le profil d’accessibilité des solvants ont trouvé de larges applications dans diverses méthodes de prédiction de structure (Holbrook et al., 1990; Rost et Sander, 1994; Thompson et Goldstein, 1996). En outre, l’utilisation de matrices de substitution spécifiques à l’environnement (Donnelly et al., 1994; Wako et Blundell, 1994) se sont avérés précieux. Le voisinage séquentiel des acides aminés a déjà été étudié (Vonderviszt et al., 1986) et son utilisation a été trouvée, par exemple, dans la prédiction de boucle (Wojcik et al., 1999) et la prédiction de la structure secondaire (Chou et Fasman, 1978; Chandonia et Karplus, 1999; Jones, 1999). Aucune corrélation significative entre la préférence séquentielle des voisins des résidus n’a été découverte.

Le voisinage spatial autour des résidus individuels a également déjà été étudié (Burley et Petsko, 1985; Bryant et Amzel, 1987; Miyazawa et Jernigan, 1993; Petersen et al., 1999 ). De plus, des contacts spatiaux ont été étudiés pour dériver des potentiels de contact pour les différentes interactions d’acides aminés (Brocchieri et Karlin, 1995; Miyazawa et Jernigan, 1996, 1999). La stratégie commune consiste à étudier le nombre de contacts à l’intérieur d’une limite de distance donnée. Cependant, la littérature semble dépourvue d’enquêtes sur les contacts distants et également de rapports utilisant les informations intégrées sur l’accessibilité au solvant des résidus impliqués.

Une prédiction à deux états de la corrélation d’accessibilité des solvants entre l’hydrophobie, la propension au contact enterré et l’emplacement dans la fenêtre de prédiction a été rapportée (Mucchielli-Giorgi et al., 1999 ). Cependant, il ne décrit aucune corrélation entre les distributions de résidus individuelles.

Il est important de pouvoir faire la distinction entre les structures de modèle correctement pliées et mal pliées. Il a été souligné que les méthodes potentielles basées sur l’énergie ne font pas une bonne distinction entre les structures pliées et mal repliées. Cependant, des caractéristiques structurelles telles que la surface polaire enterrée (Overington et al., 1992) et le nombre de contacts polaires (Bryant et Amzel, 1987; Golovanov et al., 1999) se sont avérés précieux.

En ingénierie des protéines, le concept de mutations conservatrices est fréquemment utilisé. L’idée générale est qu’une substitution d’un acide aminé par un autre acide aminé aux propriétés physico-chimiques similaires n’influencera pas la stabilité et la fonction de la protéine. Le présent article montre que les préférences spatiales pour des résidus similaires peuvent être radicalement différentes dans des structures protéiques dans des circonstances similaires (dans ce contexte, accessibilité aux solvants).

Les résultats de l’analyse des voisins seront précieux dans la validation du modèle, comme outil de prédiction de structure et surtout comme guide dans la recherche de mutations améliorant la stabilité.

Méthodes

Les séquences utilisées sont un sous-ensemble de l’ensemble d’identité de séquence à 25% de structures non homologues (Hobohm et al., 1992 ; Hobohm et Sander, 1994) provenant de la banque de données sur la structure des protéines PDB (Bernstein et al., 1977 ). Seules des séquences protéiques à chaîne unique ont été utilisées. L’ensemble de données résultant consistait en 336 séquences à chaîne unique avec une identité de séquence par paire maximale de 25%. Le sous-ensemble a été élargi grâce à l’utilisation des fichiers HSSP correspondants (Dodge et al., 1998 ). L’ensemble de données total contenait 8379 séquences alignées et 1 415 986 résidus. Cela correspond à 6,7% de tous les résidus de la version 34 de SWISS-PROT (Bairoch et Apweiler, 1997). La longueur des séquences était comprise entre 64 et 1017 résidus. La résolution des structures de rayons X utilisées variait entre 1,0 et 3,0 Å, avec une moyenne de 2,0 Å. De plus, le sous-ensemble contenait 31 structures résolues par RMN. Cependant, toutes les coordonnées hydrogène-atome ont été rejetées. Pour vérifier un éventuel biais introduit par l’utilisation des séquences homologues, l’analyse complète a été faite avec et sans les séquences alignées. Aucune différence significative n’a été observée, bien que la taille réduite du plus petit des deux ensembles de données, comme prévu, ait donné lieu à plus de bruit.

Les voisins spatiaux de chaque résidu ont été déterminés en fonction de l’accessibilité au solvant et de la distance spatiale. L’accessibilité au solvant a été tirée des fichiers HSSP respectifs (Dodge et al., 1998 ). Pour chaque résidu de surface, les résidus de surface voisins ont été regroupés en fonction de leur distance au résidu considéré. La distance entre deux résidus a été calculée comme la distance la plus courte parmi l’ensemble de toutes les paires d’atomes possibles dans les deux résidus. Nous supposons que l’alignement dans le fichier HSSP implique que les voisins de la séquence principale sont également voisins dans les séquences alignées et que l’accessibilité au solvant est conservée (Andrade et al., 1998; Goldman et coll., 1998 ). Le nombre attendu d’interactions voisines entre les résidus de type i et j est calculé par

\

1

où xi et xj sont la fraction d’acides aminés i et j dans l’ensemble de données pour la plage de distance d et à une accessibilité au solvant supérieure à la coupure ACC et N0 est le nombre total de contacts voisins observés. Le score, Sij/d, ACC, est calculé par

\

2

Cela donne un score négatif pour les paires de voisins défavorisées et un score positif pour les interactions privilégiées. La valeur de score Sij/d, ACC peut être transformée en paramètre thermodynamique apparent par multiplication avec RT.

La charge nette dans chaque couche de la protéine a été calculée. L’acide aspartique et l’acide glutamique sont considérés comme chargés négativement et l’arginine et la lysine sont considérées comme chargées positivement. L’histidine est considérée comme non chargée ou chargée positivement. La charge nette relative, Δ qrel, que nous définissons comme

\

3

où NPOSITIF est le nombre de résidus positifs, Nnégatif le nombre de résidus négatifs et NTotal le nombre total de résidus dans cette couche particulière.

The PDB identification codes for the structures used are 1ptx, 2bbi, 1hcp, 1iml, 1cdq, 1vcc, 1nkl, 1tiv, 2abd, 2hts, 1tpg, 1fbr, 1pco, 1who, 1beo, 2ncm, 1fim, 1tlk, 1xer, 1onc, 1rga, 1erw, 1fd2, 1put, 1fkj, 1jpc, 1thx, 1jer, 1ccr, 1wad, 2tgi, 1pls, 1neu, 4rhn, 1rmd, 1hce, 1hfh, 1tam, 2pf1, 1bip, 1whi, 1yua, 1bp2, 1zia, 4fgf, 7rsa, 1bw4, 2vil, 1eal, 1rie, 1doi, 3chy, 1cpq, 1msc, 1mut, 1rcb, 1lzr, 1htp, 1lid, 1lis, 1lit, 1kuh, 1nfn, 1irl, 1poc, 2tbd, 1cof, 1pms, 1rsy, 1snc, 1eca, 1jvr, 2end, 1anu, 5nul, 1fil, 1jon, 1lcl, 1itg, 1tfe, 1maz, 1pkp, 1lba, 1vsd, 2fal, 1ash, 1def, 2hbg, 1div, 1gds, 1grj, 1i1b, 1ilk, 1rcy, 1sra, 1ulp, 1mbd, 1aep, 1jcv, 2gdm, 1phr, 1rbu, 1esl, 1hlb, 1mup, 1vhh, 1gpr, 1btv, 1cyw, 1klo, 1l68, 3dfr, 2cpl, 1sfe, 1huw, 5p21, 1ha1, 1wba, 1lki, 2fha, 1prr, 2fcr, 1amm, 1cid, 1hbq, 1cdy, 2stv, 153l, 1rec, 1xnb, 2sas, 1gky, 1knb, 1ryt, 1zxq, 1har, 1cex, 1chd, 2tct, 2ull, 1gen, 1iae, 1nox, 1rnl, 2gsq, 1cfb, 1dyr, 1nsj, 2hft, 1fua, 2eng, 1thv, 1hxn, 2abk, 9pap, 1lbu, 3cla, 1vid, 2ayh, 2dtr, 1gpc, 1dts, 1jud, 1emk, 1ois, 1akz, 1sgt, 1ad2, 1nfp, 1din, 1lrv, 1dhr, 1bec, 1lbd, 1dpb, 1jul, 1mrj, 1fib, 1hcz, 1mml, 1vin, 1dja, 2cba, 3dni, 1lxa, 1arb, 1rgs, 1tys, 3tgl, 1ako, 1eny, 1ndh, 2dri, 1xjo, 1drw, 1kxu, 2prk, 1cnv, 1tfr, 1ytw, 1iol, 2ebn, 1tml, 1han, 1xsm, 1pbn, 1amp, 1ryc, 1bia, 1vpt, 1csn, 2ora, 1ctt, 1bco, 1fnc, 1gym, 1pda, 1cpo, 1esc, 2reb, 1mla, 1sig, 8abp, 1ghr, 1iow, 2ctc, 1gca, 1sbp, 1ede, 1pgs, 2cmd, 1anv, 1gsa, 1tag, 1dsn, 2acq, 1cvl, 1tca, 2abh, 2pia, 1pot, 1vdc, 1axn, 1msk, 1hmy, 2bgu, 1ldm, 1dxy, 1ceo, 1nif, 1arv, 1xel, 1uxy, 1rpa, 2lbp, 3pte, 1uby, 1fkx, 1pax, 3bcl, 1air, 1mpp, 2mnr, 1eur, 1cem, 1fnf, 1pea, 1omp, 2chr, 1pud, 1kaz, 1mxa, 1edg, 2sil, 1ivd, 1pbe, 1svb, 1ars, 1oyc, 1inp, 1oxa, 1eft, 1phg, 1cpt, 1iso, 1qpg, 2amg, 1uae, 1gb, 2dkb, 1gpl, 1csh, 4enl, 1pmi, 1lgr, 1nhp, 1gcb, 1bp1, 1geo, 2bnh, 3grs, 1gln, 1gai, 2pgd, 2cae, 2aaa, 1byb, 1smd, 2myr, 3cox, 1dpe, 1pkm, 1ayl, 1crl, 1ctn, 1clc, 1tyv, 2cas, 1ecl, 1oxy, 1vnc, 1gal, 1dlc, 1sly, 1dar, 1gof, 1bgw, 1aa6, 1vom, 8acn, 1kit, 1taq, 1gpb, 1qba, 1alo et 1kcw.

Résultats et discussion

La distribution des résidus chargés dans différentes couches de la structure 3D de la protéine et la charge nette totale sont illustrées à la figure 1. Dans les parties les plus internes et les plus externes des protéines, il y a une charge négative nette, tandis que le milieu a une charge positive nette. Cette structure apparente à trois couches avec charge alternée exposant la couche la plus externe chargée négativement au solvant est intéressante. Une telle organisation assurera un certain niveau de neutralisation de la charge radiale, et peut éventuellement contribuer à un emballage serré de la protéine. De même, cette organisation de charge de la couche superficielle pourrait fournir un guidage électrostatique important lors de l’événement de pliage. Inversement, le changement de pH vers des conditions acides ou alcalines dans lesquelles des sous-ensembles des résidus titrables deviennent non chargés déstabilisera le tassement des résidus à la surface de la protéine. Les acides aminés acides enfouis peuvent être trouvés dans plusieurs structures protéiques différentes et ces résidus jouent des rôles fonctionnels importants dans, par exemple, la trypsine (McGrath et al., 1992), la ribonucléase T1 (Giletto et Pace, 1999) et la thiorédoxine (Dyson et al., 1997; Bhavnani et coll., 2000 ). La structure à trois couches rapportée est observée à la fois avec et sans la séquence alignée et n’est donc pas causée par un biais introduit par la conservation des groupes chargés enfouis au sein d’une famille de protéines.

Les voisins spatiaux autour de chaque type de résidu ont été calculés sans aucune discrimination quant à l’accessibilité des solvants. À l’exception notable du tryptophane et de la cystéine, les acides aminés n’ont pas été fréquemment observés comme voisins spatiaux de types de résidus identiques. Cette tendance ne dépendait pas du choix de la limite de distance (résultats non présentés). Les différences de distribution étaient remarquablement faibles entre les différents acides aminés pour une distance de coupure de 8 Å, ce qui suggère que 8 Å est une distance suffisamment grande pour que la distribution devienne indépendante de la nature du résidu central. Cette observation a conduit à l’utilisation de 8 Å comme la plus grande distance entre voisins étudiée en détail.

La figure 2 montre les valeurs de score pour toutes les paires voisines d’acides aminés impliquant le tryptophane, la glycine, l’alanine, la proline, la sérine, l’histidine, la lysine et l’acide aspartique pour les paires voisines présentant une accessibilité au solvant d’au moins 20 %. Les résultats pour les autres acides aminés sont disponibles sur notre page d’accueil (http://www.bio.auc.dk/). Les valeurs de score ont été calculées de la même manière pour d’autres seuils d’accessibilité aux solvants. Le résidu aromatique tryptophane est l’un des deux seuls résidus montrant une nette préférence pour les contacts avec le même type de résidu (l’autre est la cystéine). On préfère également les interactions avec les autres résidus aromatiques. Il est intéressant de noter que les interactions entre le tryptophane et les deux résidus acides (acide aspartique et acide glutamique) semblent différentes. Alors que le tryptophane et l’acide glutamique sont observés moins fréquemment que prévu, l’inverse est observé pour le tryptophane et l’acide aspartique. La glycine montre le score négatif typique pour les interactions avec le même type de résidu. De plus, la glycine ne semble pas avoir de voisins dans le voisinage spatial proche (≤3,5 Å). Cette sous-représentation des voisins proches est encore plus claire pour proline. Nous interprétons cette sous-représentation comme un signe de la préférence pour la boucle des résidus de proline. L’absence d’interactions avec tous les autres acides aminés à proximité indique que la plupart des contacts sont avec des molécules de solvant. Cependant, la proline a une abondance de contacts à une plus grande distance (4-5 Å). L’histidine est intéressante en ce qu’elle montre des signes de ses propriétés aromatiques, par préférence pour les contacts avec les résidus aromatiques (~3,5 Å), et sa nature polarisable, par des contacts privilégiés avec les résidus chargés négativement (~3 Å). L’acide aminé de base lysine a comme prévu un score négatif clair pour les contacts avec d’autres lysines. Les interactions électrostatiques favorables avec les acides aminés acides sont évidentes.

Certaines des interactions de paires les plus intéressantes sont illustrées à la figure 3. La figure 3A représente la paire de ponts de sel lysine-acide aspartique. La forte surreprésentation observée à la séparation de 3 Å est compatible avec le concept classique de pont de sel. La surreprésentation des paires lysine–acide aspartique dans les couches les plus exposées au solvant observées à 5,5 à 6 Å est inattendue. Nous proposons que des réseaux de charge à la surface des protéines pourraient provoquer cette observation. Sur la figure 3B, le résultat pour le couple acide glutamique–acide aspartique est illustré. La caractéristique la plus évidente est la sous-représentation attendue de cette paire. Cependant, près de la surface de la protéine, la même restriction ne semble pas être présente. Encore une fois, nous proposons que les réseaux de charge situés en surface contribuent à cette observation. Sur les figures 3C et D, les paires d’acides aminés tryptophane–acide glutamique et tryptophane–acide aspartique sont représentées. La croyance commune selon laquelle une mutation de l’acide glutamique vers l’acide aspartique est conservatrice est contraire aux observations montrées. Le couple tryptophane-acide glutamique est fortement sous-représenté dans les couches exposées aux solvants des protéines. Étonnamment, on ne peut pas en dire autant du couple tryptophane–acide aspartique, où une sur-représentation est observée pour l’intervalle de distance de 3,5 à 6 Å. Des observations similaires, mais moins prononcées, ont été faites pour les paires tyrosine–acide glutamique et tyrosine–acide aspartique. Aucune différence significative n’a été observée entre les paires phénylalanine–acide glutamique et phénylalanine–acide aspartique. La seule différence entre l’acide glutamique et l’acide aspartique est la longueur de la chaîne latérale. Le point commun au tryptophane et à la tyrosine est leur polarisabilité, contrairement à la phénylalanine. Nous pensons que les tryptophanes situés en surface impliqués dans la définition de la fonctionnalité des protéines sont polarisés par leur environnement électrostatique local. Bien que nous ne puissions fournir d’explication quantitative, il est plausible que les différences entre les différentes longueurs de chaîne de l’acide glutamique et de l’acide aspartique puissent donner une préférence à la proximité du tryptophane. Il a été montré que l’acide aspartique a tendance à avoir des interactions favorables entre le groupe carbonyle de la chaîne latérale et le groupe carbonyle du squelette (Deane et al., 1999), résultant en une structure en forme d’anneau. Des conformations similaires n’ont pas été observées pour l’acide glutamique. Sur les figures 3E et F, les couples histidine–acide aspartique et sérine-histidine sont représentés. Ces trois résidus constituant les résidus de site actif d’une large gamme d’hydrolases, ils présentent un intérêt particulier. Il y a une surreprésentation des paires histidine-acide aspartique dans les zones hautement accessibles aux solvants. La distance est plus grande que la distance typique observée dans les crevasses du site actif. Cependant, la surreprésentation faible, mais significative, dans la gamme des 3 Å est conforme aux distances classiques entre l’histidine et l’acide aspartique dans les hydrolases. La figure 3E montre la nette préférence pour les contacts entre les histidines enfouies et les acides aspartiques. Nous pensons que cette caractéristique est une partie importante de l’évolution moléculaire des sites catalytiques de novo. Le stockage d’éventuelles “triades” catalytiques dans des environnements non fonctionnels réduit le nombre de substitutions d’acides aminés nécessaires pour activer le site.

La caractéristique la plus distincte de la figure 3F est la sous-représentation claire des paires sérine–histidine dans des environnements fortement exposés aux solvants. Une faible surreprésentation du couple sérine–histidine est observée à 3 Å dans les zones moins accessibles aux solvants. Ainsi, la présence de la triade catalytique est apparemment déterminée principalement par la préférence du couple histidine–acide aspartique bien que le couple sérine–histidine révèle des tendances similaires, mais beaucoup plus faibles.

La composition en acides aminés de chaque couche d’accessibilité au solvant a été déterminée. Comme prévu, les parties enfouies des protéines sont composées d’une quantité plus élevée de résidus non polaires que les couches exposées au solvant. La corrélation entre la composition en acides aminés a été calculée à partir des données de la composition des couches structurelles individuelles. Les acides aminés qui ont des préférences similaires pour le contact avec les solvants et l’environnement local devraient présenter une corrélation positive élevée en raison de tendances similaires dans leur distribution. Par conséquent, les acides aminés présentant une corrélation négative auront des préférences différentes pour l’environnement local et ne sont donc pas considérés comme compatibles, c’est-à-dire qu’une mutation de site unique de ce type à cet endroit n’est pas recommandée. Comme les résidus non polaires sont abondants dans le cœur et montrent une diminution progressive à mesure que l’accessibilité au solvant augmente en général, la corrélation entre les résidus non polaires est positive (Figure 4). En revanche, les résidus polaires sont plus abondants dans les parties fortement exposées et sont donc en corrélation négative avec les résidus non polaires. L’histidine et la thréonine se comportent de manière nettement différente. Ils montrent une corrélation positive entre eux, mais peu de corrélation avec l’une des autres colonnes, à l’exception de l’arginine et de la glycine. Ceci est dû à la faible présence d’histidine et de thréonine dans les zones enterrées et très exposées et à leur présence relativement élevée dans les couches moyennement exposées. L’histidine a une corrélation positive avec deux résidus aromatiques, le tryptophane et la tyrosine, et avec la thréonine faiblement polaire et l’arginine polaire. Encore une fois, nous interprétons cela comme un signe à la fois des propriétés aromatiques et des propriétés de charge de l’histidine. Les résidus faiblement polaires n’ont pas la même similitude claire de distribution que les résidus polaires et non polaires. La proline et la sérine semblent être plus étroitement liées aux résidus polaires. Le résidu faiblement polaire alanine n’a de corrélation positive qu’avec les résidus non polaires. Nous proposons que les mutations entre résidus à forte corrélation positive ont de fortes chances de maintenir la stabilité thermodynamique de la structure 3D. Ceci est particulièrement vrai pour les résidus chargés. En revanche, les résidus présentant un degré élevé de corrélation négative sont généralement des résidus ayant des propriétés physico-chimiques différentes, qui ne peuvent être interchangés sans modifier la chimie physique de la protéine. Les résidus non corrélés impliquent des résidus ayant un rôle particulier dans la structure, par exemple certains résidus souvent impliqués dans la catalyse. Nous pensons que l’observation selon laquelle la proline dans notre étude se comporte de manière similaire aux résidus polaires est liée au rôle structurel des résidus de proline et à sa préférence pour les boucles et les spires. Le criblage de l’alanine souvent utilisé dans les projets d’ingénierie des protéines implique la substitution de résidus à l’alanine, en partant de l’hypothèse que l’alanine est un résidu “neutre”. Cependant, nos données montrent que l’alanine a une corrélation négative élevée avec tous les résidus non polaires sauf les résidus polaires. Nous proposons donc l’utilisation, par exemple, de la sérine comme substitut des résidus négativement corrélés avec l’alanine.

De l’avis des auteurs, le présent article fournit de nouvelles informations importantes sur l’organisation structurelle des protéines. La surface de la protéine doit être considérée comme une caractéristique structurelle multicouche de la protéine, où chaque couche a sa composition spécifique et ses caractéristiques résultantes. Nous pensons que cette observation clé simple sera d’une importance significative pour de nombreuses stratégies d’ingénierie des protéines qui ciblent la modification des résidus exposés au solvant.

Fig. 1.

La charge relative nette dans les couches de structures protéiques avec une accessibilité aux solvants différente (ACC). La charge relative nette est définie comme la charge nette par résidu trouvée dans une couche particulière (nombre de charges positives – nombre de charges négatives / nombre de résidus). L’acide aspartique et l’acide glutamique sont considérés comme négatifs, l’arginine, la lysine et l’histidine protonée sont positives (ligne pointillée). La ligne continue comprend tous les résidus mentionnés ci-dessus à l’exception de l’histidine.

Fig. 1.

La charge relative nette dans les couches de structures protéiques avec une accessibilité aux solvants différente (ACC). La charge relative nette est définie comme la charge nette par résidu trouvée dans une couche particulière (nombre de charges positives – nombre de charges négatives / nombre de résidus). L’acide aspartique et l’acide glutamique sont considérés comme négatifs, l’arginine, la lysine et l’histidine protonée sont positives (ligne pointillée). La ligne continue comprend tous les résidus mentionnés ci-dessus à l’exception de l’histidine.

Fig. 2.

Les paires de voisins significativement surreprésentées ou sous-représentées. Tous les résidus ont une accessibilité au solvant supérieure à 20%. La distance en Å entre les résidus est donnée selon l’axe vertical. Le rouge et le vert représentent les zones où le nombre de paires est inférieur et plus élevé que prévu, respectivement. (A) Le Tryptophane; (B) la glycine; (C) la proline; (D) l’histidine; (E) la lysine; (F) l’acide aspartique.

Fig. 2.

Les paires de voisins significativement surreprésentées ou sous-représentées. Tous les résidus ont une accessibilité au solvant supérieure à 20%. La distance en Å entre les résidus est donnée selon l’axe vertical. Le rouge et le vert représentent les zones où le nombre de paires est inférieur et plus élevé que prévu, respectivement. (A) Le Tryptophane; (B) la glycine; (C) la proline; (D) l’histidine; (E) la lysine; (F) l’acide aspartique.

Fig. 3.

Paires de voisins surreprésentées et sous-représentées en fonction de l’accessibilité au solvant (ACC) et de la distance (Å). La distance entre les résidus est donnée selon l’axe vertical et l’accessibilité du solvant selon l’axe horizontal. (A) Acide lysine-aspartique; (B) acide glutamique – acide aspartique; (C) acide tryptophane-glutamique; (D) acide tryptophane-aspartique; (E) acide histidine-aspartique; (F) sérine–histidine.

Fig. 3.

Paires de voisins surreprésentées et sous-représentées en fonction de l’accessibilité au solvant (ACC) et de la distance (Å). La distance entre les résidus est donnée selon l’axe vertical et l’accessibilité du solvant selon l’axe horizontal. (A) Acide lysine-aspartique; (B) acide glutamique –acide aspartique; (C) acide tryptophane–glutamique; (D) acide tryptophane–aspartique; (E) acide histidine–aspartique; (F) sérine–histidine.

Fig. 4.

Corrélation entre la distribution des acides aminés dans les protéines. La corrélation est calculée sur la base de la composition en acides aminés des différentes couches de couche d’accessibilité au solvant de la structure protéique. Les zones vertes représentent une corrélation positive, tandis que les zones rouges représentent une corrélation négative. Les zones à faible degré de corrélation sont en blanc.

Fig. 4.

Corrélation entre la distribution des acides aminés dans les protéines. La corrélation est calculée sur la base de la composition en acides aminés des différentes couches de couche d’accessibilité au solvant de la structure protéique. Les zones vertes représentent une corrélation positive, tandis que les zones rouges représentent une corrélation négative. Les zones à faible degré de corrélation sont en blanc.

1

À qui la correspondance doit être adressée. E-mail : [email protected]

P.H.J. remercie le Conseil norvégien de la Recherche pour son soutien financier (NFR-116316/410). S.B.P. exprime sa gratitude pour le soutien financier d’Obelsk Familiefond ainsi que de Mål-2.

Andrade, M.A., O’Donoghue, S.I. et Rost, B. (

1998

)

J. Mol. Biol.

,

276

,

517

–525.

Bairoch, A. et Apweiler, R. (

1997

)

Acides Nucléiques Res.

,

25

,

31

-36.

Bernstein, F.C., Koetzle, T.F., Williams, G.J., Meyer, E.E., Jr, Brice, M.D., Rodgers, J.R., Kennard, O., Shimanouchi, T. et Tasumi, M. (

1977

)

J. Mol. Biol.

,

112

,

535

–542.

Le nom de l’espèce est attesté sous le nom de ” ” ” ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “, ” “. (

2000

)

Gut

,

46

,

707

-710.

Brocchieri, L. et Karlin, S. (

1995

)

Proc. Natl Acad. Sci. États-Unis

,

92

,

12136

-12140.

Pierre, S.H. et Amzel, L.M. (

1987

)

Int. J. Pett. Protéines Res.

,

29

,

46

-52.

Burley, S.K. et Petsko, G.A. (

1985

)

Sciences

,

229

,

23

-28.

Chandonia, J.M. et Karplus, M. (

1999

)

Protéines

,

35

,

293

-306.

Chothia, C. (

1976

)

J. Mol. Biol.

,

105

,

1

–14.

Chou, P.Y. et Fasman, G.D. (

1978

)

Annu. Rév. Biochem.

,

47

,

251

–276.

Deane, C.M., Allen, F.H., Taylor, R. et Blundell, T.L. (

1999

)

Protéines Eng.

,

12

,

1025

–1028.

Dodge, C., Schneider, R. et Sander, C. (

1998

)

Acides Nucléiques Res.

,

26

,

313

–315.

Le nom de l’espèce a été donné en référence au lieu de sa découverte, le D.G., Overington, J.P. et Blundell, T.L. (

1994

)

Protéines Eng.

,

7

,

645

–653.

Dyson, H.J., Jeng, M.F., Tennant, L.L., Slaby, I., Lindell, M., Cui, D.S., Kuprin, S. et Holmgren, A. (

1997

)

Biochimie

,

36

,

2622

-2636.

Giletto, A. et Pace, C.N. (

1999

)

Biochimie

,

38

,

13379

-13384.

Goldman, N., Thorne, J.L. et Jones, D.T. (

1998

)

Génétique

,

149

,

445

-458.

Golovanov, A.P., Volynsky, P.E., Ermakova, S.B. et Arseniev, A.S. (

1999

)

Protéines Eng.

,

12

,

31

–40.

Hobohm, U. et Sander, C. (

1994

)

Protéine Sci.

,

3

,

522

–524.

Hobohm, U., Scharf, M., Schneider, R. et Sander, C. (

1992

)

Protéine Sci.

,

1

,

409

–417.

Holbrook, S.R., Muskal, S.M. et Kim, S.H. (

1990

)

Protéines Eng.

,

3

,

659

–665.

Jones, D.T. (

1999

)

J. Mol. Biol.

,

292

,

195

–202.

McGrath, M.E., Vasquez, J.R., Craik, C.S., Yang, A.S., Honig, B. et Fletterick, R.J. (

1992

)

Biochimie

,

31

,

3059

-3064.

Miller, S., Janin, J., Lesk, A.m. et Chothia, C. (

1987

)

J. Mol. Biol.

,

196

,

641

–656.

Miyazawa, S. et Jernigan, R.L. (

1993

)

Protéines Eng.

,

6

,

267

–278.

Miyazawa, S. et Jernigan, R.L. (

1996

)

J. Mol. Biol.

,

256

,

623

–644.

Miyazawa, S. et Jernigan, R.L. (

1999

)

Protéines

,

36

,

347

-356.

Mucchielli-Giorgi, M.H., Tuffery, P. et Hazout, S. (

1999

)

Théor. Chim. Acta.

,

101

,

186

–193.

La plupart des espèces de ce genre sont des espèces de plantes de la famille des ” Fabaceae “, sous-famille des ” Faboideae “, originaire d’Asie du Sud-Est. (

1992

)

Protéine Sci.

,

1

,

216

–226.

Petersen, M.T.N., Jonson, P.H. et Petersen, S.B. (

1999

)

Protéines Eng.

,

12

,

535

–548.

Petersen, S.B., Jonson, P.H., Fojan, P., Petersen, E.I., Petersen, M.T.N., Hansen, S., Ishak, R.J. et Hough, E. (

1998

)

J. Biotechnol.

,

66

,

11

–26.

Rost, B. et Sander, C. (

1994

)

Protéines

,

20

,

216

-226.

Le nom de l’espèce peut désigner (

1996

)

Protéines

,

25

,

38

-47.

Vonderviszt, F., Mátrai, G. et Simon, I. (

1986

)

Int. J. Pett. Protéines Res.

,

27

,

483

-492.

Wako, H. et Blundell, T.L. (

1994

)

J. Mol. Biol.

,

238

,

693

-708.

Wojcik, J., Mornon, J.P. et Chomilier, J. (

1999

)

J. Mol. Biol.

,

289

,

1469

-1490.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.