Quelle est la différence entre une substance et un composé dans PubChem ?
Les utilisateurs de PubChem s’interrogent parfois sur la différence entre une substance et un composé. La question n’est pas surprenante car les noms “substance” et “composé” à eux seuls ne traduisent pas intrinsèquement la différence. Dans la terminologie de PubChem, une substance est une description d’échantillon chimique fournie par une source unique et un composé est une représentation normalisée de la structure chimique présente dans une ou plusieurs substances contributives. La distinction est importante car PubChem est organisé en trois bases de données distinctes : Composé, Substance et Essai biologique. Le diagramme ci-dessous explique la différence, mais explorons cela plus loin.
Pour comprendre les différentes bases de données de PubChem, il est utile de savoir d’où viennent les informations. PubChem (http://pubchem.ncbi.nlm.nih.gov/) est une archive ouverte de substances chimiques et d’informations sur leurs activités biologiques. Les données sont fournies par des centaines de contributeurs (http://pubchem.ncbi.nlm.nih.gov/ sources /), y compris des éditeurs, des chercheurs, des vendeurs de produits chimiques, des sociétés pharmaceutiques et un certain nombre de ressources importantes en biologie chimique. Chacune de ces sources de données fournit une description des échantillons de substances chimiques pour lesquels elles disposent d’informations.
PubChem appelle ces descriptions d’échantillons fournies par la communauté ” substances.”Chaque enregistrement trouvé dans la base de données sur les substances PubChem (http://www.ncbi.nlm.nih.gov/pcsubstance) contient des informations fournies par un contributeur individuel sur une substance chimique particulière. Les registres des substances sont indépendants les uns des autres. Deux registres de substances différentes (provenant du même fournisseur ou de fournisseurs différents) pourraient fournir des informations différentes sur la même structure chimique. Par exemple, un dossier de substance peut donner des informations sur le rôle biologique de l’aspirine, tandis qu’un autre peut donner des informations sur un échantillon d’aspirine de qualité scientifique. La base de données sur les substances conserve la provenance des informations sur les substances chimiques dans PubChem. Il aide les utilisateurs à voir qui a fourni quoi. Par conséquent, il peut y avoir de nombreux enregistrements de substances sur une molécule donnée, ce qui pose un problème pour les utilisateurs intéressés par une vue agrégée des informations sur la molécule. C’est là que la base de données de composés PubChem (http://www.ncbi.nlm.nih.gov/pccompound) entre en jeu.
La base de données des composés est dérivée des teneurs en structure chimique contenues dans la base de données des substances. Chaque produit chimique est examiné par calcul avec une série d’étapes de validation et de normalisation. Ce processus aboutit à une représentation normalisée de la structure chimique d’un enregistrement de substance. Les substances chimiques de la base de données des substances qui ne sont pas complètement décrites ou qui échouent aux procédures de normalisation ne sont pas incluses dans la base de données des composés. Les substances de la base de données des substances qui passent les procédures de normalisation de la structure chimique sont liées à un enregistrement “composé” dans la base de données des composés. Si deux substances se réfèrent à la même structure chimique, elles pointent vers le même composé. Cela permet d’agréger les données de différents fournisseurs de données sur les substances au moyen d’un enregistrement composé commun. Cependant, il est toujours utile d’avoir des registres de substances distincts pour les utilisateurs, qui, par exemple, pourraient s’intéresser à la provenance d’une substance ou à un état particulier de la substance chimique (par exemple, une forme tautomère différente). Essentiellement, l’un des principaux objectifs de la base de données sur les composés PubChem est de fournir une vue “non redondante” du contenu de la structure chimique fourni par le déposant stocké dans la base de données sur les substances PubChem.
Alors, pour répondre à la question posée au début, quelle est la différence entre une substance et un composé ? Une substance est une description d’échantillon de substance chimique fournie par un fournisseur de données PubChem particulier. Un composé est une représentation normalisée de la structure chimique que l’on trouve dans une ou plusieurs descriptions de substances contribuées.
Pour en savoir plus sur ce sujet, veuillez envisager d’explorer ces liens:
- Aide PubChem (http://pubchem.ncbi.nlm.nih.gov/ aide.html #PubChem_Overview)
- Aide de la page de résumé des substances / composés PubChem (http://pubchem.ncbi.nlm.nih.gov/docs/subcmpd_summary_page_help.html#SubstanceVsCompound)
- Small Molecules and Biological Activities (a book chapter in the NCBI Handbook) (http://www.ncbi.nlm.nih.gov/books/NBK184580/)
- PubChem: Integrated Platform of Small Molecules and Biological Activities (http://dx.doi.org/10.1016/S1574-1400(08)00012-1, or ftp://ftp.ncbi.nlm.nih.gov/pubchem/publications/ARCC_PubChem_Integrated_Platform.pdf).