¿Cuál es la diferencia entre una sustancia y un compuesto en PubChem?
Los usuarios de PubChem a veces preguntan sobre la diferencia entre una sustancia y un compuesto. La pregunta no es sorprendente, ya que los nombres “sustancia” y “compuesto” por sí solos no transmiten inherentemente la diferencia. En la terminología PubChem, una sustancia es una descripción de muestra química proporcionada por una sola fuente y un compuesto es una representación normalizada de la estructura química que se encuentra en una o más sustancias aportadas. La distinción es importante ya que PubChem está organizado en tres bases de datos separadas: Compuesto, Sustancia y bioensayo. El siguiente diagrama explica la diferencia, pero exploremos esto más a fondo.
Para comprender las diferentes bases de datos en PubChem, es útil saber de dónde proviene la información. PubChem (http://pubchem.ncbi.nlm.nih.gov/) es un archivo abierto de sustancias químicas e información sobre sus actividades biológicas. Los datos son proporcionados por cientos de colaboradores (http://pubchem.ncbi.nlm.nih.gov/fuentes/), incluidos editores, investigadores, proveedores de productos químicos, compañías farmacéuticas y una serie de importantes recursos de biología química. Cada una de estas fuentes de datos aporta una descripción de las muestras de sustancias químicas de las que dispone.
PubChem llama a estas descripciones de muestras proporcionadas por la comunidad “sustancias”.”Cada registro encontrado en la base de datos de sustancias PubChem (http://www.ncbi.nlm.nih.gov/pcsubstance) contiene información proporcionada por un contribuidor individual sobre una sustancia química en particular. Los registros de sustancias son independientes entre sí. Dos registros de sustancias diferentes (del mismo proveedor o de diferentes proveedores) podrían proporcionar información diferente sobre la misma estructura química. Por ejemplo, un registro de sustancias puede dar información sobre la función biológica de la aspirina, mientras que otro puede dar información sobre una muestra de aspirina de grado de investigación. La base de datos de sustancias mantiene la procedencia de la información sobre sustancias químicas en PubChem. Ayuda a los usuarios a ver quién proporcionó qué. Como resultado, puede haber muchos registros de sustancias sobre una molécula dada, presentando un problema para los usuarios que están interesados en una vista agregada de la información sobre la molécula. Aquí es donde entra en juego la base de datos compuesta PubChem (http://www.ncbi.nlm.nih.gov/pccompound).
La base de datos de compuestos se deriva de los contenidos de la estructura química que se encuentran en la base de datos de sustancias. Cada producto químico se examina computacionalmente con una serie de pasos de validación y normalización. Este proceso da como resultado una representación normalizada de la estructura química para un registro de sustancia. Las sustancias químicas de la base de datos de sustancias que no están completamente descritas o que no cumplen los procedimientos de normalización no se incluyen en la base de datos de compuestos. Las sustancias de la base de datos de sustancias que pasan los procedimientos de normalización de la estructura química están vinculadas a un registro de “compuestos” en la base de datos de compuestos. Si dos sustancias se refieren a la misma estructura química, apuntan al mismo compuesto. Esto permite que los datos de diferentes proveedores de datos de sustancias se agreguen a través de un registro de compuestos común. Sin embargo, tener registros separados de sustancias sigue siendo valioso para los usuarios, que, por ejemplo, podrían estar interesados en la procedencia de una sustancia o en un estado particular del producto químico (por ejemplo, una forma tautomérica diferente). En esencia, un propósito principal de la base de datos de compuestos PubChem es proporcionar una vista “no redundante” del contenido de la estructura química aportado por el depositante almacenado en la base de datos de sustancias PubChem.
Entonces, para responder a la pregunta planteada al principio, ¿cuál es la diferencia entre una sustancia y un compuesto? Una sustancia es una descripción de muestra de sustancia química aportada por un proveedor de datos PubChem en particular. Un compuesto es una representación de estructura química normalizada que se encuentra en una o más descripciones de sustancias aportadas.
Para leer más sobre este tema, considere explorar estos enlaces:
- Ayuda de PubChem (http://pubchem.ncbi.nlm.nih.gov/ayuda.html#PubChem_Overview)
- Ayuda de Página de Resumen de Sustancia/Compuesto PubChem (http://pubchem.ncbi.nlm.nih.gov/docs / subcmpd_summary_page_help.html#SubstanceVsCompound)
- Small Molecules and Biological Activities (a book chapter in the NCBI Handbook) (http://www.ncbi.nlm.nih.gov/books/NBK184580/)
- PubChem: Integrated Platform of Small Molecules and Biological Activities (http://dx.doi.org/10.1016/S1574-1400(08)00012-1, or ftp://ftp.ncbi.nlm.nih.gov/pubchem/publications/ARCC_PubChem_Integrated_Platform.pdf).