Qual è la differenza tra una sostanza e un composto in PubChem?
Gli utenti di PubChem a volte chiedono la differenza tra una sostanza e un composto. La domanda non è sorprendente in quanto i nomi “sostanza” e “composto” da soli non trasmettono intrinsecamente la differenza. Nella terminologia PubChem, una sostanza è una descrizione campione chimico fornito da una singola fonte e un composto è una rappresentazione struttura chimica normalizzata trovato in una o più sostanze contribuito. La distinzione è importante in quanto PubChem è organizzato in tre database separati: Composto, Sostanza e saggio biologico. Lo schema seguente spiega la differenza, ma esploriamo ulteriormente questo.
Per comprendere i diversi database in PubChem, è utile sapere da dove provengono le informazioni. PubChem (http://pubchem.ncbi.nlm.nih.gov/) è un archivio aperto di sostanze chimiche e informazioni sulle loro attività biologiche. I dati sono forniti da centinaia di contributori (http://pubchem.ncbi.nlm.nih.gov/fonti/), tra cui editori, ricercatori, fornitori di prodotti chimici, aziende farmaceutiche e una serie di importanti risorse di biologia chimica. Ciascuna di queste fonti di dati fornisce una descrizione dei campioni di sostanze chimiche per i quali sono disponibili informazioni.
PubChem chiama queste descrizioni dei campioni fornite dalla comunità “sostanze.”Ogni record trovato nel database delle sostanze PubChem (http://www.ncbi.nlm.nih.gov/pcsubstance) contiene informazioni fornite da un singolo contributore su una particolare sostanza chimica. I registri delle sostanze sono indipendenti l’uno dall’altro. Due registri di sostanze diverse (dello stesso fornitore o di fornitori diversi) potrebbero fornire informazioni diverse sulla stessa struttura chimica. Ad esempio, un record di sostanze può fornire informazioni sul ruolo biologico dell’aspirina, mentre un altro può fornire informazioni su un campione di aspirina per la ricerca. Il database delle sostanze mantiene la provenienza delle informazioni sulle sostanze chimiche in PubChem. Aiuta gli utenti a vedere chi ha fornito cosa. Di conseguenza, ci possono essere molte registrazioni di sostanze su una determinata molecola, presentando un problema per gli utenti che sono interessati a una visione aggregata delle informazioni sulla molecola. È qui che entra in gioco il database composto PubChem (http://www.ncbi.nlm.nih.gov/pccompound).
Il database dei composti deriva dai contenuti della struttura chimica presenti nel database delle sostanze. Ogni sostanza chimica viene esaminata computazionalmente con una serie di passaggi di validazione e normalizzazione. Questo processo si traduce in una rappresentazione normalizzata della struttura chimica per un record di sostanza. Le sostanze chimiche nel database delle sostanze che non sono completamente descritte o che falliscono le procedure di normalizzazione non sono incluse nel database dei composti. Quelle sostanze nel database delle sostanze che superano le procedure di normalizzazione della struttura chimica sono collegate a un record “composto” nel database composto. Se due sostanze si riferiscono alla stessa struttura chimica, indicano lo stesso composto. Ciò consente di aggregare i dati provenienti da diversi fornitori di dati sulle sostanze attraverso un record composto comune. Tuttavia, anche la registrazione separata delle sostanze è ancora preziosa per gli utenti, che, ad esempio, potrebbero essere interessati alla provenienza di una sostanza o a uno stato particolare della sostanza chimica (ad esempio, una forma tautomerica diversa). In sostanza, uno scopo primario del database composto PubChem è quello di fornire una vista “non ridondante” del contenuto della struttura chimica depositante contribuito memorizzati nel database sostanza PubChem.
Quindi, per rispondere alla domanda posta all’inizio, qual è la differenza tra una sostanza e un composto? Una sostanza è una descrizione del campione di sostanza chimica fornita da un particolare fornitore di dati PubChem. Un composto è una rappresentazione della struttura chimica normalizzata che si trova in una o più descrizioni di sostanze.
Per saperne di più su questo argomento, considera di esplorare questi link:
- Aiuto PubChem (http://pubchem.ncbi.nlm.nih.gov/ aiuto.html # PubChem_Overview)
- PubChem Substance/Compound Summary Page Help (http://pubchem.ncbi.nlm.nih.gov/docs/subcmpd_summary_page_help.html#SubstanceVsCompound)
- Small Molecules and Biological Activities (a book chapter in the NCBI Handbook) (http://www.ncbi.nlm.nih.gov/books/NBK184580/)
- PubChem: Integrated Platform of Small Molecules and Biological Activities (http://dx.doi.org/10.1016/S1574-1400(08)00012-1, or ftp://ftp.ncbi.nlm.nih.gov/pubchem/publications/ARCC_PubChem_Integrated_Platform.pdf).