Was ist der Unterschied zwischen einer Substanz und einer Verbindung in PubChem?
PubChem-Benutzer fragen manchmal nach dem Unterschied zwischen einer Substanz und einer Verbindung. Die Frage ist nicht überraschend, da die Namen “Substanz” und “Verbindung” allein den Unterschied nicht inhärent vermitteln. In der PubChem-Terminologie ist eine Substanz eine chemische Probenbeschreibung, die von einer einzigen Quelle bereitgestellt wird, und eine Verbindung ist eine normalisierte chemische Strukturdarstellung, die in einer oder mehreren beigesteuerten Substanzen gefunden wird. Die Unterscheidung ist wichtig, da PubChem in drei separaten Datenbanken organisiert ist: Verbindung, Substanz und BioAssay. Das folgende Diagramm erklärt den Unterschied, aber lassen Sie uns dies weiter untersuchen.
Um die verschiedenen Datenbanken in PubChem zu verstehen, ist es hilfreich zu wissen, woher die Informationen stammen. PubChem (http://pubchem.ncbi.nlm.nih.gov/) ist ein offenes Archiv chemischer Substanzen und Informationen über ihre biologischen Aktivitäten. Die Daten werden von Hunderten von Mitwirkenden (http://pubchem.ncbi.nlm.nih.gov/ Quellen /) bereitgestellt, darunter Verlage, Forscher, Chemieanbieter, Pharmaunternehmen und eine Reihe wichtiger Ressourcen für die chemische Biologie. Jede dieser Datenquellen trägt eine Beschreibung der chemischen Stoffproben bei, für die sie Informationen haben.
PubChem nennt diese von der Community bereitgestellten Beispielbeschreibungen “Substanzen.” Jeder Datensatz in der PubChem-Substanzdatenbank (http://www.ncbi.nlm.nih.gov/pcsubstance) enthält Informationen, die von einem einzelnen Mitwirkenden zu einer bestimmten chemischen Substanz bereitgestellt wurden. Stoffdatensätze sind voneinander unabhängig. Zwei verschiedene Stoffdatensätze (von demselben oder verschiedenen Anbietern) können unterschiedliche Informationen über dieselbe chemische Struktur liefern. Zum Beispiel kann ein Substanzdatensatz Informationen über die biologische Rolle von Aspirin geben, während ein anderer Informationen über eine Forschungsgradprobe von Aspirin geben kann. Die Stoffdatenbank führt die Provenienz von chemischen Stoffinformationen in PubChem. Es hilft Benutzern zu sehen, wer was bereitgestellt hat. Infolgedessen kann es viele Substanzaufzeichnungen über ein bestimmtes Molekül geben, was ein Problem für Benutzer darstellt, die an einer aggregierten Ansicht von Informationen über das Molekül interessiert sind. Hier kommt die PubChem Compound Database (http://www.ncbi.nlm.nih.gov/pccompound) ins Spiel.
Die Compound-Datenbank leitet sich aus den chemischen Strukturinhalten der Substanzdatenbank ab. Jede Chemikalie wird rechnerisch mit einer Reihe von Validierungs- und Normalisierungsschritten untersucht. Dieser Prozess führt zu einer normalisierten Darstellung der chemischen Struktur für einen Stoffdatensatz. Chemische Stoffe in der Stoffdatenbank, die nicht vollständig beschrieben sind oder die Normierungsverfahren nicht bestehen, werden nicht in die Stoffdatenbank aufgenommen. Diejenigen Substanzen in der Stoffdatenbank, die Verfahren zur Normalisierung der chemischen Struktur durchlaufen, sind mit einem “Compound” -Datensatz in der Compound-Datenbank verknüpft. Wenn sich zwei Substanzen auf dieselbe chemische Struktur beziehen, weisen sie auf dieselbe Verbindung hin. Auf diese Weise können Daten von verschiedenen Substanzdatenanbietern über einen gemeinsamen Verbunddatensatz aggregiert werden. Für Anwender, die beispielsweise an der Herkunft eines Stoffes oder einem bestimmten Zustand der Chemikalie (z. B. einer anderen tautomeren Form) interessiert sein könnten, ist es jedoch nach wie vor wertvoll, separate Stoffdatensätze zu haben. Im Wesentlichen besteht ein Hauptzweck der PubChem Compound Database darin, eine “nicht redundante” Ansicht der in der PubChem Substance Database gespeicherten chemischen Strukturinhalte bereitzustellen.
Um die eingangs gestellte Frage zu beantworten, was ist der Unterschied zwischen einer Substanz und einer Verbindung? Eine Substanz ist eine beigesteuerte chemische Stoffprobenbeschreibung von einem bestimmten PubChem-Datenanbieter. Eine Verbindung ist eine normalisierte chemische Strukturdarstellung, die in einer oder mehreren chemischen Substanzbeschreibungen gefunden wird.
Um mehr zu diesem Thema zu lesen, lesen Sie bitte diese Links:
- PubChem Hilfe (http://pubchem.ncbi.nlm.nih.gov/Hilfe.html#PubChem_Overview)
- PubChem Stoff / Verbindung Zusammenfassung Seite Hilfe (http://pubchem.ncbi.nlm.nih.gov/docs/subcmpd_summary_page_help.html#SubstanceVsCompound)
- Small Molecules and Biological Activities (a book chapter in the NCBI Handbook) (http://www.ncbi.nlm.nih.gov/books/NBK184580/)
- PubChem: Integrated Platform of Small Molecules and Biological Activities (http://dx.doi.org/10.1016/S1574-1400(08)00012-1, or ftp://ftp.ncbi.nlm.nih.gov/pubchem/publications/ARCC_PubChem_Integrated_Platform.pdf).