You are here: University of Vienna PHAIDRA Detail o:1348685
Title (eng)
An evaluation of the accuracy of drug-related InChI & InChlKey on ChemSpider, DrugBank, PharmXplorer, PubChem and Wikipedia
Parallel title (deu)
Eine Untersuchung der Genauigkeit des Arzneistoff zugehörigen InChI & InChIKey in ChemSpider, DrugBank, PharmXplorer, PubChem und Wikipedia
Author
Joachim Tscherny
Advisor
Gerhard Ecker
Assessor
Gerhard Ecker
Abstract (deu)
Frei verfügbare Onlineplattformen wie ChemSpider, DrugBank, PubChem und Wikipedia werden häufig genutzt um an Informationen über Arzneistoffe zu gelangen. Für Pharmaziestudenten der Universität Wien ist der PharmXplorer eine häufig genutzte Informationsquelle. Dieses Projekt untersucht, ob die von den Arzneistoffen zugehörige InChIs und InChIKeys in den Datenbanken ChemSpider, DrugBank, PubChem und Wikipedia konsistent sind. Auf der Grundlage der Ergebnisse des Konsistenztests wurde ein Goldstandard-Datensatz erstellt, der zur Validierung der Datenbanken ChemSpider, DrugBank, PubChem, PharmXplorer und Wikipedia diente. Das Workflow-Tool KNIME Analytics Platform kam zum Einsatz, um die zugehörigen InChIs und InChIKeys aller in Österreich zugelassenen Arzneistoffen von ChemSpider, DrugBank, PubChem und Wikipedia zu erhalten. Das Ergebnis des Konsistenztestes brachte eine Übereinstimmung von 79.34% InChIs. Die Validierung der Datenbanken unter Verwendung des Goldstandard-Datensatzes ergab, dass PubChem mit einer Korrektheit von 96.59% am besten abschnitt, gefolgt von DrugBank (96.07%), ChemSpider (93.88%), Wikipedia (92.83%) und PharmXplorer (83.94%). Wenn der Internationalen Freinamen verwendet wird um automatisch in vier verschiedenen Datenbanken den zugehörigen InChI und InChIKey abzufragen, scheinen in 20% der Fälle mindestens zwei verschiedene InChIs und InChIKeys auf.
Abstract (eng)
Freely available online resources such as ChemSpider, DrugBank, PubChem, and Wikipedia are widely used for obtaining information on drugs. For pharmacy students of the University of Vienna, PharmXplorer is a commonly used source of information. This project investigates whether the drug-related InChI & InChIKey are consistent in the databases ChemSpider, DrugBank, PubChem, and Wikipedia. On the other hand, a gold-standard dataset was created based on the data of the consistency tests, which were used to validate the databases ChemSpider, DrugBank, PubChem, PharmXplorer, and Wikipedia. The workflow tool KNIME Analytics Platform was used to obtain InChI & InChIKey for all drugs approved in Austria from ChemSpider, DrugBank, PubChem, and Wikipedia. The consistency test showed that the total consistency is 79.34%. The database validation revealed that PubChem performed best with a correctness of 96.59%, followed by DrugBank (96.07%), ChemSpider (93.88%), Wikipedia (92.83%) and PharmXplorer (83.94%). All in all, whenever International nonproprietary names used to query InChI & InChIKey in four different databases automatically, this results in at least two different InChIs & InChIKeys in 20% of the cases.
Keywords (eng)
evaluation of the accuracy of drug–related InChI & InChIKeydata consistency
Keywords (deu)
ArzneistoffeKonsistenz
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1348685
rdau:P60550 (deu)
XVI, 84 Seiten : Illustrationen, Diagramme
Number of pages
100
Study plan
Diplomstudium Pharmazie
[UA]
[449]
Members (1)
Title (eng)
An evaluation of the accuracy of drug-related InChI & InChlKey on ChemSpider, DrugBank, PharmXplorer, PubChem and Wikipedia
Parallel title (deu)
Eine Untersuchung der Genauigkeit des Arzneistoff zugehörigen InChI & InChIKey in ChemSpider, DrugBank, PharmXplorer, PubChem und Wikipedia
Author
Joachim Tscherny
Abstract (deu)
Frei verfügbare Onlineplattformen wie ChemSpider, DrugBank, PubChem und Wikipedia werden häufig genutzt um an Informationen über Arzneistoffe zu gelangen. Für Pharmaziestudenten der Universität Wien ist der PharmXplorer eine häufig genutzte Informationsquelle. Dieses Projekt untersucht, ob die von den Arzneistoffen zugehörige InChIs und InChIKeys in den Datenbanken ChemSpider, DrugBank, PubChem und Wikipedia konsistent sind. Auf der Grundlage der Ergebnisse des Konsistenztests wurde ein Goldstandard-Datensatz erstellt, der zur Validierung der Datenbanken ChemSpider, DrugBank, PubChem, PharmXplorer und Wikipedia diente. Das Workflow-Tool KNIME Analytics Platform kam zum Einsatz, um die zugehörigen InChIs und InChIKeys aller in Österreich zugelassenen Arzneistoffen von ChemSpider, DrugBank, PubChem und Wikipedia zu erhalten. Das Ergebnis des Konsistenztestes brachte eine Übereinstimmung von 79.34% InChIs. Die Validierung der Datenbanken unter Verwendung des Goldstandard-Datensatzes ergab, dass PubChem mit einer Korrektheit von 96.59% am besten abschnitt, gefolgt von DrugBank (96.07%), ChemSpider (93.88%), Wikipedia (92.83%) und PharmXplorer (83.94%). Wenn der Internationalen Freinamen verwendet wird um automatisch in vier verschiedenen Datenbanken den zugehörigen InChI und InChIKey abzufragen, scheinen in 20% der Fälle mindestens zwei verschiedene InChIs und InChIKeys auf.
Abstract (eng)
Freely available online resources such as ChemSpider, DrugBank, PubChem, and Wikipedia are widely used for obtaining information on drugs. For pharmacy students of the University of Vienna, PharmXplorer is a commonly used source of information. This project investigates whether the drug-related InChI & InChIKey are consistent in the databases ChemSpider, DrugBank, PubChem, and Wikipedia. On the other hand, a gold-standard dataset was created based on the data of the consistency tests, which were used to validate the databases ChemSpider, DrugBank, PubChem, PharmXplorer, and Wikipedia. The workflow tool KNIME Analytics Platform was used to obtain InChI & InChIKey for all drugs approved in Austria from ChemSpider, DrugBank, PubChem, and Wikipedia. The consistency test showed that the total consistency is 79.34%. The database validation revealed that PubChem performed best with a correctness of 96.59%, followed by DrugBank (96.07%), ChemSpider (93.88%), Wikipedia (92.83%) and PharmXplorer (83.94%). All in all, whenever International nonproprietary names used to query InChI & InChIKey in four different databases automatically, this results in at least two different InChIs & InChIKeys in 20% of the cases.
Keywords (eng)
evaluation of the accuracy of drug–related InChI & InChIKeydata consistency
Keywords (deu)
ArzneistoffeKonsistenz
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1348686
Number of pages
100