Title (eng)
Property prediction with matched molecular pair networks
Author
Rupendra Lal Shrestha
Advisor
Nils Morten Kriege
Assessor
Nils Morten Kriege
Abstract (deu)
Diese Dissertation konzentriert sich auf die Anwendung von Machine-Learning-Techniken (ML) in der Arzneimittelforschung und verwendet die Methode der Matched Molecular Pairs (MMP) neben dem Graph Neural Network (GNN) zur Vorhersage molekularer Eigenschaften. Um das Screening von Kandidatenmolekülen für die Arzneimittel-entwicklung zu beschleunigen, wurden rechnergestützte Methoden eingesetzt, um Moleküle basierend auf ihren relevanten Eigenschaften vorherzusagen und zu filtern. Die Veränderung von Eigenschaften zwischen zwei strukturell ähnlichen Verbindungen wird durch die Theorie des MMPs erfasst, das als Paar von Verbindungen definiert ist, die sich durch eine klar definierte strukturelle Veränderung unterscheiden. Dieses Konzept hilft dabei, strukturelle Elemente aufzudecken, die für die Eigenschaftsvorhersage wesentlich sind. Ein Ansatz, der dieses Konzept verwendet, ist das Network Balance Scaling (NBS), das die Vorhersagefähigkeiten von ML-Modellen und die strukturellen Beziehungen zwischen Verbindungen als MMP-Netzwerk integriert. Allerdings wird NBS hauptsächlich als Nachbearbeitungsschritt verwendet, was das Potenzial für weitere Optimierungen aus Vorhersagemodellen wie einem GNN einschränkt. Diese Dissertation stellt einen Ansatz vor, der die NBS-Methodik mit dem GNN-Framework durch eine neu entwickelte Verlustfunktion für das Training integriert. Wir evaluieren unseren Ansatz anhand von Benchmark-Datensätzen durch umfangreiche Experimente und heben dabei seine Vorteile und Einschränkungen hervor. Zusätzlich bieten wir einen umfassenden Überblick über relevante Literatur zur Verwendung von MMPs bei der Eigenschaftsvorhersage. Diese Dissertation trägt ein robustes Modell bei, das darauf abzielt, die Leistung bei der Vorhersage molekularer Eigenschaften zu verbessern und die Rolle von MMPs bei der Eigenschaftsvorhersage voranzutreiben.
Abstract (eng)
This thesis focuses on the application of Machine Learning (ML) techniques in drug discovery, emphasizing on the Matched Molecular Pair (MMP) methodology alongside Graph Neural Network (GNN) for molecular property prediction. To accelerate the screening of candidate molecules for drug development, computational methods have been employed to predict and filter molecules based on their relevant properties. The change in property between two structurally similar compounds is encapsulated by the theory of MMP, which is defined as a pair of compounds that differ by a well-defined structural change. This concept aids in revealing structural elements essential to property prediction. One approach that employs this concept is Network Balance Scaling (NBS), which integrates the predictive capabilities of ML models and the structural relationships between compounds as an MMP network. However, NBS is primarily utilized as a post-processing step, thereby limiting the potential for further optimization from prediction models such as a GNN. This thesis presents an approach that incorporates the NBS methodology with the GNN framework through a custom loss function for training. We evaluate our approach on benchmark datasets through extensive experiments, highlighting its advantages and limitations. Additionally, we provide a comprehensive overview of relevant literature regarding the use of MMPs in property prediction. This thesis contributes a robust model aimed at improving performance in molecular property prediction and advancing the role MMPs play in property prediction.
Keywords (deu)
Matched Molecular PairsMMPGraph Neural NetworkGNNMachine LearningMLMMP-NetzwerkVorhersage molekularer Eigenschaften
Keywords (eng)
Matched Molecular PairsMMPGraph Neural NetworkGNNMachine LearningMLMMP networkMolecular Property Prediction
Subject (deu)
Type (deu)
Extent (deu)
xi, 47 Seiten : Illustrationen
Number of pages
61
Study plan
Masterstudium Informatik
[UA]
[066]
[921]
Association (deu)
Members (1)
Title (eng)
Property prediction with matched molecular pair networks
Author
Rupendra Lal Shrestha
Abstract (deu)
Diese Dissertation konzentriert sich auf die Anwendung von Machine-Learning-Techniken (ML) in der Arzneimittelforschung und verwendet die Methode der Matched Molecular Pairs (MMP) neben dem Graph Neural Network (GNN) zur Vorhersage molekularer Eigenschaften. Um das Screening von Kandidatenmolekülen für die Arzneimittel-entwicklung zu beschleunigen, wurden rechnergestützte Methoden eingesetzt, um Moleküle basierend auf ihren relevanten Eigenschaften vorherzusagen und zu filtern. Die Veränderung von Eigenschaften zwischen zwei strukturell ähnlichen Verbindungen wird durch die Theorie des MMPs erfasst, das als Paar von Verbindungen definiert ist, die sich durch eine klar definierte strukturelle Veränderung unterscheiden. Dieses Konzept hilft dabei, strukturelle Elemente aufzudecken, die für die Eigenschaftsvorhersage wesentlich sind. Ein Ansatz, der dieses Konzept verwendet, ist das Network Balance Scaling (NBS), das die Vorhersagefähigkeiten von ML-Modellen und die strukturellen Beziehungen zwischen Verbindungen als MMP-Netzwerk integriert. Allerdings wird NBS hauptsächlich als Nachbearbeitungsschritt verwendet, was das Potenzial für weitere Optimierungen aus Vorhersagemodellen wie einem GNN einschränkt. Diese Dissertation stellt einen Ansatz vor, der die NBS-Methodik mit dem GNN-Framework durch eine neu entwickelte Verlustfunktion für das Training integriert. Wir evaluieren unseren Ansatz anhand von Benchmark-Datensätzen durch umfangreiche Experimente und heben dabei seine Vorteile und Einschränkungen hervor. Zusätzlich bieten wir einen umfassenden Überblick über relevante Literatur zur Verwendung von MMPs bei der Eigenschaftsvorhersage. Diese Dissertation trägt ein robustes Modell bei, das darauf abzielt, die Leistung bei der Vorhersage molekularer Eigenschaften zu verbessern und die Rolle von MMPs bei der Eigenschaftsvorhersage voranzutreiben.
Abstract (eng)
This thesis focuses on the application of Machine Learning (ML) techniques in drug discovery, emphasizing on the Matched Molecular Pair (MMP) methodology alongside Graph Neural Network (GNN) for molecular property prediction. To accelerate the screening of candidate molecules for drug development, computational methods have been employed to predict and filter molecules based on their relevant properties. The change in property between two structurally similar compounds is encapsulated by the theory of MMP, which is defined as a pair of compounds that differ by a well-defined structural change. This concept aids in revealing structural elements essential to property prediction. One approach that employs this concept is Network Balance Scaling (NBS), which integrates the predictive capabilities of ML models and the structural relationships between compounds as an MMP network. However, NBS is primarily utilized as a post-processing step, thereby limiting the potential for further optimization from prediction models such as a GNN. This thesis presents an approach that incorporates the NBS methodology with the GNN framework through a custom loss function for training. We evaluate our approach on benchmark datasets through extensive experiments, highlighting its advantages and limitations. Additionally, we provide a comprehensive overview of relevant literature regarding the use of MMPs in property prediction. This thesis contributes a robust model aimed at improving performance in molecular property prediction and advancing the role MMPs play in property prediction.
Keywords (deu)
Matched Molecular PairsMMPGraph Neural NetworkGNNMachine LearningMLMMP-NetzwerkVorhersage molekularer Eigenschaften
Keywords (eng)
Matched Molecular PairsMMPGraph Neural NetworkGNNMachine LearningMLMMP networkMolecular Property Prediction
Subject (deu)
Type (deu)
Number of pages
61
Association (deu)