Title (eng)
Correlation-free and parallelizable Transition Path Sampling using Boltzmann Generators and committor learning
Parallel title (deu)
Korrelationsfreies und parallelisierbares Transition Path Sampling durch Boltzmann Generatoren und das Erlernen des Committors
Author
Maximilian Negedly
Advisor
Christoph Dellago
Assessor
Christoph Dellago
Abstract (deu)
Molekulare und atomistische Systeme halten sich bevorzugterweise in Regionen minimaler potentieller oder freier Energie, sogenannten stabilen oder metastabilen Zuständen, auf. Will man solche Systeme per Computer simulieren, stellt diese Eigenschaft eine große Herausforderung dar, da ein beträchtlicher Teil der begrenzten Simulationszeit innerhalb dieser Zustände verbracht wird. Ist man daran interessiert, das Übergangsverhalten eines solchen Systems zu verstehen, so ist dies besonders problematisch, da Übergänge selten und daher kostspielig zu gewinnen sind. Transition Path Sampling (TPS) ist eine bewährte Methode, Übergänge zwischen stabilen Zuständen zu erzwingen. Der ihr zugrundeliegende Algorithmus wird allerdings durch drei Faktoren in seiner Effizienz reduziert. Einerseits sind die Daten, die er produziert, oftmals mit langen Korrelationszeiten behaftet. Andererseits ist er durchwegs sequenziell, weshalb er nicht von heutzutage üblichen parallelen Rechnerstrukturen wie Supercomputern profitieren kann. Außerdem ignoriert er die dem Übergang zugrundeliegenden Mechanismen, obwohl eine geeignete Nutzung dieser oftmals seine Effizienz erhöhen kann. Bestehende Publikationen haben gezeigt, dass es möglich ist, ein generatives Machine Learning Modell namens Boltzmann Generator zu nutzen, um TPS parallelisierbar zu machen und Korrelationen zu eliminieren, jedoch unter der Voraussetzung, dass eine geeignete Reaktionskoordinate bekannt ist, welche den Übergang parametrisiert. Solch eine Reaktionskoordinate ist jedoch meist schwer oder gar unmöglich zu finden. Diese Arbeit verwendet den Committor eines Systems als ideale Reaktionskoordinate. Da dieser weder analytisch berechnet noch effizient im Rahmen von Simulationen approximiert werden kann, wird abermals Machine Learning eingesetzt, um den Committor zu erlernen. Dafür werden allerdings unkorrelierte Trainingsdaten aus einer TPS Simulation benötigt, welche, wie bereits diskutiert, mithilfe von Boltzmann Generatoren erzeugt werden können. In dieser Arbeit wird ein Algorithmus entwickelt, welcher das Erlernen des Committors mit dem Erzeugen unkorrelierter Konfigurationen mittels Boltzmann Generatoren kombiniert und das simultane Training beider Machine Learning Modelle auf selbstkonsistente Art und Weise ermöglicht. Das Resultat ist eine neue TPS Methode, welche unkorrelierte Daten produziert, vollständig parallelisiert werden kann und sich die dem Übergang zugrundeliegenden Mechanismen effizient zunutze macht - all dies ohne vorherige Kenntnis einer Reaktionskoordinate. Dieser Algorithmus wird mithilfe zweier Testsysteme auf seine Funktionsfähigkeit überprüft: einem einfachen zweidimensionalen Modell und einem komplexeren Modell eines simplen Polymers. Dies unterstreicht das Potential von effizientem generativem Path Sampling.
Abstract (eng)
Molecular and atomistic systems often exhibit a complex energy landscape with multiple stable and metastable states in which they preferentially dwell. This poses a challenge if one wishes to perform computer simulations of such systems, as the majority of computer time will be spent in those stable states, while interesting transitions between them are rare. Transition Path Sampling (TPS) is a well established method that focusses computational resources on the transition region, but its efficiency is hindered by its sequentiality, its ignorance towards potentially useful information provided by the underlying reaction mechanism and by oftentimes long correlation times between the samples it produces. Previous works have used a generative machine learning model called Boltzmann Generators to eliminate correlations between paths and make TPS parallelizable, but at the cost of requiring knowledge of a good reaction coordinate parametrizing the transition, which is highly non-trivial or even impossible to obtain in complex systems. This work explores the use of the committor of a system as an ideal reaction coordinate for accelerating path sampling. Since it is intractable analytically and costly to obtain through simulation, machine learning is used again to learn the committor. However, this approach requires uncorrelated training data obtained via TPS, which in turn can be produced using Boltzmann Generators. This thesis proposes an algorithm that resolves this circular dependence by combining committor learning with the generative capabilities of Boltzmann Generators, training both machine learning models simultaneously in a self-consistent way. The result is a new TPS scheme that is fully parallelizable, produces uncorrelated samples and optimises sampling efficiency without prior knowledge of a reaction coordinate. The algorithm is tested on two example systems: a two-dimensional model and a simple polymer model, acting as a proof of concept for efficient generative path sampling.
Keywords (deu)
Boltzmann GeneratorComputersimulation physikalischer SystemeAlgorithmusTransition Path SamplingMaschinelles LernenGeneratives Maschinelles Lernen
Keywords (eng)
Boltzmann GeneratorMolecular simulationTransition Path SamplingEnhanced SamplingAlgorithmCommittorEfficient samplingMachine LearningGenerative Machine Learning
Subject (deu)
Subject (deu)
Type (deu)
Persistent identifier
Extent (deu)
x, 63 Seiten : Illustrationen, Diagramme
Number of pages
75
Study plan
Masterstudium Physics
[UA]
[066]
[876]
Association (deu)
Title (eng)
Correlation-free and parallelizable Transition Path Sampling using Boltzmann Generators and committor learning
Parallel title (deu)
Korrelationsfreies und parallelisierbares Transition Path Sampling durch Boltzmann Generatoren und das Erlernen des Committors
Author
Maximilian Negedly
Abstract (deu)
Molekulare und atomistische Systeme halten sich bevorzugterweise in Regionen minimaler potentieller oder freier Energie, sogenannten stabilen oder metastabilen Zuständen, auf. Will man solche Systeme per Computer simulieren, stellt diese Eigenschaft eine große Herausforderung dar, da ein beträchtlicher Teil der begrenzten Simulationszeit innerhalb dieser Zustände verbracht wird. Ist man daran interessiert, das Übergangsverhalten eines solchen Systems zu verstehen, so ist dies besonders problematisch, da Übergänge selten und daher kostspielig zu gewinnen sind. Transition Path Sampling (TPS) ist eine bewährte Methode, Übergänge zwischen stabilen Zuständen zu erzwingen. Der ihr zugrundeliegende Algorithmus wird allerdings durch drei Faktoren in seiner Effizienz reduziert. Einerseits sind die Daten, die er produziert, oftmals mit langen Korrelationszeiten behaftet. Andererseits ist er durchwegs sequenziell, weshalb er nicht von heutzutage üblichen parallelen Rechnerstrukturen wie Supercomputern profitieren kann. Außerdem ignoriert er die dem Übergang zugrundeliegenden Mechanismen, obwohl eine geeignete Nutzung dieser oftmals seine Effizienz erhöhen kann. Bestehende Publikationen haben gezeigt, dass es möglich ist, ein generatives Machine Learning Modell namens Boltzmann Generator zu nutzen, um TPS parallelisierbar zu machen und Korrelationen zu eliminieren, jedoch unter der Voraussetzung, dass eine geeignete Reaktionskoordinate bekannt ist, welche den Übergang parametrisiert. Solch eine Reaktionskoordinate ist jedoch meist schwer oder gar unmöglich zu finden. Diese Arbeit verwendet den Committor eines Systems als ideale Reaktionskoordinate. Da dieser weder analytisch berechnet noch effizient im Rahmen von Simulationen approximiert werden kann, wird abermals Machine Learning eingesetzt, um den Committor zu erlernen. Dafür werden allerdings unkorrelierte Trainingsdaten aus einer TPS Simulation benötigt, welche, wie bereits diskutiert, mithilfe von Boltzmann Generatoren erzeugt werden können. In dieser Arbeit wird ein Algorithmus entwickelt, welcher das Erlernen des Committors mit dem Erzeugen unkorrelierter Konfigurationen mittels Boltzmann Generatoren kombiniert und das simultane Training beider Machine Learning Modelle auf selbstkonsistente Art und Weise ermöglicht. Das Resultat ist eine neue TPS Methode, welche unkorrelierte Daten produziert, vollständig parallelisiert werden kann und sich die dem Übergang zugrundeliegenden Mechanismen effizient zunutze macht - all dies ohne vorherige Kenntnis einer Reaktionskoordinate. Dieser Algorithmus wird mithilfe zweier Testsysteme auf seine Funktionsfähigkeit überprüft: einem einfachen zweidimensionalen Modell und einem komplexeren Modell eines simplen Polymers. Dies unterstreicht das Potential von effizientem generativem Path Sampling.
Abstract (eng)
Molecular and atomistic systems often exhibit a complex energy landscape with multiple stable and metastable states in which they preferentially dwell. This poses a challenge if one wishes to perform computer simulations of such systems, as the majority of computer time will be spent in those stable states, while interesting transitions between them are rare. Transition Path Sampling (TPS) is a well established method that focusses computational resources on the transition region, but its efficiency is hindered by its sequentiality, its ignorance towards potentially useful information provided by the underlying reaction mechanism and by oftentimes long correlation times between the samples it produces. Previous works have used a generative machine learning model called Boltzmann Generators to eliminate correlations between paths and make TPS parallelizable, but at the cost of requiring knowledge of a good reaction coordinate parametrizing the transition, which is highly non-trivial or even impossible to obtain in complex systems. This work explores the use of the committor of a system as an ideal reaction coordinate for accelerating path sampling. Since it is intractable analytically and costly to obtain through simulation, machine learning is used again to learn the committor. However, this approach requires uncorrelated training data obtained via TPS, which in turn can be produced using Boltzmann Generators. This thesis proposes an algorithm that resolves this circular dependence by combining committor learning with the generative capabilities of Boltzmann Generators, training both machine learning models simultaneously in a self-consistent way. The result is a new TPS scheme that is fully parallelizable, produces uncorrelated samples and optimises sampling efficiency without prior knowledge of a reaction coordinate. The algorithm is tested on two example systems: a two-dimensional model and a simple polymer model, acting as a proof of concept for efficient generative path sampling.
Keywords (deu)
Boltzmann GeneratorComputersimulation physikalischer SystemeAlgorithmusTransition Path SamplingMaschinelles LernenGeneratives Maschinelles Lernen
Keywords (eng)
Boltzmann GeneratorMolecular simulationTransition Path SamplingEnhanced SamplingAlgorithmCommittorEfficient samplingMachine LearningGenerative Machine Learning
Subject (deu)
Subject (deu)
Type (deu)
Persistent identifier
Number of pages
75
Association (deu)
License
- Citable links
- Other links
- Managed by
- DetailsObject typeContainerCreated20.06.2025 12:45:40 UTC
- Usage statistics-
- Metadata
- Export formats
