You are here: University of Vienna PHAIDRA Detail o:1538983
Title (eng)
Finding needles in the Galactic haystack
towards interpretable machine learning methods to identify stellar structures in the Milky Way
Parallel title (deu)
Die Suche nach Nadeln im galaktischen Heuhaufen
interpretierbare Machine Learning Methoden zur Auffindung von Sternhaufen in der Milchstraße
Author
Sebastian Ratzenböck
Adviser
Torsten Möller
Adviser
João Alves
Assessor
David W. Hogg
Assessor
Alberto Krone-Martins
Abstract (deu)

Die vorliegende Doktorarbeit beschäftigt sich mit dem Auffinden stellarer Gruppen in der Milchstraße und beabsichtigt es, neue Blickwinkel auf gebräuchliche Methoden in diesem Bereich zu eröffnen. Insbesondere sollen im Zuge der Arbeit transparente Analysemethoden bereitgestellt werden, um bisher unbekannte Sternhaufen sowie neue Mitglieder bekannter stellarer Populationen aufzudecken. Ziel ist es, Techniken für Astronom*innen bereitzustellen, welche ein vollständigeres Bild verschiedener Sternhaufen in der lokalen Milchstraße darstellen können. Im Rahmen der Dissertation wird zunächst das Verfahren Uncover vorgestellt. Uncover ist ein Verfahren zur umfangreichen Mitgliederanalyse stellarer Gruppen und kann zuvor entdeckte zugehörige Sterne dieser Gruppen einbeziehen, um nach bisher unentdeckten Sternen zu suchen. Die Methode konnte erfolgreich in zwei Anwendungsfällen durchgeführt werden: bei der kürzlich entdeckten Meingast 1 Gruppe - einem Sternhaufen, das gleichzeitig mit den Plejaden geformt wurde und etwa 120 Grad des Himmels einnimmt - und bei der bereits sehr eingehend erforschten Sternentstehungsregion rho Ophiuchus. Für diese beiden sehr unterschiedlichen Sternsysteme konnte Uncover die Anzahl der gefundenen zugehörigen Sterne um das Zehnfache, somit um etwa 200 Sterne erhöhen. Bei der zweiten Methode zur Auffindung stellarer Gruppen handelt es sich um einen innovativen Clustering-Algorithmus, Signiőcance Mode Analysis (SigMA), der die topologischen Eigenschaften der Dichteverteilung im mehrdimensionalen Phasenraum untersucht. Durch die Anwendung von SigMA auf Gaia-EDR3-Daten der Scorpius-Centaurus-Assoziation (Sco-Cen) konnten zum ersten Mal 48 sich gemeinsam bewegende und gleichaltrige Cluster in Sco-Cen gefunden werden, von denen viele bisher unbekannt waren. Diese 48 Haufen wurden unabhängig voneinander mit Hilfe von astrophysikalischem Wissen validiert. Sowohl Uncover als auch SigMA sind in einer domänenspezifischen Sprache formuliert, verwenden aussagekräftige Hyperparameter und ermöglichen eine Ergebnisvalidierung, um zuverlässige Ergebnisse sicherzustellen. Mit diesen Werkzeugen möchten wir dazu beitragen, die derzeitige Kultur des blinden Vertrauens in Machine-Learning-Tools zu verändern und Astronom*innen dabei helfen, Modelle auf Grundlage ihrer Fachkenntnisse zu erstellen und zu modifizieren.

Abstract (eng)

This doctoral thesis aims to take a different look at stellar structure censuses in the Milky Way. Specifically, it aims to provide interpretable analysis methods to uncover both previously unknown stellar structures and new members of known stellar populations, providing astronomers with a more complete picture of the different stellar structures in the local Milky Way. The thesis contributions to the field are twofold: first, it introduces Uncover, an extended membership analysis technique that integrates known members of star clusters to search for yet undetected cluster members. Uncover is successfully applied to two different use cases, the recently discovered Meingast 1 stream, a Pleiades-age structure covering about 120 degrees of the sky, and the well-studied star-forming region rho Ophiuchus. For these two very different stellar structures, Uncover increased the number of members by tenfold and by about 200, respectively. Second, the thesis introduces Significance Mode Analysis (SigMA), an innovative clustering algorithm that studies the topological properties of the density field in multidimensional phase space. The application of SigMA to Gaia EDR3 data of the closest young association to Earth, the Scorpio-Centaurus (Sco-Cen) association, finds, for the first time, 48 co-moving and coeval clusters in Sco-Cen, many of them previously unknown. These 48 clusters are independently validated using astrophysical knowledge unknown to SigMA. Both Uncover and SigMA are formulated in domain-specific language, use expressive hyper-parameters, and allow for result validation to provide confidence in the results. With these tools, we seek to contribute to changing the current culture of blind acceptance of machine learning results and help astronomers build and modify models based on their expertise.

Keywords (deu)
Machine LearningClusteranalyseDesignstudieSternhaufen
Keywords (eng)
Machine learningCluster analysisDesign studyStellar groups
Subject (deu)
Subject (deu)
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1538983
rdau:P60550 (deu)
xii, 122 Seiten : Illustrationen
Number of pages
136
Study plan
Dr.-Studium der technischen Wissenschaften (DissG: Informatik)
[UA]
[786]
[880]
Association (deu)
Members (1)
Title (eng)
Finding needles in the Galactic haystack
towards interpretable machine learning methods to identify stellar structures in the Milky Way
Parallel title (deu)
Die Suche nach Nadeln im galaktischen Heuhaufen
interpretierbare Machine Learning Methoden zur Auffindung von Sternhaufen in der Milchstraße
Author
Sebastian Ratzenböck
Abstract (deu)

Die vorliegende Doktorarbeit beschäftigt sich mit dem Auffinden stellarer Gruppen in der Milchstraße und beabsichtigt es, neue Blickwinkel auf gebräuchliche Methoden in diesem Bereich zu eröffnen. Insbesondere sollen im Zuge der Arbeit transparente Analysemethoden bereitgestellt werden, um bisher unbekannte Sternhaufen sowie neue Mitglieder bekannter stellarer Populationen aufzudecken. Ziel ist es, Techniken für Astronom*innen bereitzustellen, welche ein vollständigeres Bild verschiedener Sternhaufen in der lokalen Milchstraße darstellen können. Im Rahmen der Dissertation wird zunächst das Verfahren Uncover vorgestellt. Uncover ist ein Verfahren zur umfangreichen Mitgliederanalyse stellarer Gruppen und kann zuvor entdeckte zugehörige Sterne dieser Gruppen einbeziehen, um nach bisher unentdeckten Sternen zu suchen. Die Methode konnte erfolgreich in zwei Anwendungsfällen durchgeführt werden: bei der kürzlich entdeckten Meingast 1 Gruppe - einem Sternhaufen, das gleichzeitig mit den Plejaden geformt wurde und etwa 120 Grad des Himmels einnimmt - und bei der bereits sehr eingehend erforschten Sternentstehungsregion rho Ophiuchus. Für diese beiden sehr unterschiedlichen Sternsysteme konnte Uncover die Anzahl der gefundenen zugehörigen Sterne um das Zehnfache, somit um etwa 200 Sterne erhöhen. Bei der zweiten Methode zur Auffindung stellarer Gruppen handelt es sich um einen innovativen Clustering-Algorithmus, Signiőcance Mode Analysis (SigMA), der die topologischen Eigenschaften der Dichteverteilung im mehrdimensionalen Phasenraum untersucht. Durch die Anwendung von SigMA auf Gaia-EDR3-Daten der Scorpius-Centaurus-Assoziation (Sco-Cen) konnten zum ersten Mal 48 sich gemeinsam bewegende und gleichaltrige Cluster in Sco-Cen gefunden werden, von denen viele bisher unbekannt waren. Diese 48 Haufen wurden unabhängig voneinander mit Hilfe von astrophysikalischem Wissen validiert. Sowohl Uncover als auch SigMA sind in einer domänenspezifischen Sprache formuliert, verwenden aussagekräftige Hyperparameter und ermöglichen eine Ergebnisvalidierung, um zuverlässige Ergebnisse sicherzustellen. Mit diesen Werkzeugen möchten wir dazu beitragen, die derzeitige Kultur des blinden Vertrauens in Machine-Learning-Tools zu verändern und Astronom*innen dabei helfen, Modelle auf Grundlage ihrer Fachkenntnisse zu erstellen und zu modifizieren.

Abstract (eng)

This doctoral thesis aims to take a different look at stellar structure censuses in the Milky Way. Specifically, it aims to provide interpretable analysis methods to uncover both previously unknown stellar structures and new members of known stellar populations, providing astronomers with a more complete picture of the different stellar structures in the local Milky Way. The thesis contributions to the field are twofold: first, it introduces Uncover, an extended membership analysis technique that integrates known members of star clusters to search for yet undetected cluster members. Uncover is successfully applied to two different use cases, the recently discovered Meingast 1 stream, a Pleiades-age structure covering about 120 degrees of the sky, and the well-studied star-forming region rho Ophiuchus. For these two very different stellar structures, Uncover increased the number of members by tenfold and by about 200, respectively. Second, the thesis introduces Significance Mode Analysis (SigMA), an innovative clustering algorithm that studies the topological properties of the density field in multidimensional phase space. The application of SigMA to Gaia EDR3 data of the closest young association to Earth, the Scorpio-Centaurus (Sco-Cen) association, finds, for the first time, 48 co-moving and coeval clusters in Sco-Cen, many of them previously unknown. These 48 clusters are independently validated using astrophysical knowledge unknown to SigMA. Both Uncover and SigMA are formulated in domain-specific language, use expressive hyper-parameters, and allow for result validation to provide confidence in the results. With these tools, we seek to contribute to changing the current culture of blind acceptance of machine learning results and help astronomers build and modify models based on their expertise.

Keywords (deu)
Machine LearningClusteranalyseDesignstudieSternhaufen
Keywords (eng)
Machine learningCluster analysisDesign studyStellar groups
Subject (deu)
Subject (deu)
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1542061
Number of pages
136
Association (deu)