You are here: University of Vienna PHAIDRA Detail o:1632983
Title (eng)
Variational autoencoders with structured missingness
Parallel title (deu)
Variational Autoencoders mit strukturiert fehlenden Daten
Author
Michael Raffelsberger
Adviser
Sebastian Tschiatschek
Assessor
Sebastian Tschiatschek
Abstract (deu)
Wir untersuchen und verbessern Variational Autoencoders (VAE), wenn Variablen eines Datensatzes missing at random sind. Im untersuchten Setting fehlen Werte einer oder mehrerer Variablen aufgrund der bereits beobachteten Werte anderer Variablen, die Information über die fehlenden Werte enthalten. Bei einer medizinischen Untersuchung beispielsweise könnte ein Doktor entscheiden, Folgeuntersuchungen auszulassen, da bereits vorliegende Befunde Rückschlüsse auf die Resultate der Folgeuntersuchungen ermöglichen. In diesem Fall liegt sowohl Vorwissen zum Missingness Prozess als auch zu den fehlenden Werten selbst vor. Wir zeigen, dass dieser Fall zu unerwünschten Ergebnissen führen kann, insbesondere bei kleinen Datensätzen, und dass Vorwissen zum Missingness Prozess nur eingeschränkt hilfreich ist. Unsere Kernidee besteht darin, das Vorwissen zu den fehlenden Werten direkt zu verwenden, um das Modell zu regularisieren. Diese Kombination aus Daten und Vorwissen verbessert die Ergebnisse und macht das Modell robuster und zuverlässiger.
Abstract (eng)
We investigate and improve variational autoencoders (VAE) in the presence of missing at random data. In our assumed setting, certain variables of a sample are unobserved because of the values of variables recorded earlier that already carry some information about the unobserved values. Imagine a doctor deciding to skip further diagnostic tests based on already available results of other tests. In this setting, we have both knowledge about the missingness process as well as a presumption about the values of the unobserved variables. We show that such missingness leads to unsatisfactory results, especially for small datasets and that knowledge about the missingness process is barely helpful. Therefore, our core idea is to incorporate knowledge about the actual unobserved values via imputation or additional loss terms to regularize the model. This idea allows to find a sweet spot between data and knowledge, improves results and makes the model more robust and reliable.
Keywords (deu)
variational autoencodersmissing dataprior knowledge
Keywords (eng)
Variational Autoencodersfehlende DatenVorwissen
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1632983
rdau:P60550 (deu)
xiii, 68 Seiten : Illustrationen
Number of pages
84
Association (deu)
Members (1)
Title (eng)
Variational autoencoders with structured missingness
Parallel title (deu)
Variational Autoencoders mit strukturiert fehlenden Daten
Author
Michael Raffelsberger
Abstract (deu)
Wir untersuchen und verbessern Variational Autoencoders (VAE), wenn Variablen eines Datensatzes missing at random sind. Im untersuchten Setting fehlen Werte einer oder mehrerer Variablen aufgrund der bereits beobachteten Werte anderer Variablen, die Information über die fehlenden Werte enthalten. Bei einer medizinischen Untersuchung beispielsweise könnte ein Doktor entscheiden, Folgeuntersuchungen auszulassen, da bereits vorliegende Befunde Rückschlüsse auf die Resultate der Folgeuntersuchungen ermöglichen. In diesem Fall liegt sowohl Vorwissen zum Missingness Prozess als auch zu den fehlenden Werten selbst vor. Wir zeigen, dass dieser Fall zu unerwünschten Ergebnissen führen kann, insbesondere bei kleinen Datensätzen, und dass Vorwissen zum Missingness Prozess nur eingeschränkt hilfreich ist. Unsere Kernidee besteht darin, das Vorwissen zu den fehlenden Werten direkt zu verwenden, um das Modell zu regularisieren. Diese Kombination aus Daten und Vorwissen verbessert die Ergebnisse und macht das Modell robuster und zuverlässiger.
Abstract (eng)
We investigate and improve variational autoencoders (VAE) in the presence of missing at random data. In our assumed setting, certain variables of a sample are unobserved because of the values of variables recorded earlier that already carry some information about the unobserved values. Imagine a doctor deciding to skip further diagnostic tests based on already available results of other tests. In this setting, we have both knowledge about the missingness process as well as a presumption about the values of the unobserved variables. We show that such missingness leads to unsatisfactory results, especially for small datasets and that knowledge about the missingness process is barely helpful. Therefore, our core idea is to incorporate knowledge about the actual unobserved values via imputation or additional loss terms to regularize the model. This idea allows to find a sweet spot between data and knowledge, improves results and makes the model more robust and reliable.
Keywords (deu)
variational autoencodersmissing dataprior knowledge
Keywords (eng)
Variational Autoencodersfehlende DatenVorwissen
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1637903
Number of pages
84
Association (deu)