You are here: University of Vienna PHAIDRA Detail o:1414525
Title (eng)
Deep probabilistic clustering for multi-view data and missing data
Parallel title (deu)
Probabilistisches Deep Clustering für multimodale und unvollständige Daten
Author
Donatella Novakovic
Adviser
Sebastian Tschiatschek
Assessor
Sebastian Tschiatschek
Abstract (deu)
In dieser Arbeit heben wir die Bedeutung von Deep Clustering Methoden für multimodale und unvollständige Datensätze hervor. Dabei kombinieren wir zwei bestehende Methoden, das probabilistische Deep Clustering Modell für unimodale Daten, Variational Deep Embedding (VaDE), sowie den Partial Variational Autoencoder (VAE) mit der Pointnet Plus (PNP) Struktur, welcher erlaubt auch unvollständige Daten zu berücksichtigen. Wir erweitern die Architektur von VaDE um einen weiteren VAE und untersuchen zwei Methoden um multimodale Datensätze zu verknüpfen. Um mit fehlenden Datenpunkten in beiden Datenmodalitäten umgehen zu können, integrieren wir den Partial VAE mit dem PNP. Mit dieser Vorgehensweise definieren wir ein partielles Clustering-Ziel, welches ausschließlich von beobachteten Datenpunkten abhängt und stellen das Partial Multi-View Variational Deep Embedding (Partial MV-VaDE) Modell vor. Die Performance des Modells wird anhand von umfangreichen Experimenten an multimodalen Datensätzen, für welche fehlende Datenpunkte generiert werden, evaluiert. Außerdem schauen wir uns die Cluster-Wahrscheinlichkeiten im Detail an und vergleichen die Resultate mit verschiedenen Baseline-Methoden.
Abstract (eng)
In this thesis, we aim to raise the importance of deep clustering methods for multi-view and missing data. We combine two state-of-the-art methods, the Variational Deep Embedding (VaDE) initially designed for deep probabilistic clustering of single-view data and the Partial Variational Autoencoder (VAE) with the Pointnet Plus (PNP) structure, a method to predict missing data points. More precisely, we extend VaDE by an additional VAE and examine two fusion techniques for creating a shared distribution between two data views. To handle missingness in both views, we integrate the Partial VAE with PNP, which enables the definition of a partial clustering objective that depends on observed data samples only. As a result, we propose the Partial Multi-View Variational Deep Embedding (Partial MV-VaDE), a deep probabilistic clustering model targeting multi-view and missing data. We evaluate the model's performance in extensive experiments with numerous multi-view data sets for which we generate different amounts of missingness. We observe the model's changes in cluster probabilities in more detail and compare the clustering results to several baseline methods.
Keywords (deu)
Deep ClusteringProbabilistisches ModellMultimodale DatenUnvollständige DatenVAEErweiterung von VaDEPartial VAE
Keywords (eng)
Deep Probabilistic ClusteringGenerative ModellMulti-View DataMissing DataVAEExtension of VaDEPartial VAE
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1414525
rdau:P60550 (deu)
vi, 73 Seiten : Illustrationen
Number of pages
80
Association (deu)
Members (1)
Title (eng)
Deep probabilistic clustering for multi-view data and missing data
Parallel title (deu)
Probabilistisches Deep Clustering für multimodale und unvollständige Daten
Author
Donatella Novakovic
Abstract (deu)
In dieser Arbeit heben wir die Bedeutung von Deep Clustering Methoden für multimodale und unvollständige Datensätze hervor. Dabei kombinieren wir zwei bestehende Methoden, das probabilistische Deep Clustering Modell für unimodale Daten, Variational Deep Embedding (VaDE), sowie den Partial Variational Autoencoder (VAE) mit der Pointnet Plus (PNP) Struktur, welcher erlaubt auch unvollständige Daten zu berücksichtigen. Wir erweitern die Architektur von VaDE um einen weiteren VAE und untersuchen zwei Methoden um multimodale Datensätze zu verknüpfen. Um mit fehlenden Datenpunkten in beiden Datenmodalitäten umgehen zu können, integrieren wir den Partial VAE mit dem PNP. Mit dieser Vorgehensweise definieren wir ein partielles Clustering-Ziel, welches ausschließlich von beobachteten Datenpunkten abhängt und stellen das Partial Multi-View Variational Deep Embedding (Partial MV-VaDE) Modell vor. Die Performance des Modells wird anhand von umfangreichen Experimenten an multimodalen Datensätzen, für welche fehlende Datenpunkte generiert werden, evaluiert. Außerdem schauen wir uns die Cluster-Wahrscheinlichkeiten im Detail an und vergleichen die Resultate mit verschiedenen Baseline-Methoden.
Abstract (eng)
In this thesis, we aim to raise the importance of deep clustering methods for multi-view and missing data. We combine two state-of-the-art methods, the Variational Deep Embedding (VaDE) initially designed for deep probabilistic clustering of single-view data and the Partial Variational Autoencoder (VAE) with the Pointnet Plus (PNP) structure, a method to predict missing data points. More precisely, we extend VaDE by an additional VAE and examine two fusion techniques for creating a shared distribution between two data views. To handle missingness in both views, we integrate the Partial VAE with PNP, which enables the definition of a partial clustering objective that depends on observed data samples only. As a result, we propose the Partial Multi-View Variational Deep Embedding (Partial MV-VaDE), a deep probabilistic clustering model targeting multi-view and missing data. We evaluate the model's performance in extensive experiments with numerous multi-view data sets for which we generate different amounts of missingness. We observe the model's changes in cluster probabilities in more detail and compare the clustering results to several baseline methods.
Keywords (deu)
Deep ClusteringProbabilistisches ModellMultimodale DatenUnvollständige DatenVAEErweiterung von VaDEPartial VAE
Keywords (eng)
Deep Probabilistic ClusteringGenerative ModellMulti-View DataMissing DataVAEExtension of VaDEPartial VAE
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1417847
Number of pages
80
Association (deu)