You are here: University of Vienna PHAIDRA Detail o:1403909
Title (eng)
Discovering nonlinear contributions from multi-omics to phenotypic variations
Parallel title (deu)
Identifizierung nicht-linearer Effekte von Multi-Omics auf phenotypische Variationen
Author
Michelle Binsfeld
Advisor
Joachim Hermisson
Assessor
Joachim Hermisson
Abstract (deu)
Das Ziel von Assoziationsstudien ist die Identifizierung von Polymorphismen, die im Zusammenhang mit einem komplexen Merkmal stehen. Die Standardmodelle hierfür sind lineare Modelle, die auf sogenannten “Single-Locus” Tests beruhen. Deswegen können Gene mit nicht-linearem Effekt, sowie Gene, die zwar mit anderen Genen interagieren, aber selbst keine marginale Effekte zeigen, nicht identifiziert werden. Die meisten komplexen Merkmale sind jedoch durch multiple Gene und ihre wechselwirkende Effekte bestimmt. Wir zeigen, dass ein nicht-lineares Modell, das auch Interaktionen und Heterogenität erfasst, mehr Gene identifizieren kann als das Standardmodell. Hierfür haben wir eine Pipeline entwickelt, die auf Random Forests beruht und die Anzahl der genetischen Marker (Prädiktorvariablen) in jedem Schritt reduziert. Dies ist eine vielversprechende Alternative zu den linearen Modellen in genomweiten (GWAS) und transkriptomweiten (TWAS) Assoziationsstudien. Weiterhin erlauben Random Forests es, eine neue Assoziationsstudie (GTWAS) zu betrachten, indem genetische und transkriptomische Variation in ein Modell integriert werden.
Abstract (eng)
The aim of association studies is to understand the genetic architecture of complex traits, which is a fundamental issue in genetics. The standard approaches are based on linear mixed models using single-locus tests. Therefore, they might miss nonlinear loci that are involved in interactions but do not show significant marginal effects. Many complex phenotypes however are determined by multiple loci and their interactive effects. We show that a model, which allows for nonlinear effects, epistatic interactions and heterogeneity, increases the association power. Due to the high-dimensionality of omics data, the search of epistatic interactions is challenging. We have developed a pipeline based on random forests that reduces the search space for significant associations and interactions in each step. It is a promising alternative to the traditional approaches in genome-wide (GWAS) and transcriptome-wide (TWAS) association studies and furthermore allows us to construct genome-and-transcriptome-wideassociation studies (GTWAS), which integrate both genotypic and transcriptomic variation.
Keywords (deu)
AssoziationsstudienMachine LearningEpistasis
Keywords (eng)
Association studiesMachine learningEpistasis
Subject (deu)
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1403909
rdau:P60550 (deu)
viii, 61 Seiten : Illustrationen
Number of pages
69
Association (deu)
Members (1)
Title (eng)
Discovering nonlinear contributions from multi-omics to phenotypic variations
Parallel title (deu)
Identifizierung nicht-linearer Effekte von Multi-Omics auf phenotypische Variationen
Author
Michelle Binsfeld
Abstract (deu)
Das Ziel von Assoziationsstudien ist die Identifizierung von Polymorphismen, die im Zusammenhang mit einem komplexen Merkmal stehen. Die Standardmodelle hierfür sind lineare Modelle, die auf sogenannten “Single-Locus” Tests beruhen. Deswegen können Gene mit nicht-linearem Effekt, sowie Gene, die zwar mit anderen Genen interagieren, aber selbst keine marginale Effekte zeigen, nicht identifiziert werden. Die meisten komplexen Merkmale sind jedoch durch multiple Gene und ihre wechselwirkende Effekte bestimmt. Wir zeigen, dass ein nicht-lineares Modell, das auch Interaktionen und Heterogenität erfasst, mehr Gene identifizieren kann als das Standardmodell. Hierfür haben wir eine Pipeline entwickelt, die auf Random Forests beruht und die Anzahl der genetischen Marker (Prädiktorvariablen) in jedem Schritt reduziert. Dies ist eine vielversprechende Alternative zu den linearen Modellen in genomweiten (GWAS) und transkriptomweiten (TWAS) Assoziationsstudien. Weiterhin erlauben Random Forests es, eine neue Assoziationsstudie (GTWAS) zu betrachten, indem genetische und transkriptomische Variation in ein Modell integriert werden.
Abstract (eng)
The aim of association studies is to understand the genetic architecture of complex traits, which is a fundamental issue in genetics. The standard approaches are based on linear mixed models using single-locus tests. Therefore, they might miss nonlinear loci that are involved in interactions but do not show significant marginal effects. Many complex phenotypes however are determined by multiple loci and their interactive effects. We show that a model, which allows for nonlinear effects, epistatic interactions and heterogeneity, increases the association power. Due to the high-dimensionality of omics data, the search of epistatic interactions is challenging. We have developed a pipeline based on random forests that reduces the search space for significant associations and interactions in each step. It is a promising alternative to the traditional approaches in genome-wide (GWAS) and transcriptome-wide (TWAS) association studies and furthermore allows us to construct genome-and-transcriptome-wideassociation studies (GTWAS), which integrate both genotypic and transcriptomic variation.
Keywords (deu)
AssoziationsstudienMachine LearningEpistasis
Keywords (eng)
Association studiesMachine learningEpistasis
Subject (deu)
Type (deu)
Persistent identifier
https://phaidra.univie.ac.at/o:1417211
Number of pages
69
Association (deu)