Abstract (deu)
Das Ziel von Assoziationsstudien ist die Identifizierung von Polymorphismen, die im Zusammenhang mit einem komplexen Merkmal stehen. Die Standardmodelle hierfür sind lineare
Modelle, die auf sogenannten “Single-Locus” Tests beruhen. Deswegen können Gene mit
nicht-linearem Effekt, sowie Gene, die zwar mit anderen Genen interagieren, aber selbst
keine marginale Effekte zeigen, nicht identifiziert werden. Die meisten komplexen Merkmale
sind jedoch durch multiple Gene und ihre wechselwirkende Effekte bestimmt. Wir zeigen,
dass ein nicht-lineares Modell, das auch Interaktionen und Heterogenität erfasst, mehr Gene
identifizieren kann als das Standardmodell. Hierfür haben wir eine Pipeline entwickelt, die
auf Random Forests beruht und die Anzahl der genetischen Marker (Prädiktorvariablen) in
jedem Schritt reduziert. Dies ist eine vielversprechende Alternative zu den linearen Modellen
in genomweiten (GWAS) und transkriptomweiten (TWAS) Assoziationsstudien. Weiterhin
erlauben Random Forests es, eine neue Assoziationsstudie (GTWAS) zu betrachten, indem
genetische und transkriptomische Variation in ein Modell integriert werden.