Title (eng)
Computational challenges in the assembly and analysis of non-model plant genomes and their microbiomes
Author
Călin Rareș Lucaciu
Advisor
Thomas Rattei
Assessor
Remy Bruggmann
Assessor
Manuel Spannagl
Abstract (deu)
Diese Arbeit untersucht die besonderen Herausforderungen bei der Erforschung pflanzlichen Erbmaterials, insbesondere bei Nicht-Modellpflanzen. Pflanzengenome zeichnen sich durch ihre außergewöhnliche Komplexität aus, darunter große Genomgrößen, variable Ploidie-Level, extensive Genparalogien und komplexe Wechselwirkungen mit Mikrobiomen sowohl ober- als auch unterhalb der Erde. Im Rahmen des FlowerPower-Marie-Curie-Projekts konzentriert sich diese Studie auf die genomischen Unterschiede zwischen roten und weißen Euphorbia pulcherrima. Zentrales Element dieser Forschung ist die Entwicklung einer de novo-Transkriptom-Assemblierung auf Basis von RNA-Seq-Daten, was eine umfassende Bewertung der verfügbaren pflanzengenomischen Ressourcen und ihrer Einschränkungen erfordert. Die Studie umfasst Projekte, die sich mit wesentlichen Aspekten der pflanzengenomischen Forschung befassen, darunter Transkriptom-Assemblierung, Analyse differenziell exprimierter Gene und Homologiebewertungen neuartiger Gene. Darüber hinaus wurde ein standardisierter Leitfaden für die Analyse von Pflanzen-Mikrobiom-Daten entwickelt, um konsistente und reproduzierbare Forschungsergebnisse in diesem Bereich zu fördern. Angesichts der engen Verbindung zwischen Pflanzen und ihren Mikrobiomen untersucht diese Arbeit auch die unbeabsichtigte Einbindung mikrobiellen Materials in Genom-Assemblierungen. Bestehende Methoden zur Qualitätskontrolle von Genomassemblierungen stoßen bei der Erkennung solcher Kontaminationen an ihre Grenzen. Um diesem Problem zu begegnen, schlagen wir eine schnelle Methode vor, um bakterielle Segmente basierend auf der ORF-Häufigkeit zu identifizieren. Dieser Ansatz verbessert nicht nur die Genauigkeit von Genomassemblierungen, sondern beleuchtet auch die komplexen Wechselwirkungen zwischen Pflanzengenomen und mikrobiellen Gemeinschaften. Diese Studie liefert wertvolle Werkzeuge und Erkenntnisse, adressiert zentrale Herausforderungen der pflanzengenomischen Forschung und bietet praktische Lösungen für die Untersuchung von Pflanzengenomen und ihren Mikrobiomen.
Abstract (eng)
This work examines the unique challenges of studying plant genetic material, particularly in non-model plants. Plant genomes are notably complex, characterized by large sizes, variable ploidy levels, extensive gene paralogy, and intricate interactions with both above - and below - ground microbiomes. As part of the FlowerPower Marie Curie project, this study focuses on the genomic differences between red and white Euphorbia pulcherrima species. Central to this research is the development of a de novo transcriptome assembly using RNA-seq data, necessitating a thorough evaluation of existing plant genomic resources and their limitations. The study encompasses projects addressing critical aspects of plant genomic research, including transcriptome assembly, differential gene expression analysis, and homology assessments of novel genes. Additionally, a standardized guide for analysing plant microbiome data was developed, promoting consistent and reproducible research in this area. Given the close association between plants and their microbiomes, this work also investigates the inadvertent inclusion of microbial material in genome assemblies. Current genome quality screening methods struggle to detect such contamination. To address this, we propose a rapid method for identifying bacterial segments based on ORF abundance. This approach not only enhances genome assembly accuracy but also sheds light on the complex interplay between plant genomes and their microbial communities. This study provides valuable tools and insights, addressing key challenges in plant genomic research and offering practical solutions for studying plant genomes and their microbiomes.
Keywords (deu)
PflanzenRNA-Seq-DatenGeneTranskriptomDifferenziell exprimierte Gene
Keywords (eng)
PlantsRNA-seq dataGeneTranscriptomeDifferentially Expressed GeneDEG
Subject (deu)
Type (deu)
Extent (deu)
vii, 140 Seiten
Number of pages
150
Study plan
Doctor of Philosophy-Doktoratsstudium Naturwissenschaften (Lebenswissenschaften): Biologie
[UA]
[794]
[685]
[437]
Members (1)
Title (eng)
Computational challenges in the assembly and analysis of non-model plant genomes and their microbiomes
Author
Călin Rareș Lucaciu
Abstract (deu)
Diese Arbeit untersucht die besonderen Herausforderungen bei der Erforschung pflanzlichen Erbmaterials, insbesondere bei Nicht-Modellpflanzen. Pflanzengenome zeichnen sich durch ihre außergewöhnliche Komplexität aus, darunter große Genomgrößen, variable Ploidie-Level, extensive Genparalogien und komplexe Wechselwirkungen mit Mikrobiomen sowohl ober- als auch unterhalb der Erde. Im Rahmen des FlowerPower-Marie-Curie-Projekts konzentriert sich diese Studie auf die genomischen Unterschiede zwischen roten und weißen Euphorbia pulcherrima. Zentrales Element dieser Forschung ist die Entwicklung einer de novo-Transkriptom-Assemblierung auf Basis von RNA-Seq-Daten, was eine umfassende Bewertung der verfügbaren pflanzengenomischen Ressourcen und ihrer Einschränkungen erfordert. Die Studie umfasst Projekte, die sich mit wesentlichen Aspekten der pflanzengenomischen Forschung befassen, darunter Transkriptom-Assemblierung, Analyse differenziell exprimierter Gene und Homologiebewertungen neuartiger Gene. Darüber hinaus wurde ein standardisierter Leitfaden für die Analyse von Pflanzen-Mikrobiom-Daten entwickelt, um konsistente und reproduzierbare Forschungsergebnisse in diesem Bereich zu fördern. Angesichts der engen Verbindung zwischen Pflanzen und ihren Mikrobiomen untersucht diese Arbeit auch die unbeabsichtigte Einbindung mikrobiellen Materials in Genom-Assemblierungen. Bestehende Methoden zur Qualitätskontrolle von Genomassemblierungen stoßen bei der Erkennung solcher Kontaminationen an ihre Grenzen. Um diesem Problem zu begegnen, schlagen wir eine schnelle Methode vor, um bakterielle Segmente basierend auf der ORF-Häufigkeit zu identifizieren. Dieser Ansatz verbessert nicht nur die Genauigkeit von Genomassemblierungen, sondern beleuchtet auch die komplexen Wechselwirkungen zwischen Pflanzengenomen und mikrobiellen Gemeinschaften. Diese Studie liefert wertvolle Werkzeuge und Erkenntnisse, adressiert zentrale Herausforderungen der pflanzengenomischen Forschung und bietet praktische Lösungen für die Untersuchung von Pflanzengenomen und ihren Mikrobiomen.
Abstract (eng)
This work examines the unique challenges of studying plant genetic material, particularly in non-model plants. Plant genomes are notably complex, characterized by large sizes, variable ploidy levels, extensive gene paralogy, and intricate interactions with both above - and below - ground microbiomes. As part of the FlowerPower Marie Curie project, this study focuses on the genomic differences between red and white Euphorbia pulcherrima species. Central to this research is the development of a de novo transcriptome assembly using RNA-seq data, necessitating a thorough evaluation of existing plant genomic resources and their limitations. The study encompasses projects addressing critical aspects of plant genomic research, including transcriptome assembly, differential gene expression analysis, and homology assessments of novel genes. Additionally, a standardized guide for analysing plant microbiome data was developed, promoting consistent and reproducible research in this area. Given the close association between plants and their microbiomes, this work also investigates the inadvertent inclusion of microbial material in genome assemblies. Current genome quality screening methods struggle to detect such contamination. To address this, we propose a rapid method for identifying bacterial segments based on ORF abundance. This approach not only enhances genome assembly accuracy but also sheds light on the complex interplay between plant genomes and their microbial communities. This study provides valuable tools and insights, addressing key challenges in plant genomic research and offering practical solutions for studying plant genomes and their microbiomes.
Keywords (deu)
PflanzenRNA-Seq-DatenGeneTranskriptomDifferenziell exprimierte Gene
Keywords (eng)
PlantsRNA-seq dataGeneTranscriptomeDifferentially Expressed GeneDEG
Subject (deu)
Type (deu)
Number of pages
150