Abstract (deu)
Einzelnukleotid-Polymorphismen (SNPs) sind genetische Variationen, die auftreten, wenn sich ein einzelnes Nukleotid an einer bestimmten Position in der DNA-Sequenz bei mehr als 1 % der Individuen unterscheidet. SNPs spielen eine entscheidende Rolle bei der Krankheitsanfälligkeit und der evolutionären Anpassung, und das Verständnis der Verteilung von SNPs in verschiedenen Genregionen ist für die Entschlüsselung der genetischen Grundlagen dieser Phänomene unerlässlich. In dieser Masterarbeit präsentiere ich die Erstellung neuartiger SNP-Zählungsdatenbanken für die 5'-untranslatierte Region (5'UTR), die kodierende Sequenz (CDS) und die 3'-untranslatierte Region (3'UTR) mit dem Ziel, die SNP-Verteilungsmuster und ihre potenziellen Auswirkungen zu ergründen. Mit Hilfe öffentlich zugänglicher Genomdaten wie dem 1000 Genomes Project habe ich eine umfassende Analyse der SNP-Anzahl in den verschiedenen Genregionen durchgeführt und dabei bemerkenswerte Unterschiede und Trends aufgedeckt. Während der CDS im Vergleich zum 5'UTR und 3'UTR eine signifikant höhere SNP-Anzahl aufwies, wurden Normalisierungstechniken eingesetzt, um Verzerrungen abzuschwächen und vergleichende Analysen zu erleichtern. Trotz der Herausforderungen, die sich durch Normalisierungsfehler und atypische Annotationen ergeben, dient unsere Datenbank als grundlegende Ressource für vergleichende SNP-Analysen innerhalb von Transkripten und Gentypen. Die vergleichende Analyse von Housekeeping-, Zytokin- und Chemokin-Genen ergab unterschiedliche SNP-Muster, die ihre Rolle bei Immunreaktionen und Entzündungen widerspiegeln. Diese Datenbank wird dazu beitragen, die Auswirkungen genetischer Variationen auf die Genfunktion und den Phänotyp zu vertiefen, und bietet eine grundlegende Plattform für die Erforschung der SNP-Verteilungen und ihrer Korrelationen mit genetischen Elementen, wodurch unser Verständnis der genetischen Vielfalt und ihrer Auswirkungen auf die menschliche Gesundheit und Evolution verbessert wird.