Abstract (deu)
Die phylogenetische Rekonstruktion erfordert Annahmen über den evolutionären Prozess, den die beobachteten Sequenzen durchlaufen haben. Da ein falsches Modell eine korrekte Rekonstruktion verhindern kann, sind die Auswahl eines realistischen Modells und die Prüfung seiner Eignung wichtige Schritte. Im ersten Teil dieser Arbeit analysieren wir die übliche Annahme, dass alle Sequenzen entlang der Evolution möglich sind. Diese Annahme kann durch Restriktionsenzyme verletzt werden, die die DNA an bestimmten Erkennungsstellen schneiden. Dies motiviert unsere Beschreibung der Menge von Zeichenketten mit Tabus, d.h. mit verbotenen Teilketten. Wir beschreiben den Hamming-Graphen, dessen Knoten tabufreie Zeichenketten sind und dessen Kanten jede zwei Zeichenketten verbinden, die sich an einer einzigen Stelle unterscheiden. Jede Irrfahrt auf diesem Graphen räpresentiert die Entwicklung einer tabufreien Sequenz. Wir charakterisieren, wann der tabufreie Hamming-Graph und seine Suffix-Teilgraphen zusammenhängend sind. Unser Schluss ist, dass die Existenz von unverbundenen Evolutionspfaden in der Natur möglich, wenn auch unwahrscheinlich ist. Im zweiten Teil dieser Arbeit werden neue Maße der phylogenetische Informationen vorgeschlagen, um die Zuverlässigkeit eines bestimmten Evolutionsprozesses zu bewerten. Diese Maße sind die Kohärenz eines Astes, die die Abhängigkeit zwischen zwei benachbarten Gruppen quantifiziert, und das Gedächtnis einer Gruppe, das die Identifizierung des Elternknotens einer Gruppe quantifiziert. Wir zeigen die Beziehung zwischen diesen Maßen und der latenten Baumstruktur der Phylogenie. Dann wenden wir diese Maße an, um zwei phylogenetische Probleme zu beschreiben. Erstens verwenden wir die Kohärenz, um einen trennschärfen Test auf Sättigung entlang eines Astes einer Phylogenie zu konstruieren. Zweitens wird das Gedächtnis verwendet, um den Informationsfluss von Kindernknoten zu Elternknoten in einem d-Weg Baum während der Rekonstruktion der Stammidentität zu begrenzen.