Abstract (deu)
RNA-Familien werden in den Computerwissenschaften durch RNA-Familien
Modelle, auch bekannt als Covarianz-Modelle repräsentiert. Covarianz-Modelle
bilden Struktur und Sequenz der Familie als statistisches Modell ab. Sie
machen es möglich weitere, zuvor unbekannte, Vertreter der RNA Familie in
genomischen Sequenzen zu identifizieren. Dieser Vorgang ermöglicht es bekanntes
Wissen und experimentelle Ergebnisse von einem auf den anderen Organismus zu
transferieren und vereinfacht das Design neuer Experimente.
In der Vergangenheit wurden RNA-Familien Modelle durch manuelles Sammeln und Verfeinern,
oder durch automatische Losungen für einige wenige
spezielle RNA Familien konstruiert. Die Publikation ”RNAlien - Unsupervised
RNA-family model construction” stellt eine neue Methode zum automatischen
Konstruieren solcher Modelle, prinzipiell für jede RNA Sequenz, vor. RNAlien,
ausgehend von einer einzelnen Eingabesequenz, sammelt potentielle Familien-
mitglieder durch multiple Iteration von Homologiesuche. RNA-Familien Modelle
werden automatisch für die gefundenen Sequenzen gebaut.
Die Qualitat von RNA-Familien Modellen und ihre Leistungsfähigkeit in der
Homologiesuche hängt von verschiedenen Faktoren ab. RNAlien wertet sowohl
die Modelle, als auch die alignierten Sequenzen die zum Bau der Modelle verwendet wurden,
aus um so viel Information wie möglich zur Verfügung zu
stellen. Dies berücksichtigt allerdings nur das neukonstruierte Modell und
setzt es nicht in Beziehung zu anderen Modellen.
Die folgende Publikation, mit dem Titel ”CMCompare webserver: comparing
RNA families via covariance models”, behandelt den Vergleich zwischen Modellen.
Dies erlaubt die Identifizierung von Modellen mit schlecher Spezifität
und die Untersuchung von Beziehungen zwischen Modellen. Visualisierung
dieser Zusammenhänge hilft bei der Identifizierung von Kandidaten für Clans,
Gruppen biologisch verknüpfter Familien.
Darüberhinaus wird ein Programmpacket, mit dem Namen TaxonomyTools,
vorgestellt, welches die Visualsierung und den Vergleich der Taxonomie von
gefundenen RNA Familien Mitgliedern ermöglicht.
Sequenzen von Familienmitglieder, die von RNAlien wahrend des Konstruktionsprozesses
identifiziert wurden, sind ein Ausgangspunkt für die weitere Untersuchung der Familie.
UCSC genome browser hubs visualisieren die gefundenen Familienmitglieder in ihrem
genomischen Kontext, was Eigenschaften wie zum Beispiel Orthologie sichtbar macht.
Methoden um solche Hubs zu bauen wurden als Beitrag mit der Publikation
”ViennaNGS: A toolbox for building efficient next-generation sequencing analysis pipelines”
veröffentlicht und werden hier präsentiert.