Abstract (deu)
Fortschritte im Bereich der Massenspektrometrie ermöglichen die Analyse der Glykosylierung von Proteinen auf Glykopeptidebene. Ein Schwachpunkt ist aber weiterhin die
Datenverarbeitung. In dieser Arbeit wurde ein open source Programm für die automatische Identifikation von Glycopeptiden in groÿen LC-MS/MS Datensätzen entwickelt.
FindGlycoPeptides (FGP ), welches in Perl geschrieben wurde, identifiziert den Peptidteil anhand der Y-Ionen in CID-Spektren niedriger Massengenauigkeit. Die Zuord-
nungen werden mittels einer empirischen Bewertungsfunktion gewertet und die FalseDiscovery Rate wird über die Zuordnung von Decoypeptiden abgeschätzt. Weiters zählt
das Programm die jeder Spezies zugeordneten Spektren und liefert dadurch semiquantitative Informationen. Das Program läuft auf unterschiedlichen Betriebssystemen und
benutzt das offene Datenformat mzXML, womit Daten unterschiedlicher Gerätehersteller
analysiert werden können.
Als Testdatensätze wurden verschiedene Glykoproteine, mit dem Fokus auf bovinem saurem
α1-Glykoprotein (AGP), einzeln und in Mischungen sowie biologische Proben, die aus MCF-7 Zellüberständen gewonnen wurden, mit Trypsin verdaut und den Standardmethoden der Proteomik entsprechend Standardmethoden mit nano-RP-LC-Orbitrap-MS/MS gemessen. Bis zu 1500 Spektren konnten in einem AGP Datensatz zugewiesen
werden, die mehr als 100 unterschiedliche Glycopeptide abdeckten, welche durch manuelle Überprüfung bestätigt werden konnten. Die Ergebnisse wurden mit denen eines ähn-
lichen, frei zugänglichen, Programms, GlycoPeptideSearch, verglichen, wobei sich zeigte, dass FGP sowohl in Bezug auf die Anzahl der Identifikationen als auch der False Discov-
ery Rate deutlich leistungsfähiger war. Die Anzahl der jedem Glykopeptid zugeordneten Spektren wurde mit der maximalen Peakhöhe sowie dem Integral verglichen. Es zeigte
sich, dass die drei Methoden zu ähnlichen Ergebnissen führten, wobei das Zählen der Spektren keines zusätzlichen Aufwandes bedurfte.
Die Analyse von HPLC-MS/MS Datensätzen von Verdauen anderer einzelner Glykoproteine (humanes AGP, bovines Fetuin und Asialofetuin, Hasenimmunoglobulin G und Hühnerovalbumin) brachte weniger Zuordnungen, da die experimentelle Methodik nicht für Glykoproteomik optimiert wurde. Ähnlich viele Zuordnungen wurden bei der Analyse von Mischungen aus fünf Glykoproteinen gefunden. Allerdings liegen die Stärken von
FGP vor allem im Bereich der zielgerichteten Experimente (targeted glycoprotemics). Bei sehr komplexen Proben, wie Zellüberständen, die mit SDS-PAGE fraktioniert wurden, in denen 20 oder mehr mögliche Glykoproteine vorkommen, können keine brauchbaren Ergebnisse erzielt werden, da der Peptidsuchraum zu groß ist.
Bei solcherlei Proben müssten zusätzliche Informationen über die Peptidsequenzen herangezogen wer-
den, zum Beispiel durch ETD Spektren.