Abstract (deu)
Im Rahmen dieser Masterarbeit wurde die Anwendbarkeit des Terminologie-extraktionswerkzeuges ProTerm der Firma ProCom Strasser für die zweisprachige Terminologieextraktion untersucht. Der für die Terminologieextraktion notwendige Korpus wurde von der AVL LIST GmbH zur Verfügung gestellt. Dabei handelte es sich ausschließlich um Fachtexte der technischen Dokumentation. Die Aufgabenstellung bestand darin, englische und deutsche Termpaare und adäquate Datenelemente für die Datenkategorien (Definition, Explikation, Kollokation, Kontext) aus dem Dokumentationsmaterial zu extrahieren. Das Terminologieextraktionsverfahren kann als toolgestützt bezeichnet und dem hybriden Extraktionsverfahren zugeordnet werden. Es wurden das statistische und das manuelle Extraktionsverfahren kombiniert. Das Berücksichtigen von Stopp-Wort-Listen der Allgemeinsprache und von Stopp-Wort-Listen, die eigens für diese Arbeit erstellt und bearbeitet wurden, sowie das Koordinieren der individuell kombinierbaren statistischen Parameter trugen dazu bei, Termkandidaten rasch zu identifizieren. ProTerm bietet die Möglichkeit, eine breite Palette an Formaten und unterschiedlichen Zeichensätzen einzulesen, es kann einen großen Umfang an Dokumenten in kurzer Zeit einlesen und ermöglicht es dem Terminologen, während jeder Phase des Extraktionsprozesses in die Originaltextansicht zu wechseln. Jeder Termkandidat und jede Datenkategorie, die der TermBank hinzugefügt werden, werden automatisch mit der dazugehörigen Quelle extrahiert. Mithilfe der Trunkierungsfunktion kann einheitlich Terminologie extrahiert werden. Das Auffinden der zielsprachlichen Äquivalente obliegt allerdings der Kompetenz des Terminologen. Er ist nicht nur dafür verantwortlich, einen Termkandidaten mithilfe der Parametereinstellungen und der Verwaltung der Stopp-Wort-Listen zu identifizieren, sondern muss sein zielsprachliches Äquivalent in den Originaltexten ausfindig machen. Die Erkenntnisse dieser Masterarbeit sollen dazu dienen, die zweisprachige Terminologieextraktion mit ProTerm weiterzuentwickeln.