Abstract (deu)
Diese Arbeit zielt darauf ab, den Übergang von der manuellen zur automatischen Disambiguierung politischer Reformen im Datensatz des C3-Projekts zu erleichtern, der aus den Länderberichten der Economist Intelligence Unit besteht. Es handelt sich um eine Analyse der Wirtschaftsreformen in den EU-Mitgliedstaaten seit den 1980er Jahren. Der ursprüngliche C3-Datensatz enthielt nur einzelne Erwähnungen von politischen Reformen, was seine Verwendung in der automatisierten Datenanalyse einschränkte. Um diese Einschränkung zu beheben, war der erste wichtige Beitrag dieser Arbeit die manuelle Erweiterung des Datensatzes, um Mehrfachnennungen von politischen Reformen aufzunehmen. Ein Basismodell, das eine einfache Clustering-Technik verwendet, wurde als Referenzpunkt für die Bewertung eines fortschrittlicheren Disambiguierungssystems entwickelt, das auf einem pre-trained Modell basiert. Die Leistung des Systems wurde mit dem Link-Based Entity-Aware Scorer und dem Jaccard Ähnlichkeitsindex gemessen. Die Ergebnisse zeigten eine Verbesserung des F1-Scores von 0,395 in der Validierungsmenge auf 0,5507 in der Testmenge, wobei das Modell 76 von 138 vorhergesagten Clustern korrekt identifizierte. Diese Verbesserung war jedoch größtenteils auf die genaue Identifizierung von Singleton-Clustern zurückzuführen, während das Modell Schwierigkeiten hatte, mit Clustern mit mehreren Erwähnungen umzugehen. Ein Jaccard-Ähnlichkeitswert von 0,7346 deutet darauf hin, dass das Modell zwar einige thematische Überschneidungen erfasste, aber Schwierigkeiten mit differenzierteren Unterscheidungen hatte. Die Studie kommt zu dem Schluss, dass NLP-Techniken zwar effektiv politische Erwähnungen extrahieren können, die Effektivität des vortrainierten Modells ohne domänenspezifisches Training jedoch begrenzt war. Obwohl das Disambiguierungssystem eine Verbesserung gegenüber der Baseline mit allen Singletons zeigte, sind fortschrittlichere Clustering-Strategien erforderlich, um die Genauigkeit und die Wiedererkennung bei der Disambiguierung von politischen Reformen zu verbessern.