Abstract (deu)
Das Public-History-Projekt Alltag im Krieg veröffentlicht die Korrespondenz des Ehepaars Hilde und Roland Nordhoff, das zwischen 1938 und 1946 über 2.600 Briefe austauschte. Die erste Hälfte dieser Briefe wurde bereits im Rahmen des Projekts mit jeweils mehreren von insgesamt 81 thematischen Schlagwörtern annotiert. Ziel dieser Arbeit ist zuerst, auf Grundlage der bereits annotierten Briefe die zweite Hälfte der Korrespondenz automatisch zu verschlagworten. Dazu werden verschiedene Modelle zur Textklassifizierung trainiert und verglichen. Im zweiten Schritt untersucht die Arbeit die Anwendbarkeit der zugeordneten thematischen Schlagwörter für eine Distant-Reading-Methode. Im Mittelpunkt steht die Frage, wie gut Lesende den Inhalt der Briefe und ihren Kontext kennenlernen können, indem sie die Relevanz der einzelnen Schlagwörter in bestimmten Zeiträumen betrachten. Dafür werden Schlagwörter untersucht, die in bestimmten Perioden beispielsweise überdurchschnittlich häufig vertreten sind. Die Annahme ist, dass einige der von diesen Schlagwörtern erfassten Themen in diesen Zeiträumen in den Briefen vermehrt diskutiert wurden und auch über die persönliche Sphäre des Ehepaars hinaus politische und/oder soziale Relevanz hatten. Es wird zuerst ein explorativer Ansatz verfolgt, danach werden fünf Hypothesen über bestimmte thematische Schlagwörter und ihren erwarteten Verlauf untersucht. Die Untersuchung der Schlagwörter gibt einzelne Hinweise darauf, dass ihre Häufigkeiten in bestimmten Zeiträumen in Zusammenhang mit persönlichen, gesellschaftlichen und politischen Ereignissen stehen können. Leider sind jedoch weder die bereits existierenden Schlagwörter, die auch als Trainingsdaten für die Klassifizierung fungieren, mit Sicherheit korrekt, noch kann ein Modell mit dieser Daten-Ausgangslage die zweite Hälfte des Briefwechsels mit hoher Genauigkeit verschlagworten, was zu großen Unschärfen in den untersuchten Schlagwortfrequenzen führt.