Abstract (deu)
In dieser Magisterarbeit wurden zwei Vorhersagemodell für Diabetiker zwischen 20 und 85 Jahren im Rahmen des Projektes SysKID entwickelt. Das erste schätzt die adäquate Vorsorge der Nierenfunktion („care model“), wobei das zweite den Abfall der Nierenfunktion („progression model“) prognostizieren soll. Dazu waren 700.000 Gesundheitsakten von sechzig österreichischen Hausärzten verfügbar. Nach einer zweckmäßigen Vorselektion von Prediktoren wurde eine Kombination der Methoden, dynamisches Modellieren, nicht-lineares Modellieren und LASSO-Regression zur Variablenselektion angewendet. Mittels c-index, einem Optimismus-korrigiertem c-index und einem Kalibrierungsplot wurde das Modell evaluiert. Für das care model betrug R² 0,336 und der Optimismus-korrigierte c-index war 0,827. Ähnliche Ergebnisse lieferte auch das progression model mit einem R² von 0,066 und einem Optimismus-korrigierten c-index von 0,825. Beide Modelle können auf Diabetiker zwischen 20 und 85 Jahren, welche mindestens ein Jahr beobachtet wurden, angewendet werden. In dieser Magisterarbeit wird somit demonstriert, wie innovative Ansätze statistischen Modellierens dabei helfen, wissenschaftlich plausible Schlussfolgerungen von relative unstrukturierten und teilweise unkodierten Routinepatientendaten zu erhalten.