Machine Learning zur Aufdeckung von Misreporting
Performance und Interpretierbarkeit von Algorithmen basierter Identifizierung fehlerhafter Finanzberichterstattung
Fehlerhafte und insbesondere betrügerische Finanzberichterstattung ist ein vergleichsweise seltenes Phänomen, welches allerdings – wenn ein solcher Fall auftritt – mit erheblichen finanziellen Verlusten für Investoren, Haftungsrisiken für Abschlussprüfer und Reputationsschäden für zuständige Enforcement-Behörden einhergeht. Nicht selten bleiben Fehler über Jahre unentdeckt mit der Konsequenz, dass der Umfang der Schäden im Zeitverlauf immens zunehmen kann.
Vor allem während der vergangenen zwei Dekaden hat die Entwicklung von Modellen zur Identifizierung fehlerhafter Berichterstattung bedeutende Fortschritte gemacht und dabei ein breites Spektrum von Algorithmen sowie zunehmende Mengen an Daten und Datentypen einbezogen.
Trotz aller Fortschritte verbleiben zwei entscheidende Herausforderungen: Bestehende Modelle verfügen regelmäßig über hohe Anteile an False Positives, die gerade für Abschlussprüfer und Enforcement-Behörden mit einem hohen zusätzlichen Prüfungsaufwand einhergehen. Zum anderen bleiben zahlreiche Modelle schwierig zu interpretieren, da viele Blackbox-Modelle zwar relativ gute Vorhersagen (sensitivity) treffen, aber wenig Ansatzpunkte für weitergehende Untersuchungen bieten.
Daher werden im Rahmen des Projekts, Potentiale und Grenzen von Algorithmen basierten Modellen zur Identifizierung von Fehlern bzw. Betrug in der Finanzberichterstattung mit besonderem Fokus auf der möglichen Verbesserung der False Positive Rate und der Interpretierbarkeit der Ergebnisse untersucht.