Betrugs- und Auffälligkeitsdetektion

Im Bereich Steuerbetrug geht Schätzungen zufolge der jährliche Schaden in Deutschland in die Milliardenhöhe. Auch im Bereich Versicherungsbetrug sind die Schadenskosten immens.

Mathematisch-statistische Verfahren leisten einen wichtigen Beitrag, um betrügerische Aktivitäten aufzudecken, Verdachtsfälle zu erhärten und entsprechende Risiken aus Betrugsschäden zu quantifizieren. Ebenso lassen sich für eine forensische Verwertung zu vorgegebener statistischer Sicherheit Schadenmindesthöhen ausweisen. Mit Hilfe der Dunkelfeldforschung lässt sich zudem eine Bestimmung des Ausmaßes an Betrugsfällen vornehmen. Daraus lassen sich entsprechende Strategien zur Betrugsvermeidung ableiten.

Beispiele

In Abbildung 1 werden einige Fälle (Kunden, Abrechnungen, Wirtschaftssubjekte…) in einem zweidimensionalen Koordinatensystem dargestellt. Hierbei wird die kleinere, abgetrennte Punktewolke, welche die Betrugsfälle repräsentiert, bei separaten, variablenweisen Betrachtungen, nicht sichtbar – die beiden Projektionen auf die Achsen tragen typischerweise zur Identifikation verdächtiger Fälle nichts bei.

Abbildung 2: Klassische, nicht-robuste Clusteralgorithmen haben aber bekanntermaßen Probleme mit Ausreißern, d.h. der braune Ausreißer M in der linken oberen Ecke des rechten Bilds lässt die roten Punkte nicht mehr auffallen, denn der rot eingezeichnete Cluster separiert die rot eingezeichneten Fälle nicht von den Grünen. Verwendet man allerdings robuste Clusteralgorithmen, so ergibt sich als Cluster die grün eingezeichnete Ellipse, d.h. die roten Fälle werden von den grünen Fällen separiert.

Abbildung 1
© Foto ITWM

Abbildung 1

Abbildung 2
© Foto ITWM

Abbildung 2

Multivariate Analysemethoden

Mittels der am ITWM vorgenommenen Anpassungen und Weiterentwicklungen multivariater Verfahren als auch von Verfahren aus dem Bereich des maschinellen Lernens und des Data Mining lassen sich auffällige Fälle, wie in den drei Bildern unten dargestellt, ermitteln.

Ein häufig praktiziertes Schema beim Abrechnungsbetrug ist die mehrfache Geltendmachung einer einmalig erbrachten Leistung. Dann ist es sinnvoll, solche Rechnungen auszuweisen, die einen hohen Übereinstimmungsgrad hinsichtlich vorgegebener Kriterien ausweisen. Hierfür entwickeln wir geeignete Metriken.

Soll eine betrugsrisikoorientierte Fallauswahl erfolgen, gewährleistet der Einsatz moderner Scoring-Verfahren eine - angesichts knapper Prüfressourcen - effiziente Festlegung der Prüfreihenfolge. Dabei können beliebig viele sowohl quantitative als auch qualitative Kriterien berücksichtigt werden.

Durch die gezielte Verwendung robuster Verfahren treten Datenstruktur verschleiernde Effekte nicht auf (Abbildung 2). Durch den robusten Umgang mit Einzelfällen können insbesondere auch falsche Steuerungsimpulse bei der Betrugsprävention vermieden werden.

Multivariate Analysemethoden
© Foto ITWM
Multivariate Analysemethoden
© Foto ITWM
Multivariate Analysemethoden
© Foto ITWM

Kompetenzen

Viele der entwickelten Tools basieren auf der Statistiksoftware R, wobei der Umgang auch mit großen Datenbanken sichergestellt wird. Darüber hinaus erfolgt ein adäquater Umgang mit einem in der Praxis häufig vorliegenden heterogenen Datenmaterial.

Über eine rein risikobasierte Herangehensweise hinaus, bei der aufgrund vorgelagerter Auffälligkeitsdetektion verdächtige Fälle identifiziert werden, legen wir gemeinsam mit dem Kunden einen Ressourcenanteil fest, der rein zufallsbasiert Fälle auswertet. Auf diese Weise kann man an die unknown unknowns gelangen und die Detektionsmethode dynamisch weiterentwickeln. Diese Aufteilung kann datenadaptiv erfolgen. Dabei tritt die Bedeutung der absoluten Prognosen für die Schadenhöhe gegenüber der relativen Anordnung der Fälle gemäß Betrugsrisiko in den Hintergrund.

In jedem Fall wird das domänenspezifische Wissen unserer Kunden in unsere Analysen integriert und bildet, zusammen mit unserem finanzmathematischen Hintergrund, den Ausgangspunkt für unsere Ansätze.

Die Ergebnisdarstellung erfolgt stets kontextbezogen und in einer Form, die dem Kunden eine optimale Interpretation der Ergebnisse ermöglicht. Einen wichtigen Schwerpunkt bei der Ergebnisdarstellung bilden eine geeignete aussagekräftige Visualisierung sowie der interaktive Ausweis ähnlich gelagerter Fälle. In Zusammenarbeit mit unseren Kunden nehmen wir schließlich eine Validierung und Performancemessung von neu entwickelten Tools vor.