Novatec Fraud Detective: Intelligente Betrugserkennung für KFZ-Versicherer mithilfe von KI

Die durch künstliche Intelligenz unterstützte Betrugserkennung bietet neue Möglichkeiten betrügerische Muster in Versicherungsmeldungen zu entdecken und gleichzeitig den Versicherer zu entlasten. Wie bereits in unserem Blog-Post „Welchen Kunden können Sie vertrauen? – Betrugserkennung für Versicherer mit KI“ beschrieben, stellt die händische Identifikation von Betrugsfällen nicht nur einen immensen Arbeitsaufwand dar, sondern erfordert gleichzeitig erfahrene Schadensbearbeiter, um auffällige Meldungen zu klassifizieren.
Laut einer Studie der Universität St. Gallen und BearingPoint, handelt es sich bei bis zu einem Viertel der Schadenmeldungen im europäischen Raum um Versicherungsbetrug. Nur ein Bruchteil davon wird aber von den Versicherern als solcher enttarnt. Der daraus resultierende Schaden für Versicherer übersteigt damit mehrere Milliarden Euro jährlich.
Gerade KFZ-Versicherungen werden hier von vielen Betrügern als einfaches Ziel wahrgenommen. Deshalb präsentieren wir mit dem Novatec Fraud Detective eine Demo-Lösung, die Betrugsmuster im KFZ-Versicherungsumfeld automatisiert aufdeckt und Versicherer beim Erkennen von Betrugsfällen nachhaltig unterstützen kann.
Datenbasis
Bevor wir mit der Beschreibung der Funktionsweise Systems beginnen können, muss – wie meistens im KI-Umfeld – zunächst die zu verarbeitende Datenbasis beschrieben werden. Die von uns verwendete Datenbasis besteht aus strukturierten Daten auf der einen Seite und unstrukturierten Bilddaten auf der anderen.
Die strukturierten Daten, folgend Metadaten genannt, sind tabellarische Informationen über den Versicherten, wie aber auch über den Schadensfall selbst. In den Metadaten beinhaltete Attribute zum Versicherten sind beispielsweise Name, Alter, Beschäftigung und bisherige Versicherungsdauer, wie auch die Höhe des Beitrags. Attribute zum Schadensfall sind beispielsweise Fahrzeughersteller und Modell, Fahrgestellnummer (VIN), Ort und Datum des Schadens und im Schaden verwickelte Kennzeichen. Die unstrukturierten Daten bestehen aus Bildern des eingereichten Schadens. Weitere Datenquellen, wie durch intelligente Dokumentenanalyse extrahierte Formulardaten und Textdaten oder aber GPS-Daten sind ebenfalls denkbar und je nach konkretem Anwendungsfall nötig.
Betrugsfälle auf einen Blick: Das Detection Dashboard
Unsere Applikation verwendet ein browserunabhängiges Web-Dashboard, um die erkannten Betrugsfälle darzustellen. In diesem Falle besteht das Dashboard aus drei Unterseiten. Auf der ersten Seite kann der Fraud Detective und seine entsprechenden Komponenten konfiguriert werden. Je nach ausgewählter Konfiguration, ändert sich auch die Erkennungsgenauigkeit des Systems. Diese Konfigurationsmöglichkeit setzen wir ein, um den Einfluss und den Mehrwert verschiedener Datenquellen auf die Vorhersagequalität zu demonstrieren.
Auf der nächsten Seite finden wir eine Auswahl von Versicherungsfällen, die anhand ihrer möglichen Betrugsart gefiltert werden können. In einem realen Einsatzszenario würden diese Fälle durch eine Anbindung ans Versicherungssystem eingespeist werden. In unserem Beispiel handelt es sich um Demo-Daten, welche fest in der Applikation gespeichert sind.
Wird nun ein Versicherungsfall ausgewählt, wird dieser an die darunterliegende Detection API übergeben und die Softwarekomponenten führen ihre Erkennungen durch. Sobald die Erkennung abgeschlossen ist, wird der Benutzer auf die Detail-Seite weitergeleitet. Auf dieser Seite des Dashboards wird nun direkt im oberen Bereich die Betrugswahrscheinlichkeit dargestellt. Rechts daneben befindet sich eine Zusammenfassung der Schadensmeldung. Darunter wird auf der linken Seite ein Flussgraph dargestellt, aus dem die Ergebnisse der einzelnen Erkennungskomponenten entnommen werden können. Rechts daneben befindet sich eine Tabelle, die ebenfalls die Erkennungsergebnisse enthält. Je nach Ergebnis, sind die Komponenten im Graph und der Tabelle entweder Grün oder Rot dargestellt. Sollten die Komponenten durch die Konfiguration deaktiviert worden sein, werden diese mit einem Grauschleier angezeigt. So kann man sofort einsehen, welche Komponenten einen Betrugsfall vermuten und die Klassifikation des Fraud Detective wird direkt erklärbar.
Das folgende Video zeigt eine kurze Demonstration des gerade genannten Erkennungsablaufs im Fraud Detective.
Systemarchitektur
Wie bereits im obigen Abschnitt beschrieben, kann der Benutzer mit dem System über das Detection Dashboard interagieren. Das Dashboard selbst kommuniziert via REST mit der Kernkomponente des Novatec Fraud Detective: Der Detection API. Diese Schnittstelle nimmt Schadensmeldungen entgegen und liefert eine Betrugswahrscheinlichkeit für jede der Meldungen zurück. Die eigentliche Mustererkennung erfolgt hierbei durch einzelne voneinander unabhängige Softwarekomponenten, welche verschiedene Aufgaben erledigen und je nach Beschaffenheit der Schadensdaten und Datenquellen dynamisch konfiguriert werden können. Im Gegensatz zur Umsetzung der Erkennung durch eine monolithische Softwarekomponente, befähigt dies zur horizontalen Skalierung je nach Anfragelast.
Die folgende Abbildung zeigt die Architektur des Gesamtsystems und dessen Bestandteile im Detail.

Abbildung 1: Systemarchitektur des Fraud Detective
Die dargestellte Architektur bietet mehrere Vorteile: Zum einen können Dashboard und Detection API auf unabhängigen Systemen ausgeführt werden. Zum anderen kann das Dashboard verändert werden, ohne die Kernfunktionalität des Erkennungssystems zu beeinflussen. Außerdem ist die Einbindung der Detection API in bestehende Oberflächen oder Systeme zur intelligenten Prozessautomatisierung problemlos möglich.
Nun mehr zum Herzstück des Fraud Detective: Der Detection API und den darin enthaltenen Betrugserkennungskomponenten.
Das Herzstück des Fraud Detective: Softwarekomponenten zur Betrugserkennung
Wie bereits im Abschnitt Datenbasis eingeleitet, kann im Fraud Detective zwischen Komponenten zur Verarbeitung von strukturierten und unstrukturierten Daten unterschieden werden. Im Anschluss an diese Komponenten folgt ein Modell zur zentralen Bündelung der Erkennungsergebnisse. In der untenstehenden Abbildung und den folgenden Abschnitten werden diese Komponenten und deren Arbeitsweise näher beschrieben.

Abbildung 2: Softwarekomponenten zur Betrugserkennung
Komponenten zur Verarbeitung strukturierter Daten
Die Komponente Metadata Check (vgl. C1) ist durch ein Machine Learning Modell realisiert, welches die reinen Metadaten anhand ihrer Betrugswahrscheinlichkeit klassifiziert. Das Modell erlernt seine Betrugserkennungsfähigkeit anhand von Daten, die in der Vergangenheit bereits von Experten annotiert wurden und kann dieses Wissen anschließend auch auf unbekannte Daten anwenden.
Die VIN Decoding Komponente (vgl. C2) entschlüsselt die vom Versicherungsnehmer angegebene Fahrgestellnummer und prüft diese gegen die Metadaten auf Plausibilität. Der Einsatz dieser Komponente wäre auch vor Eintritt einer Schadensmeldung denkbar, um direkt beim Versicherungsabschluss Unregelmäßigkeiten zu erkennen und mögliche Betrugsfälle nachhaltig zu verhindern.
Komponenten zur Verarbeitung von unstrukturierten Bilddaten
Auf der anderen Seite stehen die bildverarbeitenden Komponenten. Die Numberplate Recognition (vgl. C3) nutzt Deep Learning, um Kennzeichen zu lokalisieren und deren Zeichen aus den Schadensbildern zu extrahieren. Diese extrahierten Kennzeichen werden nun mit den in den Metadaten vermerkten Kennzeichen abgeglichen. Sollten hierbei Unstimmigkeiten auftreten, wird dies von der Komponente vermerkt.
Ähnlich funktioniert die Vehicle Recognition (vgl. C4), diese nutzt ebenfalls tiefes Lernen zur Klassifikation der in den Bilddaten befindlichen Fahrzeuge. Die Klassifikationsergebnisse werden anschließend mit den Metadaten verglichen und bei Nichtübereinstimmung als solche notiert. Die von den eben genannten Komponenten verwendeten neuronalen Netzwerke wurden einerseits mit öffentlichen, aber auch mit eigens von Novatec gesammelten Datensätzen trainiert.

Abbildung 3: Inkonsistenz zwischen Metadaten und Bilddaten
Häufig werden bei Betrugsfällen auch Bilder aus Suchmaschinen verwendet, um gefälschte Schadensmeldungen darzustellen. Um ein solches Vorgehen erheblich zu erschweren, setzen wir eine Web Image Search Komponente (vgl. C5) ein. Diese Komponente durchsucht das Internet nach ähnlichen Bildern (reverse image search) und liefert einen Ähnlichkeitswert für die gefundenen Ergebnisse zurück. Gleichartig funktioniert die Car Marketplace Search (vgl. C6), welche sich auf bekannte Online-Portale zum Verkauf von Gebrauchtfahrzeugen konzentriert und überprüft, ob das gemeldete Fahrzeug dort zum Verkauf angeboten wird.
Bündelung der Erkennungsergebnisse: Der Fraud Detector
Damit die vorher genannten Ausgaben zu einem finalen Ergebnis gebündelt werden können, kommt ebenfalls ein Machine Learning Modell zum Einsatz: Der Fraud Detector (vgl. C7). Die Gewichtungen des Modells wurden, wie auch beim Metadata Check, mithilfe von Experten erstellten Annotationen erlernt. Eine benutzerdefinierte Gewichtung der Komponenten, beispielsweise durch eine Kostenmatrix ist aber ebenfalls denkbar.
Die Ausgabe des Fraud Detectors erfolgt nun in Form einer Prozentzahl, welche die Betrugswahrscheinlich angibt. Je nach voreingestelltem Schwellenwert, sagt diese Zahl aus, mit welcher Sicherheit es sich um einen potenziellen Betrugsfall handelt oder nicht.
Fazit
Mit dem Novatec Fraud Detective präsentieren wir eine Applikation zur aktiven Unterstützung der Betrugserkennung im KFZ-Versicherungsumfeld. Auch wenn es sich bei diesem System nur um eine Demonstration handelt, ist dieses Vorgehen auch auf reale Anwendungsszenarien anwendbar. Die Möglichkeiten zur Betrugserkennung sind stark von der eingesetzten Datenbasis abhängig und müssen je nach Umgebung evaluiert werden. Gerade die Verarbeitung von Formulardaten und Textdaten durch Technologien des Information Retrieval können nochmals einen zusätzlichen Mehrwert für das Erkennungssystem liefern.
Sollten wir mit diesem Artikel Ihr Interesse geweckt haben, schauen Sie gerne auf unserer Website zum Thema intelligente Betrugserkennung vorbei und zögern Sie nicht uns zu kontaktieren. Wir freuen uns!
Aktuelle Beiträge






Artikel kommentieren