Maschinelles Lernen zur Betrugserkennung: Grundlagen, Anwendungsfälle und Leitlinien
26. September 2023
Maschinelles Lernen
- Dienstleistungen
- Anwendungsfälle nach Branche
- Anwendungsfälle
Leiter des KI/ML-Kompetenzzentrums
Erfahren Sie mehr über die Art, die Vorteile und die Anwendungen dieser Technologie in gängigen Betrugsszenarien sowie über einige Richtlinien zur Optimierung ihrer Einführung. Und schließlich erfahren Sie, wie Experten für die Entwicklung von maschinellem Lernen Ihnen helfen können, Ihr Unternehmen und Ihre Kunden vor den sich ständig weiterentwickelnden Betrugsbedrohungen zu schützen.
Maschinelles Lernen bei der Betrugserkennung: Trends und Statistiken
der Unternehmen hatten in den letzten 24 Monaten mit irgendeiner Form von Betrug zu tun
PwC
der Unternehmen setzen bereits KI und ML ein, um Betrug zu erkennen und zu verhindern
ACFE
der Unternehmen planen den Einsatz von KI und ML zur Betrugserkennung in den nächsten 2 Jahren
ACFE
ML-basierte vs. regelbasierte Betrugserkennung
ML-gestützte Anwendungen zur Erkennung von Anomalien unterscheiden sich von herkömmlicher Software in Bezug auf die Erkennungstechnik:
ML-basierte Betrugserkennung
- ML-Lösungen identifizieren und verwenden selbständig komplexere und variablere Regeln als herkömmliche Systeme. Zu diesem Zweck verarbeiten ML-Algorithmen Daten über frühere Betrugsfälle, entdecken Muster und Beziehungen zwischen Datenpunkten und erstellen Modelle, die darauf trainiert sind, diese Muster zu erkennen, sobald sie in künftigen Datensätzen wiederkehren.
- ML-Systeme können bevorstehende kriminelle Handlungen vorhersagen, indem sie Anomalien erkennen, d. h. subtile und unkonventionelle Verhaltensmuster, die Menschen wahrscheinlich übersehen würden, die aber dennoch von der Norm abweichen und Hinweise auf bevorstehenden Betrug sein könnten.
- ML-gestützte Lösungen verbessern sich mit der Erfahrung und verfeinern ihre Modelle im Laufe der Zeit, wenn sie neue Daten verarbeiten, einschließlich nicht erfasster Datenpunkte. Wenn sie also auf neue Betrugsszenarien stoßen, passen sich auf maschinelles Lernen basierende Anomalie-erkennende Systeme schnell an solche Bedrohungen an und integrieren und aktualisieren die bestehenden Regeln automatisch ohne menschliches Eingreifen.
Beispiel
Regelbasierte Betrugserkennung
- Traditionelle regelbasierte Lösungen folgen einer "wenn/dann"-Logik und lösen eine Reaktion aus, wenn eine vordefinierte Bedingung verletzt wird.
- Diese Tools müssen manuell instruiert werden, um Betrugsfälle zu erkennen, indem Bibliotheken mit Hunderten von Regeln zusammengestellt werden.
Beispiel
Lassen Sie sich von unseren Experten beraten, um maschinelles Lernen richtig zu implementieren
Technischer Überblick über ML für die Betrugserkennung
Überwachtes Lernen
ML-basierte Betrugserkennungssysteme werden mit großen Mengen an gekennzeichneten Daten trainiert, die zuvor mit bestimmten Kennzeichnungen versehen wurden, die die wichtigsten Merkmale der Daten beschreiben. Dabei kann es sich um Daten aus legitimen und betrügerischen Transaktionen handeln, die mit den Etiketten "Betrug" bzw. "Nicht-Betrug" beschrieben werden. Diese gekennzeichneten Datensätze, die eine recht zeitaufwändige manuelle Kennzeichnung erfordern, liefern dem System sowohl den Input (Transaktionsdaten) als auch den gewünschten Output (Gruppen von klassifizierten Beispielen), so dass die Algorithmen erkennen können, welche Muster und Beziehungen sie miteinander verbinden, und diese Erkenntnisse zur Klassifizierung künftiger Fälle anwenden können.
Unüberwachtes Lernen
Diese Algorithmen werden mit nicht gekennzeichneten Transaktionsdaten gespeist und müssen diese Transaktionen auf der Grundlage ihrer Ähnlichkeiten (gemeinsame Verhaltensmuster) und Unterschiede (typische bzw. ungewöhnliche Muster, die auf betrügerische Aktivitäten hindeuten können) selbstständig in verschiedene Cluster einteilen. Dieser Ansatz, der typischerweise mit Deep Learning in Verbindung gebracht wird, ist rechenintensiv, kann aber die einzige Wahl sein, wenn es um Betrugsversuche geht, die noch nie zuvor stattgefunden haben und daher nicht gekennzeichnet sind.
Verstärkendes Lernen
Dieser Versuch-und-Irrtum-Ansatz umfasst mehrere Trainingsiterationen, bei denen der Algorithmus eine Betrugserkennungsaufgabe mehrmals auf unterschiedliche Weise durchführt, bis er betrügerische und nicht betrügerische Versuche genau identifizieren kann. Da keine markierten Eingaben erforderlich sind, kann das Reinforcement Learning ohne vorherige Kenntnis des aktuellen Betrugsszenarios angewendet werden. Allerdings erfordert es eine erhebliche Rechenleistung.
Scheme title: Supervised vs unsupervised learning
Data source: medium.com — An Executive’s View: Introduction to Machine Learning
Maschinelles Lernen vs. Deep Learning
Maschinelles Lernen
Eine Untergruppe der KI, die sich auf Systeme konzentriert, die lernen und sich durch Erfahrung verbessern können. Das Erkennen von Mustern und Anomalien ist eine ihrer häufigsten Aufgaben und eine wichtige Voraussetzung für die Betrugserkennung. "Traditionelle" ML-Lösungen können mit einer relativ kleinen Datenmenge trainiert werden und benötigen keine große Rechenleistung, zumindest im Vergleich zu Deep-Learning-basierter Software.
Tiefes Lernen
Eine Methode des maschinellen Lernens, die in der Regel mit komplexen Algorithmen verbunden ist, die als tiefe neuronale Netze bekannt sind. Solche Strukturen, die aus miteinander verbundenen Schichten künstlicher Neuronen bestehen, die das menschliche Gehirn imitieren, können Daten verarbeiten, die von einer Schicht zur nächsten fließen, und die subtilsten Muster und Merkmale erkennen, die in einer immensen Menge von Datenpunkten verborgen sind. Dieser besondere Prozess macht neuronale Netze sehr effektiv bei der Aufdeckung von Betrug, aber er erfordert auch eine enorme Rechenleistung und große Datensätze für das richtige Training.
ML-Algorithmen
Logistische Regression
Ein überwachter Lernalgorithmus, der die Wahrscheinlichkeit eines Ereignisses aus zwei Alternativen, z. B. "Betrug" und "kein Betrug", auf der Grundlage einer Reihe von relevanten Parametern berechnet.
Entscheidungsbaum
Ein weiterer Algorithmus aus der Untergruppe des überwachten Lernens ist ein baumartiges Entscheidungsmodell, bei dem jede Verzweigung die Analyse einer bestimmten Metrik oder Bedingung (Ausgabenschwelle, Standort usw.) darstellt, um festzustellen, ob ein Vorgang betrügerisch ist.
Zufälliger Wald
Eine Kombination mehrerer Entscheidungsbäume, um die Menge der untersuchten Datentypen und Bedingungen zu erweitern und nicht-lineare Beziehungen zwischen mehreren Variablen zu ermitteln.
Support-Vektor-Maschine
Mehrere Systeme verlassen sich bei der Erkennung von Kreditkartenbetrug auf diesen Algorithmus des überwachten Lernens, da er trotz seines hohen Rechenaufwands auch bei großen Datensätzen hervorragende Ergebnisse liefert.
K-ächster Nachbar
Dieser Algorithmus des überwachten Lernens, der sich als recht genau, aber schwierig zu interpretieren erweist, wenn es darum geht, eine bestimmte Entscheidung zu treffen, kann die Art eines Ereignisses (ob es sich um Betrug oder Nicht-Betrug handelt) durch den Vergleich mit ähnlichen, in der Vergangenheit aufgezeichneten Ereignissen bestimmen.
Neuronale Netze
Komplexe, mehrschichtige Architekturen und überlegene Big-Data-Analysefähigkeiten machen neuronale Netze zu den bevorzugten Algorithmen, wenn es darum geht, nichtlineare Beziehungen zu erkennen und mit noch nie dagewesenen Betrugsszenarien durch überwachtes, unbeaufsichtigtes und verstärkendes Lernen umzugehen.
Maschinelles Lernen in den wichtigsten Betrugsszenarien
Maschinelles Lernen kann eingesetzt werden, um Betrüger und Cyberkriminelle in einer Vielzahl von Szenarien in Schach zu halten. Werfen wir einen Blick auf einige beliebte Anwendungsfälle dieser Technologie.
1 Marktmanipulation
Die Finanzinstitute haben das Synergiepotenzial zwischen Börse und maschinellem Lernen und die Vorteile von predictive-analytics im Finanzwesen erkannt, wenn man die hohen Summen bedenkt, um die es geht, und die Einhaltung der immer strengeren Vorschriften.
Maschinengesteuerte Systeme können dazu beitragen, Finanzbetrug wie Churning, Spoofing und Wash-Trading zu verhindern, indem sie Anomalien in den Aktivitäten von Aktienhändlern aufspüren und Transaktionen und Maklerdaten abgleichen, um Unstimmigkeiten in den bereitgestellten Informationen aufzudecken.
2 Geldwäscherei
Die Anwendung des Maschinellen Lernens im Bankwesen hat sich als nützlich erwiesen, um anomale Transaktionen aufzuspüren, die auf kriminelle Aktivitäten hindeuten könnten, wie z. B. große Geldsummen, die zwischen einer Gruppe neu gegründeter, in Steuerparadiesen registrierter Unternehmen ausgetauscht werden.
Maschinenlernmodelle können mit Daten trainiert werden, die sich auf drei mögliche Szenarien beziehen: rechtmäßige Transaktionen, Geldüberweisungen, die von Bankwarnsystemen als verdächtig eingestuft werden, und potenzielle Geldwäschefälle, die den Behörden gemeldet werden. In jedem Fall analysieren die maschinellen Lernsysteme den Hintergrund des Absenders und des Empfängers oder ihre früheren Transaktionen. Auf diese Weise können sie dieselben Muster erkennen, wenn sie in zukünftigen Szenarien wiederkehren, und so zwischen legitimen Aktivitäten und kriminellen Handlungen unterscheiden.
3 Kreditkartenbetrug
Betrug im elektronischen Zahlungsverkehr ist ein weit verbreitetes Verbrechen, das viele Formen annimmt und fast alle Branchen umfasst, vom Bankwesen bis zum eCommerce. Maschinenlernende Systeme im Einzelhandel haben jedoch gute Chancen, diese Eskalation einzudämmen, indem sie abnormales Kontoverhalten erkennen, das ein Anzeichen für Betrug sein könnte. Einige der zu berücksichtigenden Faktoren sind eine zunehmende Transaktionshäufigkeit (insbesondere beim Kauf hochwertiger Waren), die Zahlung mit einer Karte deutlich vor dem Fälligkeitsdatum, die Verknüpfung mit verschiedenen risikoreichen Konten und das Hinzufügen mehrerer Zahlungsmethoden in kurzer Zeit.
Systeme zur Erkennung von Betrug im Zahlungsverkehr, die auf maschinellem Lernen basieren, können auch die Verhaltensprofile von Kartennutzern nach jeder Transaktion aktualisieren, wodurch künftige Vorhersagen präziser werden und falsch positive Ergebnisse vermieden werden.
4 Identitätsdiebstahl
Eine weitere Form der Kriminalität, die eng mit dem Zahlungskartenbetrug zusammenhängt und in vielen Szenarien, einschließlich betrügerischer Kreditanträge und Betrügereien im E-Commerce, bemerkenswert weit verbreitet ist, ist der Identitätsdiebstahl. Dabei nutzt ein Betrüger die persönlichen Daten einer anderen Person, einschließlich ihres Namens und ihrer Kreditkartennummer, ohne deren Zustimmung aus, um ein Verbrechen zu begehen. Um diese Art von Betrug zu bekämpfen, können wir einmal mehr auf die auf maschinelles Lernen gestützte Analyse der Nutzergewohnheiten und Transaktionsdaten zählen.
Außerdem können wir das maschinelle Lernen zur Analyse von Identitätsdokumenten nutzen oder zusätzliche Überprüfungsmechanismen wie Gesichtserkennung und Biometrie hinzufügen.
5 Betrügerische Versicherungsansprüche
Lösungen für maschinelles Lernen können auch die Betrugserkennung im Versicherungssektor, insbesondere in der Krankenversicherung, verbessern. Algorithmen können falsche und doppelte Ansprüche erkennen und auf einen Kunden hinweisen, der eine falsche Diagnose oder überhöhte Kosten für die medizinische Versorgung gemeldet hat.
Eine der wertvollsten Maschinenlerntechniken im Gesundheitswesen ist die Verarbeitung natürlicher Sprache, die eine eingehende Analyse unstrukturierter Daten wie medizinischer Berichte gewährleistet. Diese Lösungen nutzen maschinelles Lernen, um von Ärzten, Versicherern oder Kunden verfasste Dokumente zu scannen und nach verdächtigen Ungereimtheiten zu suchen.
6 Steuerbetrug
Behörden können maschinelles Lernen nutzen, um ungewöhnliche Muster zu erkennen und so die Einhaltung der Steuergesetze zu verbessern. Zum Beispiel kann ML das Hauptbuch auf anomale Einträge untersuchen, die Anzeichen für einen Betrugsversuch sein könnten.
Algorithmen können unter Berücksichtigung verschiedener Parameter eine Vielzahl von Hinweisen leichter und schneller erkennen als menschliche Prüfer. Dazu gehören monatliche Schwankungen der Bruttoumsätze von Unternehmen, Beziehungen zwischen verschiedenen Steuerzahlern, Unstimmigkeiten bei Einkäufen oder die Einzelabzüge in einer Einkommensgruppe.