Maschinelles Lernen zur Betrugserkennung:
Grundlagen, Anwendungsfälle und Leitlinien

Maschinelles Lernen zur Betrugserkennung: Grundlagen, Anwendungsfälle und Leitlinien

26. September 2023

Aleksandr Ahramowitsch

von Aleksandr Ahramowitsch,

Leiter des KI/ML-Kompetenzzentrums

Auf maschinellem Lernen basierende Betrugserkennungssysteme stützen sich auf ML-Algorithmen, die mit historischen Daten über frühere betrügerische oder legitime Aktivitäten trainiert werden können, um die charakteristischen Muster dieser Ereignisse selbstständig zu identifizieren und sie zu erkennen, sobald sie sich wiederholen.

Erfahren Sie mehr über die Art, die Vorteile und die Anwendungen dieser Technologie in gängigen Betrugsszenarien sowie über einige Richtlinien zur Optimierung ihrer Einführung. Und schließlich erfahren Sie, wie Experten für die Entwicklung von maschinellem Lernen Ihnen helfen können, Ihr Unternehmen und Ihre Kunden vor den sich ständig weiterentwickelnden Betrugsbedrohungen zu schützen.

ML-basierte vs. regelbasierte Betrugserkennung

ML-gestützte Anwendungen zur Erkennung von Anomalien unterscheiden sich von herkömmlicher Software in Bezug auf die Erkennungstechnik:

UserTransactionsML modelOngoing model fine-tuningPatterns anomaliesDetectionMachine LearningFraudsterFraudRulesHigher frequencyAddress mismatchOver limitDetectionRule Based

ML-basierte Betrugserkennung

  • ML-Lösungen identifizieren und verwenden selbständig komplexere und variablere Regeln als herkömmliche Systeme. Zu diesem Zweck verarbeiten ML-Algorithmen Daten über frühere Betrugsfälle, entdecken Muster und Beziehungen zwischen Datenpunkten und erstellen Modelle, die darauf trainiert sind, diese Muster zu erkennen, sobald sie in künftigen Datensätzen wiederkehren.
  • ML-Systeme können bevorstehende kriminelle Handlungen vorhersagen, indem sie Anomalien erkennen, d. h. subtile und unkonventionelle Verhaltensmuster, die Menschen wahrscheinlich übersehen würden, die aber dennoch von der Norm abweichen und Hinweise auf bevorstehenden Betrug sein könnten.
  • ML-gestützte Lösungen verbessern sich mit der Erfahrung und verfeinern ihre Modelle im Laufe der Zeit, wenn sie neue Daten verarbeiten, einschließlich nicht erfasster Datenpunkte. Wenn sie also auf neue Betrugsszenarien stoßen, passen sich auf maschinelles Lernen basierende Anomalie-erkennende Systeme schnell an solche Bedrohungen an und integrieren und aktualisieren die bestehenden Regeln automatisch ohne menschliches Eingreifen.
Beispiel
Das Betrugserkennungssystem einer E-Commerce-Plattform stößt auf eine verdächtige Kreditkartentransaktion, die nicht zu den Verhaltensmustern des Nutzers passt, und zwar auf der Grundlage mehrerer subtiler Parameter, z. B. der Produktseiten, die vor der Bestellung aufgerufen wurden.

Regelbasierte Betrugserkennung

  • Traditionelle regelbasierte Lösungen folgen einer "wenn/dann"-Logik und lösen eine Reaktion aus, wenn eine vordefinierte Bedingung verletzt wird.
  • Diese Tools müssen manuell instruiert werden, um Betrugsfälle zu erkennen, indem Bibliotheken mit Hunderten von Regeln zusammengestellt werden.
Beispiel
Das Betrugserkennungssystem einer Bank zeigt vermeintliche Kunden an, die ihre Kreditkarten an ungewöhnlichen Orten einsetzen oder ihre Zahlungsfrequenz erhöhen.

Lassen Sie sich von unseren Experten beraten, um maschinelles Lernen richtig zu implementieren

Kontakt aufnehmen

Technischer Überblick über ML für die Betrugserkennung

ML-Ansätze

Brauchen Maschinen zum Lernen das Eingreifen des Menschen, oder können sie die sie umgebende Realität einfach nur beobachten? Die wichtigsten Ansätze für das Training von Algorithmen des maschinellen Lernens sind überwachtes, unbeaufsichtigtes und verstärkendes Lernen, je nach dem Grad der menschlichen Beteiligung und Kontrolle über den ML-Trainingsprozess.

Überwachtes Lernen

ML-basierte Betrugserkennungssysteme werden mit großen Mengen an gekennzeichneten Daten trainiert, die zuvor mit bestimmten Kennzeichnungen versehen wurden, die die wichtigsten Merkmale der Daten beschreiben. Dabei kann es sich um Daten aus legitimen und betrügerischen Transaktionen handeln, die mit den Etiketten "Betrug" bzw. "Nicht-Betrug" beschrieben werden. Diese gekennzeichneten Datensätze, die eine recht zeitaufwändige manuelle Kennzeichnung erfordern, liefern dem System sowohl den Input (Transaktionsdaten) als auch den gewünschten Output (Gruppen von klassifizierten Beispielen), so dass die Algorithmen erkennen können, welche Muster und Beziehungen sie miteinander verbinden, und diese Erkenntnisse zur Klassifizierung künftiger Fälle anwenden können.

Unüberwachtes Lernen

Diese Algorithmen werden mit nicht gekennzeichneten Transaktionsdaten gespeist und müssen diese Transaktionen auf der Grundlage ihrer Ähnlichkeiten (gemeinsame Verhaltensmuster) und Unterschiede (typische bzw. ungewöhnliche Muster, die auf betrügerische Aktivitäten hindeuten können) selbstständig in verschiedene Cluster einteilen. Dieser Ansatz, der typischerweise mit Deep Learning in Verbindung gebracht wird, ist rechenintensiv, kann aber die einzige Wahl sein, wenn es um Betrugsversuche geht, die noch nie zuvor stattgefunden haben und daher nicht gekennzeichnet sind.

Verstärkendes Lernen

Dieser Versuch-und-Irrtum-Ansatz umfasst mehrere Trainingsiterationen, bei denen der Algorithmus eine Betrugserkennungsaufgabe mehrmals auf unterschiedliche Weise durchführt, bis er betrügerische und nicht betrügerische Versuche genau identifizieren kann. Da keine markierten Eingaben erforderlich sind, kann das Reinforcement Learning ohne vorherige Kenntnis des aktuellen Betrugsszenarios angewendet werden. Allerdings erfordert es eine erhebliche Rechenleistung.

Input Raw DataAlgorithmModel TrainingLabeled dataProcessingClassificationOutputSupervised learningInput Raw DataAlgorithmInterpretationUnannotated training data setUnknown outcomeProcessingClustersOutputUnsupervised learning

Scheme title: Supervised vs unsupervised learning

Data source: medium.com — An Executive’s View: Introduction to Machine Learning

Maschinelles Lernen vs. Deep Learning

Experten unterscheiden im Allgemeinen zwischen dem maschinellen Lernen als Ganzes und seinem fortgeschritteneren Zweig, dem so genannten Deep Learning.

Maschinelles Lernen

Eine Untergruppe der KI, die sich auf Systeme konzentriert, die lernen und sich durch Erfahrung verbessern können. Das Erkennen von Mustern und Anomalien ist eine ihrer häufigsten Aufgaben und eine wichtige Voraussetzung für die Betrugserkennung. "Traditionelle" ML-Lösungen können mit einer relativ kleinen Datenmenge trainiert werden und benötigen keine große Rechenleistung, zumindest im Vergleich zu Deep-Learning-basierter Software.

Tiefes Lernen

Eine Methode des maschinellen Lernens, die in der Regel mit komplexen Algorithmen verbunden ist, die als tiefe neuronale Netze bekannt sind. Solche Strukturen, die aus miteinander verbundenen Schichten künstlicher Neuronen bestehen, die das menschliche Gehirn imitieren, können Daten verarbeiten, die von einer Schicht zur nächsten fließen, und die subtilsten Muster und Merkmale erkennen, die in einer immensen Menge von Datenpunkten verborgen sind. Dieser besondere Prozess macht neuronale Netze sehr effektiv bei der Aufdeckung von Betrug, aber er erfordert auch eine enorme Rechenleistung und große Datensätze für das richtige Training.

ML-Algorithmen

Den besten Algorithmus oder die beste Gruppe von Algorithmen für die Analyse von betrugsrelevanten Daten zu finden, kann eine schwierige Aufgabe sein, da ihre Leistung vom jeweiligen Szenario abhängt, in dem wir arbeiten. Hier sind einige Optionen, die in Betracht kommen:

Logistische Regression

Ein überwachter Lernalgorithmus, der die Wahrscheinlichkeit eines Ereignisses aus zwei Alternativen, z. B. "Betrug" und "kein Betrug", auf der Grundlage einer Reihe von relevanten Parametern berechnet.

Entscheidungsbaum

Ein weiterer Algorithmus aus der Untergruppe des überwachten Lernens ist ein baumartiges Entscheidungsmodell, bei dem jede Verzweigung die Analyse einer bestimmten Metrik oder Bedingung (Ausgabenschwelle, Standort usw.) darstellt, um festzustellen, ob ein Vorgang betrügerisch ist.

Zufälliger Wald

Eine Kombination mehrerer Entscheidungsbäume, um die Menge der untersuchten Datentypen und Bedingungen zu erweitern und nicht-lineare Beziehungen zwischen mehreren Variablen zu ermitteln.

Support-Vektor-Maschine

Mehrere Systeme verlassen sich bei der Erkennung von Kreditkartenbetrug auf diesen Algorithmus des überwachten Lernens, da er trotz seines hohen Rechenaufwands auch bei großen Datensätzen hervorragende Ergebnisse liefert.

K-ächster Nachbar

Dieser Algorithmus des überwachten Lernens, der sich als recht genau, aber schwierig zu interpretieren erweist, wenn es darum geht, eine bestimmte Entscheidung zu treffen, kann die Art eines Ereignisses (ob es sich um Betrug oder Nicht-Betrug handelt) durch den Vergleich mit ähnlichen, in der Vergangenheit aufgezeichneten Ereignissen bestimmen.

Neuronale Netze

Komplexe, mehrschichtige Architekturen und überlegene Big-Data-Analysefähigkeiten machen neuronale Netze zu den bevorzugten Algorithmen, wenn es darum geht, nichtlineare Beziehungen zu erkennen und mit noch nie dagewesenen Betrugsszenarien durch überwachtes, unbeaufsichtigtes und verstärkendes Lernen umzugehen.

Maschinelles Lernen in den wichtigsten Betrugsszenarien

Maschinelles Lernen kann eingesetzt werden, um Betrüger und Cyberkriminelle in einer Vielzahl von Szenarien in Schach zu halten. Werfen wir einen Blick auf einige beliebte Anwendungsfälle dieser Technologie.

Machine learning in top fraud scenarios

Die Finanzinstitute haben das Synergiepotenzial zwischen Börse und maschinellem Lernen und die Vorteile von predictive-analytics im Finanzwesen erkannt, wenn man die hohen Summen bedenkt, um die es geht, und die Einhaltung der immer strengeren Vorschriften.

Maschinengesteuerte Systeme können dazu beitragen, Finanzbetrug wie Churning, Spoofing und Wash-Trading zu verhindern, indem sie Anomalien in den Aktivitäten von Aktienhändlern aufspüren und Transaktionen und Maklerdaten abgleichen, um Unstimmigkeiten in den bereitgestellten Informationen aufzudecken.

Die Anwendung des Maschinellen Lernens im Bankwesen hat sich als nützlich erwiesen, um anomale Transaktionen aufzuspüren, die auf kriminelle Aktivitäten hindeuten könnten, wie z. B. große Geldsummen, die zwischen einer Gruppe neu gegründeter, in Steuerparadiesen registrierter Unternehmen ausgetauscht werden.

Maschinenlernmodelle können mit Daten trainiert werden, die sich auf drei mögliche Szenarien beziehen: rechtmäßige Transaktionen, Geldüberweisungen, die von Bankwarnsystemen als verdächtig eingestuft werden, und potenzielle Geldwäschefälle, die den Behörden gemeldet werden. In jedem Fall analysieren die maschinellen Lernsysteme den Hintergrund des Absenders und des Empfängers oder ihre früheren Transaktionen. Auf diese Weise können sie dieselben Muster erkennen, wenn sie in zukünftigen Szenarien wiederkehren, und so zwischen legitimen Aktivitäten und kriminellen Handlungen unterscheiden.

Betrug im elektronischen Zahlungsverkehr ist ein weit verbreitetes Verbrechen, das viele Formen annimmt und fast alle Branchen umfasst, vom Bankwesen bis zum eCommerce. Maschinenlernende Systeme im Einzelhandel haben jedoch gute Chancen, diese Eskalation einzudämmen, indem sie abnormales Kontoverhalten erkennen, das ein Anzeichen für Betrug sein könnte. Einige der zu berücksichtigenden Faktoren sind eine zunehmende Transaktionshäufigkeit (insbesondere beim Kauf hochwertiger Waren), die Zahlung mit einer Karte deutlich vor dem Fälligkeitsdatum, die Verknüpfung mit verschiedenen risikoreichen Konten und das Hinzufügen mehrerer Zahlungsmethoden in kurzer Zeit.

Systeme zur Erkennung von Betrug im Zahlungsverkehr, die auf maschinellem Lernen basieren, können auch die Verhaltensprofile von Kartennutzern nach jeder Transaktion aktualisieren, wodurch künftige Vorhersagen präziser werden und falsch positive Ergebnisse vermieden werden.

Eine weitere Form der Kriminalität, die eng mit dem Zahlungskartenbetrug zusammenhängt und in vielen Szenarien, einschließlich betrügerischer Kreditanträge und Betrügereien im E-Commerce, bemerkenswert weit verbreitet ist, ist der Identitätsdiebstahl. Dabei nutzt ein Betrüger die persönlichen Daten einer anderen Person, einschließlich ihres Namens und ihrer Kreditkartennummer, ohne deren Zustimmung aus, um ein Verbrechen zu begehen. Um diese Art von Betrug zu bekämpfen, können wir einmal mehr auf die auf maschinelles Lernen gestützte Analyse der Nutzergewohnheiten und Transaktionsdaten zählen.

Außerdem können wir das maschinelle Lernen zur Analyse von Identitätsdokumenten nutzen oder zusätzliche Überprüfungsmechanismen wie Gesichtserkennung und Biometrie hinzufügen.

Lösungen für maschinelles Lernen können auch die Betrugserkennung im Versicherungssektor, insbesondere in der Krankenversicherung, verbessern. Algorithmen können falsche und doppelte Ansprüche erkennen und auf einen Kunden hinweisen, der eine falsche Diagnose oder überhöhte Kosten für die medizinische Versorgung gemeldet hat.

Eine der wertvollsten Maschinenlerntechniken im Gesundheitswesen ist die Verarbeitung natürlicher Sprache, die eine eingehende Analyse unstrukturierter Daten wie medizinischer Berichte gewährleistet. Diese Lösungen nutzen maschinelles Lernen, um von Ärzten, Versicherern oder Kunden verfasste Dokumente zu scannen und nach verdächtigen Ungereimtheiten zu suchen.

Behörden können maschinelles Lernen nutzen, um ungewöhnliche Muster zu erkennen und so die Einhaltung der Steuergesetze zu verbessern. Zum Beispiel kann ML das Hauptbuch auf anomale Einträge untersuchen, die Anzeichen für einen Betrugsversuch sein könnten.

Algorithmen können unter Berücksichtigung verschiedener Parameter eine Vielzahl von Hinweisen leichter und schneller erkennen als menschliche Prüfer. Dazu gehören monatliche Schwankungen der Bruttoumsätze von Unternehmen, Beziehungen zwischen verschiedenen Steuerzahlern, Unstimmigkeiten bei Einkäufen oder die Einzelabzüge in einer Einkommensgruppe.

Nutzen Sie diese ML-Vorteile mit der Beratung von Itransition

Lassen Sie uns reden

Beispiele aus der Praxis für ML zur Betrugserkennung

Capgemini berichtet, dass Kunden, die seine ML-fähige CPP Fraud Analytics Software zur Betrugserkennung und -prävention einsetzen, von einer Steigerung der Aufdeckungsrate zwischen 50 und 90 % und einer Verringerung der Untersuchungszeit für jeden Betrugsfall um bis zu 70 % profitieren. Die Lösung stützt sich auf eine Reihe von Technologien und Ansätzen, darunter sowohl regelbasierte Betrugserkennung als auch auf neuronale Netze gestützte Musteranalyse, um Aufgaben zu erfüllen, die von KYC-Operationen bis zur Bekämpfung von Geldwäsche und Kreditkartenbetrug reichen.
LendingBankingCardsOther relationshipsCustomer view internal dataUnstructured data – social media, call centers etc.Credit bureau, fraud vendors, watch lists, Mkt & reference dataCustomer view external dataInternetATMPOSPhone bankingOther channels/tradesCustomer view transaction dataBig dataArtificial neural networks/pattern recognitionAccount opening decisioningAdaptive analytics, rule based modelsCustomer level fraud manage-mentOffline entity link analysisBiometricsTransaction fraud monitoring3d secureCounterfeit measuresDevice trackingTokenizationFraud monitoring & detectionDecisionsAlert management