Autor: Axel Preis
Supervised Learning – die KI lernt mit Unterstützung eines Menschen
Unter »Supervised Learning« (Überwachtes Lernen im Deutschen) versteht die Fachwelt Verfahren, die anhand eines gelabelten Datensatzes lernen. Ein gelabelter Datensatz besteht aus Labels und Features. Bei Labels handelt es sich um die Ausprägungen einer Variablen, welches von primärem Interesse ist und beispielsweise vorhergesagt werden soll wie etwa Betrugsfälle in einem Buchungssystem. Features sind wiederum Variablen, die zur Erklärung der Variable, die von Interesse ist, genutzt werden. Supervised-Learning-Verfahren lernen aus den Daten den Zusammenhang zwischen Features und Labels. Oft werden Expert:innen zum Erstellen von Labels eingesetzt. Es kommt also erstmal menschliche Intelligenz ins Spiel, um das Lernen überhaupt zu ermöglichen. Diese Personen ordnen jedem Datenpunkt ein Label zu.
Das Bereitstellen der Daten ist damit häufig sehr aufwändig – gerade in Zeiten von Big Data, in denen Datensätze aus Millionen von Datenpunkten bestehen können. Wie wir sehen, benötigen Supervised-ML-Verfahren während des Lernprozesses Labels, die unter menschlicher Aufsicht generiert werden, weswegen man von überwachtem Lernen spricht.
Anwendungsbeispiel: Künstliche Intelligenz beim Detektieren von Betrugsfällen in Buchungssystemen
Ein Beispiel für den Einsatz von Supervised-Learning-Verfahren, womit wir vom EP-KI-Team uns häufig beschäftigen, ist das Auffinden von Betrugsfällen in einem Buchungssystem. Ein entsprechendes KI-System entscheidet auf Basis von Faktoren wie »Geldbetrag« oder »Buchungsdatum«, ob eine Buchung als auffällig angesehen wird oder nicht. Diese Faktoren bilden die Features eines möglichen ML-Modells. Für derartige Entscheidungen benötigt es Buchungsdaten zum Lernen, die bereits als »Betrug« oder »kein Betrug« gekennzeichnet wurden. Diese Kennzeichnungen stellen die Labels dar. Ein ML-Modell lernt so anhand der Features und Labels des Datensatzes, ob es sich bei neuen Buchungen um potenzielle Betrugsfälle handelt.