Fraunhofer-Institut für Techno- und Wirtschaftsmathematik ITWM

Seminar

Deep Learning Seminar / 22. April 2021, 10:00 – 11:00 Uhr

Representation of Categorical Variables for Machine Learning Based Anomaly Detection Using Embeddings

Bachelorthesis; Referent: Malte Silbernagel (Fraunhofer ITWM, Abteilung Finanzmathematik)

Englisches Abstract:

Most of the machine learning algorithms are only capable of handling numerical data. Hence, categorical values must be encoded into numeric values that represent the initial data. In this thesis, a neural network is discussed, which learns a mapping of the categorical values onto a two-dimensional manifold, according to the neighborhood relationships between samples in the input space. As a byproduct of the learned mapping, a higher dimensional embedding of the values is produced. The performance of the embedding and the two-dimensional representation is then compared with the commonly used one-hot encoding.

This thesis proposes a neighborhood Probability Hamming whose embedding yields a more accurate classification between fraudulent and non-fraudulent data. Comparing the best scores of the different downstream classifiers, this method has increased the accuracy by 3.66 percentage points over the one-hot encoding.

Veranstaltungsdetails

Programm

Malte Silbernagel (Fraunhofer ITWM, Abteilung Finanzmathematik) berichtet unter der Überschrift »Representation of Categorical Variables for Machine Learning Based Anomaly Detection Using Embeddings« über seine Bachelorthesis.

Kontakt

Das Seminar wird über das Tool MS Teams veranstaltet. Dafür hier auf den Meeting-Link klicken. Um alle Funktionen nutzen zu können, empfiehlt es sich vorher die MS Teams App zu downloaden.

Bei Fragen zur Organisation, wenden Sie sich bitte an Dominik Straßel (siehe Kontakte).

Veranstaltungsort

Die Veranstaltung findet digital statt.

Datum

22. April 2021, 10:00 – 11:00 Uhr

Diesen Termin als iCal herunterladen

Sprache

Englisch

Über die Seminarreihe

Das Deep Learning Seminar wird von Mitarbeitenden unseres Schwerpunktes »Datenanalyse und Maschinelles Lernen« der Abteilung »High Performance Computing« organisiert. Damit sollen Interessierte Einblicke in dieses große Forschungsgebiet und ein tieferes Verständnis erhalten. Eigenladen sind alle, die mehr über Deep Learning, Machine Learning oder auch KI allgemein erfahren möchten – egal ob StudentInnen, DoktorandInnen, ProfessorInnen oder Software-EntwicklerInnen. Neben den Mitarbeitenden unserer Abteilung können auch interessierte Externe einen Vortrag in unserer Seminarreihe halten. Wir haben auch die Möglichkeit, externe Sprecherinnen und Sprecher einzuladen. Für Vorschläge, Anregungen oder Wünsche sind wir immer offen.

Die Veranstaltung findet üblicherweise (von Feiertagsverschiebungen und Sommerpause abgesehen) jeden Donnerstag statt. Das Thema eines Vortrags sollte entweder direkt aus den Bereichen Deep Learning, Machine Learning, Datenanalyse oder KI stammen oder für diese von Relevanz sein. Es ist dabei vollkommen offen gehalten, ob der Vortrag über ein Paper, ein eigenes Projekt oder ein interessantes Thema gehalten wird. Die Komplexität kann dabei von einem allgemeinen Übersichtsvortrag bis hin zu einem Spezialthema reichen.

Mehr zum Seminar und den weiteren Terminen