2023_04_04_ChatGPT_Keuper-Glavas

Hybrid, Kaiserslautern, Fraunhofer ITWM, Machine und Deep Learning Seminar / 04. April 2023, 17:00 – 18:00 Uhr

ChatGPT: If Scale is the Answer, What is Left to be Asked?

Referent: Prof. Dr. Goran Glavaš (Universität Würzburg, Fakultät für Mathematik und Informatik, Zentrum für Künstliche Intelligenz und Datenwissenschaften (CAIDAS))

Abstract:

Große Sprachmodelle (Large Language Models, LLMs) wie Chat-GPT, GPT-4, Bard und PaLM haben in letzter Zeit ein fast schockierendes Maß an Sprachverständnis und Generierungsfähigkeiten bewiesen, indem sie eine Vielzahl komplexer Tests vom GRE und SAT bis zur Anwaltsprüfung bestanden haben.

Noch beeindruckender ist, dass die neuesten dieser Modelle gezeigt haben, dass sie komplexe Artefakte anderer Modalitäten, wie Bilder und Code, verstehen (und manipulieren können). Da es sich um urheberrechtlich geschützte Modelle handelt, werden zwar keine Einzelheiten über ihre neuronalen Architekturen und Trainingsziele bekannt gegeben, aber alles deutet darauf hin, dass die schiere Größe dieser Modelle (z. B. wird spekuliert, dass GPT-4 mehrere Billionen Parameter hat) und die Daten, auf denen sie trainiert wurden, der Schlüsselfaktor für ihre beispiellosen Fähigkeiten sind. Selbst in kontrollierten Experimenten mit kleineren Sprachmodellen hat sich gezeigt, dass bestimmte Fähigkeiten erst ab einer bestimmten Größenordnung auftauchen (daher die Bezeichnung »Emerging Abilities«).

In diesem Vortrag werde ich zunächst auf die (bekannten) technischen Details von LLMs und deren Trainingsverfahren eingehen. Im zweiten Teil werde ich mich auf entstehende Fähigkeiten (auf verschiedenen Skalen) sowie auf Fälle, in denen LLMs immer noch versagen. Schließlich werde ich mit einer Diskussion der Implikationen schließen, die die Beobachtung, dass »der Maßstab alles ist, was zählt«, für die zukünftige KI-Forschung und insbesondere die NLP-Forschung hat.

Veranstaltungsdetails

Programm

Prof. Dr. Goran Glavaš von der Uni Würzburg wird im Hörsaal einen Vortrag zum Thema »ChatGPT: If Scale is the Answer, What is Left to be Asked?« halten. Dieser ist öffentlich und online frei zugänglich, richtet sich aber vorwiegend an Wissenschaftlerinnen und Wissenschaftler.

Die Veranstaltung setzt den Startpunkt zur Neuauflage unserer Seminarreihe »Machine und Deep Learning«.

Anmeldung

Es ist keine Anmeldung nötig, wenn Sie digital teilnehmen möchten, Klicken Sie hier, um online via MSTeams dabei zu sein.

Wir freuen uns aber auch über den Live-Besuch bei uns im Hörsaal.

Veranstaltungsort

Online und Kaiserslautern
Hörsaal, Fraunhofer ITWM
Fraunhofer-Platz 1
67663 Kaiserslautern

Datum

04. April 2023, 17:00 – 18:00 Uhr

Diesen Termin als iCal herunterladen

Sprache

Englisch

Kurzbiographie des Referenten

Goran Glavaš ist ordentlicher Professor für Natürliche Sprachverarbeitung an der Universität Würzburg, Fakultät für Mathematik und Informatik und dem Zentrum für KI und Datenwissenschaften (CAIDAS). Er promovierte am Text Analysis and Knowledge Engineering Lab (TakeLab) an der Universität Zagreb. Seine Forschungsschwerpunkte liegen in den Bereichen Verarbeitung natürlicher Sprache (NLP) und Information Retrieval (IR), mit Schwerpunkt auf lexikalischer und rechnerischer Semantik, mehrsprachigem und sprachübergreifendem NLP und IR, Informationsextraktion und NLP-Anwendungen (für Sozial- und Geisteswissenschaften).

Seine Veröffentlichungen und andere Auftritte

Er ist (Mit-)Autor von über hundert Veröffentlichungen in den Bereichen NLP und IR und publiziert regelmäßig in führenden NLP- und IR-Fachzeitschriften (ACL, EMNLP, NAACL, EACL, SIGIR, ECIR). Er war Mitorganisator des TextGraphs-Workshops zu graphbasiertem NLP (2017 bis 2019) und des SustaiNLP 2020-Workshops zu einfachem und effizientem NLP (2020) und hielt Tutorien auf der ACL 2019, EMNLP 2019 und ACL 2022. Er war Chefredakteur der ACL Rolling Review (2021-2022) und ist regelmäßig als (Senior) Area Chair und Reviewer für hochkarätige NLP- und IR-Konferenzen und -Zeitschriften tätig. Er ist Mitglied der Association for Computational Linguistics und der German Society for Computational Linguistics (GSCL).

Videomitschnitt des englischen Vortrages

Über die Seminarreihe

Das Deep Learning Seminar wird von Mitarbeitenden unseres Schwerpunktes »Datenanalyse und Maschinelles Lernen« der Abteilung »High Performance Computing« organisiert. Damit sollen Interessierte Einblicke in dieses große Forschungsgebiet und ein tieferes Verständnis erhalten. Eigenladen sind alle, die mehr über Deep Learning, Machine Learning oder auch KI allgemein erfahren möchten – egal ob StudentInnen, DoktorandInnen, ProfessorInnen oder Software-EntwicklerInnen. Neben den Mitarbeitenden unserer Abteilung können auch interessierte Externe einen Vortrag in unserer Seminarreihe halten. Wir haben auch die Möglichkeit, externe Sprecherinnen und Sprecher einzuladen. Für Vorschläge, Anregungen oder Wünsche sind wir immer offen.

Die Veranstaltung findet üblicherweise (von Feiertagsverschiebungen und Sommerpause abgesehen) jeden zweiten Donnerstag statt. Das Thema eines Vortrags sollte entweder direkt aus den Bereichen Deep Learning, Machine Learning, Datenanalyse oder KI stammen oder für diese von Relevanz sein. Es ist dabei vollkommen offen gehalten, ob der Vortrag über ein Paper, ein eigenes Projekt oder ein interessantes Thema gehalten wird. Die Komplexität kann dabei von einem allgemeinen Übersichtsvortrag bis hin zu einem Spezialthema reichen.

Hybrider Vortrag