Video-und Szenenanalyse

Unter »Video- und Szenenanalyse« versteht man die semantische Analyse von Bilddaten, oft aufgenommen im Außenbereich. Ein einfaches Beispiel dafür ist die Verkehrszeichenerkennung. Oft handelt es sich aber sogar um Aufnahmen aus unterschiedlichen Quellen.

In einem der größten Projekte der Abteilung Bildverarbeitung ging es um die automatische Erkennung von Gegenständen, die mit verschiedenen Mobiltelefonen fotografiert wurden. Zum Zwecke der weitgehend parameterfreien Erkennung von verschiedenen Objekten werden sowohl aktuelle Forschungsalgorithmen praxistauglich adaptiert als auch neue Algorithmen entwickelt.

Maschinelles Lernen ist in der Abteilung seit Jahren fester Bestandteil vieler Projekte und Forschungstätigkeiten. Im Bereich Oberflächeninspektion sind zudem zunehmend Hybride aus den »klassischen« parametrisierbaren Verfahren (Filter, Morphologie, Kantendetektoren) und Lernansätzen im Einsatz.

Lernverfahren, wie etwa die des sogenannten »deep learning« erfordern eine hohe Anzahl von annotierten Daten, die in einem Industrieprojekt meist weder finanzierbar, noch praktisch bereitstellbar sind. Aus diesem Grund ist man gezwungen Annahmen über die zu findenden Objekte zu modellieren und diese Modellierung als Teilinput für automatisierte Verfahren zu nutzen. Wegen dieser speziellen Datenlage sind die Lernansätze der Abteilung fast immer modellbasiert (Model-based machine learning).

Übersicht Beispielprojekte

 

Action Recognition

Handlungen und Aktionen von Personen sind ein wichtiger Teil von Spielfilmen und Videos. Die automatische Erkennung und Zuordnung dieser Aktionen ist eine wesentliche Komponente von Systemen zur inhaltsbasierten Videoanalyse.

 

AEROS

Ziel des Projektes war die automatische Erfassung und Positionsbestimmung von relevanten Objekten im Straßenraum, wie z.B. von Verkehrszeichen, Ampeln, Fahrbahnmarkierungen und Schutzplanken.  

 

Video Detection & Retrieval

Wir haben zusammen mit Projektpartnern vom BR und der Firma AVID eine automatische Videodetektion entwickelt, mit der man die Szenen einzelner Video-Clips in Sendungen finden kann.