Emotionen an der Mimik vollautomatisch erkennen
Preis für Best Paper and Presentation an Magdeburger Nachwuchswissenschaftler
Auf der Internationalen Conference on Computer Vision and Graphics (ICCVG 2008) im November 2008 in Warschau wurde das Paper Geometrical and optical flow based method for facial expression recognition in color image sequences (Autoren: Ayoub Al-Hamadi, Robert Niese, Saira Saleem Pathan, Faisal Aziz und Bernd Michaelis) mit dem Preis "Best Paper and Presentation" ausgezeichnet.
Gesichtsausdruckanalyse
Der Artikel wurde von MSc. Saira Pathan im Auftrag der Arbeitsgruppe Technische Informatik der Fakultät für Elektrotechnik und Informationstechnik als mündlicher Vortrag präsentiert. Thema des Vortrages war die Vorstellung eines Systems zur automatischen Gesichtsausdruckanalyse zwecks Emotionserkennung, das unter dem Einfluss gestörter realer Situationen robust arbeitet. Zu diesem Zweck wurden von den Autoren statische und dynamische Ansätze zur Erfassung von Änderungen der Mimik entwickelt. Während der erste Ansatz geometrische Merkmale für die Analyse auswertet, analysiert der zweite Ansatz die Veränderungen innerhalb des Gesichts in bestimmten Regionen in der Videosequenz.
Die Auswahl der Gesichtsregionen, in denen die Bewegung ermittelt wird, ist motiviert durch die unter der Haut liegenden Muskeln, die bei der Mimik eine entscheidende Rolle spielen. Die konkrete Lage der Regionen im Gesicht wird durch die Normierung des Gesichts und A-priori Wissen über die Lage bestimmter Gesichtsmerkmale bestimmt. Die Ermittlung erfolgt vollautomatisch. Die Berechnung der Bewegungsaktivitäten der Muskelregionen ist verglichen mit anderen Arbeiten robust. Die dadurch erfassten transienten und statischen Merkmale, welche unter Zuhilfenahme eines 3D-Gesichtsmodells in ausgewählten Regionen bestimmt werden, werden einem angelernten Klassifikator zugeführt, der in der Lage ist, zwischen den verschiedenen Gesichtsausdrücken (z.B. Freude, Wut, Trauer, Überraschung, Angst und Ekel) zu unterscheiden. Sehr erfolgreich wurden hierfür Support Vector Machines (SVM), künstliche Neuronale Netze und der Nearest-Neighbor-Klassifikator eingesetzt.
Ein wesentliches Anwendungsgebiet sind die an der Universität bearbeiteten Schwerpunkte Sonderforschungsbereich Transregio 62 und NIMITEK, in die auch der Lehrstuhl involviert ist. Das Verbundprojekt NIMITEK steht für Neurobiologisch inspirierte, multimodale Intentionserkennung für technische Kommunikationssysteme. Gegenstand der Forschung im Rahmen des SFB Transregio 62 ist das Zusammenwirken von Mensch und Maschine in technischen Kommunikationssystemen.
Anwendung in Medizin
Somit etabliert sich in Magdeburg ein Netzwerk wissenschaftlicher Exzellenz zwischen Neuro- und Ingenieurwissenschaften.
Das langfristige Ziel der Arbeit ist die Entwicklung eines Systems, das unabhängig von der Person in der Lage ist, die Gesichtsausdrücke eines Menschen korrekt zu klassifizieren. Ein Hauptaugenmerk liegt dabei auf der Robustheit des Verfahrens. Um eine "realistische" Mensch-Maschine-Kommunikation bzw. eine Anwendung in der Medizin (z.B. post-operative Schmerzerkennung) zu ermöglichen, wurde daher bei der Entwicklung des Verfahrens zur mimikbasierten Emotionserkennung besonders auf die Echtzeitfähigkeit, die Personenunabhängigkeit und die Robustheit gegenüber gestörten Bildsituationen geachtet.