Dokumentenerschließung der nächsten Generation
Wissen um künstliche neuronale Netze hilft bei Verarbeitung von Bilddaten zur Dokumentenanalyse
Der Lehrstuhl für technische Informatik am Institut für Elektronik, Signalverarbeitung und Kommunikationstechnik arbeitet im Rahmen des Projekts "Adaptive READ" mit an der Entwicklung von Dokumentenerschließungssystemen der nächsten Generation.
Das Ziel von "Adaptive READ" sind Informationssysteme, die sich weitgehend automatisch an konkrete Informationsbedürfnisse eines Unternehmens oder eines Benutzers anpassen.
Heutige Dokumentenerschließungssysteme sind bereits von beachtlicher Leistungsfähigkeit und haben zahlreiche Anwendungen in der industriellen Praxis gefunden. Sie können beispielsweise die relevante Information aus komplexen Dokumentstrukturen extrahieren oder Maschinen- und Handschrift lesen und interpretieren. Allerdings haben sie eine Konzeptschwäche gemeinsam: Sie können nur sehr begrenzt aus Fehlern lernen und zwingen den Benutzer zu manuellen Korrekturen.
Deshalb ist die Entwicklung von Systemen, die sich weitgehend automatisch an die Bedürfnisse des Benutzers und an die spezifischen Probleme einer aktuellen Analyse adaptieren notwendig. Der Mehrwert solcher Systeme liegt auf der Hand: Sie unterliegen nicht wie bisherige Systeme dem "Gesetz der fortschreitenden Fehlanpassung" und benötigen gleichzeitig wesentlich weniger Aufwand für ihre Pflege.
Innerhalb des Projekts "Adaptive READ" befaßt sich der Lehrstuhl für technische Informatik hauptsächlich mit der Erfassung, Vorverarbeitung und Archivierung der Bilddaten bei der Dokumentenanalyse. Die bildhaften Informationen, die von Scannern oder anderen bildgebenden Geräten erzeugt werden, müssen in besonderer Weise aufbereitet werden, um Schriftzeichen zu erkennen. Diese Bild-zu-Bild-Transformationen sollen die informationstragenden Bereiche der Pixelbilder hervorheben. Die Ziele der stattfindenden Untersuchungen liegen im Bereich der Kompressions- und Dekompressionsverfahren im Zusammenhang mit der Korrektur der Bildaufnahme, der Rauschunterdrückung und der strukturorientierten Farbanalyse von Bildern. Um bestmögliche Ergebnisse nachfolgender Verarbeitungsschritte zu erreichen, werden bestehende Kompressionsverfahren speziell angepaßt.
Bei der Anwendung von Methoden zur Datenkompression ergeben sich je nach Kompressionsrate Fehler, welche die Weiterverarbeitung nachteilig beeinflussen. Es werden Verfahren untersucht, die anhand von a-priori-Wissen über den Bildinhalt die Kompressionsfehler reduzieren. Dabei wird z.B. mit Hilfe dieses Wissens ein künstliches neuronales Netz angelernt (off-line), welches dann on-line die Bildkorrektur realisiert.
An der Entwicklung der Dokumentenerschließungssysteme arbeiten elf Partner aus Wissenschaft und Industrie wie z.B. DaimlerChrysler AG, Ulm, DFKI - Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Kaiserslautern, Océ Dokument Technologies, Konstanz, Siemens Dematic AG, Konstanz, und die Universität Duisburg zusammen. Das Projekt "Adaptive READ" mit einem Gesamtvolumen von ca. 45 Millionen DM wird vom Bundesministerium für Bildung und Forschung gefördert.