Bildprozessierung und Speicherung


Die Datenverarbeitung einer digitalisierten Kodexseite beinhaltet die folgenden Schritte:

1.    Die Vorverarbeitung oder Aufbereitung (preprocessing) digitalisierter Bilder mittelalterlicher Handschriften beinhaltet die folgenden Standardverarbeitungsstufen wie:

a) Farbkalibrierung: die Farben der Handschriftendigitalisate werden mithilfe einer genormten Farbtafel kalibriert. Ungenauigkeiten, beispielsweise durch die Verwendung unterschiedlicher Scanner, werden hierbei ausgeglichen.

b) Räumliche Kalibrierung: Bilder unterschiedlicher Größe (in dpi) werden zu einer einheitlichen Größe kalibriert.

c) Filterung: Bilder weisen immer ein gewisses 'Rauschen' auf, das mit verschiedenen Filtern minimiert oder gar beseitigt werden kann.

d) Skalierung und Vervielfältigung: Um die Verarbeitungszeit zu reduzieren, werden die Bilder in verschiedenen geringeren Auflösungen gespeichert, die dpi-Werte liegen dabei etwa zwischen 75 und 150.

2.   Segmentierung: Segmentierung dient dazu, die einzelnen Objekte der beschriebenen Seite (z.B. Schrift und Bild) vom Hintergrund zu trennen. Die Komplexität dieses Prozesses kann dabei stark variieren, es handelt sich um einen der aufwendigsten Vorgänge der Bildbearbeitung.

3.   Merkmalsextraktion: Die einzelnen Bestandteile des Layouts, wie die gesamte Kodexseite und einzelne segmentierte Objekte (Seitengröße, Schriftraum und Bildraum) können mit Hilfe der Algorithmenbibliothek vermessen werden.

4.   Datenspeicherung: Nach der Extraktion können die Messergebnisse festgehalten, statistisch ausgewertet und in die Katalogdaten übertragen werden. Dies ist die eigentliche Ãœbersetzung von Bilddaten in kodikologische Informationen. Die Werte jedes einzelnen Vorganges werden gespeichert. Das Resultat sind Angaben, die in einem XML Dokument gemäß TEI P5 abgelegt werden können. Auf diese Weise lassen sich die existierenden Katalogisate mit den automatisch gewonnen Informationen anreichern.

       
zum Seitenanfangzum Seitenanfang