Weltkonferenz zu Terahertz-Strahlung tagt in Marburg

07.04.2024 (pm/red) Marburg auf einer Welle mit London, Kyoto, San Diego: Die Philipps-Universität beherbergt in der Woche vom 8. bis 12. April die internationale Konferenz „OTST 2024“, das Welttreffen zur optischen und optoelektronischen Erzeugung und …

Lesen Sie den gesamten Beitrag »
Kultur

Hessische Geschichten

Kassel

Hessen Kassel Heritage

Kunst

Home » Bildung, Forschung

CeBIT 2011 – Von der Live-Digitalisierung in den elektronischen Lesesaal

Marburg 25.2.2011 (pm/red) Zeitungen, Zeitschriften und Bücher erobern mittels Digitalisierung das Internet. Für Verlage, Bibliotheken und viele Unternehmen ist es unerlässlich, gedruckte Dokumente zu erhalten und weiter zu verwerten. Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS) präsentiert auf der CeBIT in Hannover vom 1. bis 5. März 2011 neue Technologien, um Dokumente zu digitalisieren, automatisch zu erschließen und gesichert bereitzustellen.
Viele Institutionen digitalisieren derzeit ihre Dokumentenbestände. Aber was passiert mit dem eingescannten Dokument nach der Digitalisierung? „Meist reicht den Nutzern das digitale Abbild einer Buch- oder Zeitungsseite alleine nicht aus“, betont Stefan Paal, Projektleiter am Fraunhofer IAIS. „Wichtig ist, dass die Dokumente inhaltlich erschlossen und strukturiert werden, damit Nutzer sie durchsuchen können, Bezüge zu anderen Dokumenten finden und sie zum Beispiel in ihre Geschäftsprozesse einbinden können.“

Fraunhofer IAIS zeigt neue Technologien zur automatischen Erschließung und Präsentation digitalisierter Dokumente

Auf der CeBIT zeigen die Experten des Fraunhofer IAIS einen kompletten Workflow – von der Digitalisierung gedruckter Medien über die automatische Bildbearbeitung und inhaltlichen Erschließung bis zur urheberrechtsgeschützten Darstellung der digitalen Dokumente. „Dabei kommen neue Technologien zum Einsatz, die wir gemeinsam mit unseren Partnern im Projekt CONTENTUS entwickelt haben und jetzt praktisch anwenden, sagt der Wissenschaftler. CONTENTUS ist ein Teil des THESEUS-Forschungs­programms, das vom Bundesministerium für Wirtschaft und Technologie (BMWi) gefördert wird. Im Rahmen des Programms entwickeln Unternehmen, Forschungseinrichtungen und Universitäten anwendungsorientierte Basistechnologien und technische Standards für das Internet der Dienste.

Dokumente semantisch erschließen und sicher bereitstellen

Neben einer Live-Digitalisierung durch einen Scan Roboter, der bis zu 2500 Seiten pro Stunde erfasst, zeigen die Experten des IAIS, wie die digitalisierten Dokumente automatisch verarbeitet werden. Dabei wenden sie zum Beispiel Algorithmen zur Bildoptimierung und -stabilisierung an. Verfahren zur semantischen Erschließung großer digitalisierter Dokumentensammlungen ermöglichen es, in den Dokumentenbeständen gezielt zu suchen und Informationen zu verknüpfen. Dazu setzen die Fraunhofer-Forscher unter anderem verschiedene Text-Mining-Verfahren ein. So werden zum Beispiel Personennamen, Orte und Organisationen im Text erkannt und mit anderen Fundstellen aus dem Dokumentenbestand vernetzt.

Der elektronische Lesesaal bringt die digitalisierten Dokumente schließlich auf den Computerbildschirm. „Im elektronischen Lesesaal können wir Digitalisate sicher und nahezu in Echtzeit über das Internet bereitstellen“, erklärt Paal. „Das System reichert die Anzeige der Dokumente automatisch mit Metadaten aus der Analyse an. Auf dem Bildschirm erscheinen die digitalisierten Seiten layoutgetreu und bewahren damit den Charakter der gedruckten Medien.“ In Kooperation mit dem Softwarespezialisten ImageWare Components zeigt das Fraunhofer IAIS auf der CeBIT die Anwendung MyBib eRoom, die es zum Beispiel Bibliotheken ermöglicht, urheberrechtlich geschützte Dokumentensammlungen sicher am Computer bereitzustellen.

Möglichkeiten vernetzten Wissens

Die Technologien rund um die automatische Erschließung digitalisierter Medien schaffen in vielen Bereichen neue Möglichkeiten zur Vernetzung von Wissen – vor allem im Internet. So sollen Techniken, die im THESEUS-Forschungsprogramm entstanden sind, auch in die Deutsche Digitale Bibliothek integriert werden, die sich derzeit am Fraunhofer IAIS im Aufbau befindet. Die Deutsche Digitale Bibliothek ist eine Initiative von Bund, Ländern und Kommunen und soll langfristig Kulturgüter und wissenschaftliche Informationen über ein Internetportal für ein breites Publikum zugänglich machen.

Fraunhofer IAIS auf der CeBIT

Die Lösungen rund um das moderne Wissensmanagement präsentiert das Team des Fraunhofer IAIS auf der CeBIT in Hannover, vom 1. bis 5. März 2011 am Fraunhofer-Gemeinschaftsstand in Halle 9, Stand B36, Exponat Nummer 3.
Am Stand des BMWi in Halle 9, Stand B47, zeigt das Fraunhofer IAIS weitere Anwendungen aus der THESEUS-Forschung. Gemeinsam mit der Siemens AG stellen die Wissenschaftler zum Beispiel das Airline Claim Management vor – ein neues System für Fluggesellschaften, das Beschwerden von Fluggästen dank Text-Mining schneller und effizienter verarbeitet.

Contact Us