Systeme der Informationsverwaltung
The GoldenGATE Document Markup & Retrieval System / plazi.org
Dieses Projekt leistet anhand der Literatur über Ameisen die theoretische und praktische Vorarbeit, um biosystematische Dokumente in großem Umfang zu digitalisieren und über semantische Suchfunktionen online zur Verfügung zu stellen. Die entwickelten Technologien lassen sich im Grunde auch für beliebige andere Textsorten einsetzen.
Speziell werden der Markup-Werkzeuge erstellt und auf Basis von Erfahrungen aus der praktischen Anwendung (insbesondere der Erstellung des Madagaskar-Korpus - 2.500 Seiten biosystematischer Literatur über die Ameisenfauna Madagaskars) ständig weiterentwickelt, um die Benutzer bei der Markierung gescannter Dokumente immer besser zu unterstützen.
Für die Speicherung und Bereitstellung der Dokumente steht ein Server zur Verfügung, der die Dokumente den gesamten Aufbereitungsprozess über als zentraler Datenspeicher begleitet und in einzelnen Teilen online abrufbar und durchsuchbar macht. Hierdurch können Benutzer die Dokumente über das Suchportal abrufen, sobald ein grundlegender Teil des Markups erfolgt ist. Zusätzlich zum Suchportal existieren mehrere XML-basierte Schnittstellen, um die Dokumente auch anderen Applikationen zur Verfügung zu stellen. Der gesamte Server ist flexibel gestaltet, um neue Funktionen nahtlos einbetten zu können, wodurch sich die Dokumente leicht für immer mehr Benutzern und Applikationen abrufbar machen lassen.