Projektbeschreibung

Aus Kallimachos
Wechseln zu:Navigation, Suche
[bearbeiten]


KALLIMACHOS führt Geisteswissenschaftler, Informatiker und Bibliothekare in einem regionalen Digital Humanities-Zentrum zusammen. Die an der Universität Würzburg vorhandenen Kooperationen und Kompetenzen werden durch Partner am DFKI Kaiserslautern (OCR) und an der Universität Erlangen-Nürnberg (Fachbereich Linguistische Informatik) ergänzt.

Unser Aufgabenschwerpunkt liegt auf der Betreuung digitaler Editionen und quantitativer Analyseverfahren aus dem Bereich des Text Mining, z.B. Stilometrie, Topic Modeling und Named Entity Recognition. Wir bieten unseren Projektpartnern die nötige technische und soziale Infrastruktur, die Geisteswissenschaftler bei der Beantwortung von Forschungsfragen auf der Basis digitaler Methoden unterstützt.

Auf der technischen Seite gehören dazu die Entwicklung und Bereitstellung der benötigten Software-Komponenten und das Erarbeiten prototypischer Arbeitsabläufe, die in bereits vorhandene Infrastrukturen integriert werden. Dabei ist uns gerade auch die langfristige Verfügbarkeit, Pflege und Archivierung der Projekte, Portale und Forschungsdaten ein wichtiges Anliegen.

Außerdem fördern wir durch regelmäßige Workshops und Tagungen den Austausch zwischen den regionalen und überregionalen Digital-Humanities-Projekten. Durch Beratungen und Schulungen führen wir Fachleuten ebenso wie dem akademischen Nachwuchs die Möglichkeiten digitaler Methoden zur Bearbeitung von Forschungsfragen vor Augen und bieten methodische, technische und organisatorische Unterstützung.

[bearbeiten]

Klären: Workflow oder Fortschritt der Workflow-Erstellung

OCR-Modul

Das Modul soll eine automatisierte Vorverarbeitung für die Volltexterstellung bieten. Auf der Grundlage der Arbeiten und Softwarebausteine des DFKI wird die Arbeit im Projekt aus folgenden Schritten bestehen:

  • Softwaremäßige Integration der bisherigen OCR-Komponenten,
  • Training von neuen Modellen für historische Druck- und Handschriften,
  • Entwicklung von Sprachmodellen („Wörterbüchern“) für historische Orthographie,
  • Weiterentwicklung der nichtparametrischen Methoden für die Bildvorverarbeitung, Layoutanalyse und Sprachmodellierung.


[bearbeiten]

Hier z.B. die Scanner!

TODO

[bearbeiten]

TODO