Philtag 13: Unterschied zwischen den Versionen
Aus Kallimachos
Keine Bearbeitungszusammenfassung |
|||
| Zeile 7: | Zeile 7: | ||
==Tagungsbericht== | ==Tagungsbericht== | ||
===Tag 1: Schwerpunkt OCR=== | |||
Einen Themenschwerpunkt in diesem Jahr bildeten OCR-Verfahren, die am 1. Seminartag vorgestellt, diskutiert und praktisch erprobt wurden. Nach der Begrüßung und der Vorstellung des KALLIMACHOS-Projekts durch Dr. Hans-Günter Schmidt (UB Würzburg) folgte mit Dr. Uwe Springmann ([http://www.cis.uni-muenchen.de/personen/mitarbeiter/springmann/index.html CIS München]) der erste Kurzvortrag zum Thema ''OCR von Inkunabeln''. Galten diese lange als ungeeignet für die automatische Texterkennung, konnten inzwischen mithilfe neuer OCR-Ansätze auf der Basis neuronaler Netze erste Erfolge verzeichnet werden. Im anschließenden Vortrag stellte Dirk Wintergrün ([https://www.mpiwg-berlin.mpg.de/de/users/dwinter MPIWG Berlin]) die Bedeutung von OCR-Verfahren für die Erforschung wissenschaftlicher Überlieferungstraditionen und die Erfassung wissenschaftshistorischer Aktenbestände heraus. Elisa Herrmann ([http://www.ocr-d.de/ OCR-D Wolfenbüttel]) stellte das Koordinationsprojekt ''OCR-D'' vor, dessen Ziel es ist, die Erfassung der Drucke des 16.-19. Jahrhunderts im deutschsprachigen Raum zu optimieren und künftige Förderlinien der DFG vorzubereiten. Dr. Syed Saqib Bukhari ([http://www.dfki.de/~dengel/content/index_ger.html DFKI Kaiserslautern]) gewährte einen Einblick in das am DFKI entwickelte OCR-System ''OCRopus++'', das Erkennungsgenauigkeiten auf historischen Drucken von über 98% verspricht, bevor Dr. Josep Lladós ([http://www.cvc.uab.es/~josep/ CVC Barcelona]) den ersten Vortragsblock mit einem Bericht über die automatisierte Informationsextraktion aus historischen Urkunden, Ehestandsverzeichnissen und weiteren genealogischen Quellen und die Nutzung der so erfassten Daten für die Rekonstruktion historischer sozialer Netzwerke abschloss. | Einen Themenschwerpunkt in diesem Jahr bildeten OCR-Verfahren, die am 1. Seminartag vorgestellt, diskutiert und praktisch erprobt wurden. Nach der Begrüßung und der Vorstellung des KALLIMACHOS-Projekts durch Dr. Hans-Günter Schmidt (UB Würzburg) folgte mit Dr. Uwe Springmann ([http://www.cis.uni-muenchen.de/personen/mitarbeiter/springmann/index.html CIS München]) der erste Kurzvortrag zum Thema ''OCR von Inkunabeln''. Galten diese lange als ungeeignet für die automatische Texterkennung, konnten inzwischen mithilfe neuer OCR-Ansätze auf der Basis neuronaler Netze erste Erfolge verzeichnet werden. Im anschließenden Vortrag stellte Dirk Wintergrün ([https://www.mpiwg-berlin.mpg.de/de/users/dwinter MPIWG Berlin]) die Bedeutung von OCR-Verfahren für die Erforschung wissenschaftlicher Überlieferungstraditionen und die Erfassung wissenschaftshistorischer Aktenbestände heraus. Elisa Herrmann ([http://www.ocr-d.de/ OCR-D Wolfenbüttel]) stellte das Koordinationsprojekt ''OCR-D'' vor, dessen Ziel es ist, die Erfassung der Drucke des 16.-19. Jahrhunderts im deutschsprachigen Raum zu optimieren und künftige Förderlinien der DFG vorzubereiten. Dr. Syed Saqib Bukhari ([http://www.dfki.de/~dengel/content/index_ger.html DFKI Kaiserslautern]) gewährte einen Einblick in das am DFKI entwickelte OCR-System ''OCRopus++'', das Erkennungsgenauigkeiten auf historischen Drucken von über 98% verspricht, bevor Dr. Josep Lladós ([http://www.cvc.uab.es/~josep/ CVC Barcelona]) den ersten Vortragsblock mit einem Bericht über die automatisierte Informationsextraktion aus historischen Urkunden, Ehestandsverzeichnissen und weiteren genealogischen Quellen und die Nutzung der so erfassten Daten für die Rekonstruktion historischer sozialer Netzwerke abschloss. | ||
| Zeile 13: | Zeile 14: | ||
Der Ausklang erfolgte schließlich im Rahmen eines gemeinsamen Abendessens im Würzburger Bürgerspital, bei dem zu Speis und Trank die Eindrücke des ersten Seminartags (und mehr) lebhaft diskutiert und zahlreiche Kontakte geknüpft werden konnten. | Der Ausklang erfolgte schließlich im Rahmen eines gemeinsamen Abendessens im Würzburger Bürgerspital, bei dem zu Speis und Trank die Eindrücke des ersten Seminartags (und mehr) lebhaft diskutiert und zahlreiche Kontakte geknüpft werden konnten. | ||
===Tag 2: Schwerpunkt Textmining=== | |||
Der 2. Seminartag behandelte aktuelle Digital Humanities-Projekte in Würzburg mit besonderem Schwerpunkt auf Textmining-Verfahren. Zunächst erläuterte Stefan Evert ([http://www.linguistik.uni-erlangen.de/index.shtml FAU Nürnberg]) die statistischen Grundlagen des stilometrischen Abstandsmaßes ''Burrow´s Delta'', das sich v.a. für automatische Autorschaftsattribution bewährt hat. Darauf aufbauend stellte Andreas Büttner das KALLIMACHOS-Teilprojekt ''Identifikation von Übersetzern'' vor, in dem Delta eingesetzt wird, um anonyme lateinische Übersetzer von arabischen philosophischen Texten des 12. Jahrhunderts zu ermitteln. Daniel Schlör, Stefanie Popp und Christof Schöch ([https://cligs.hypotheses.org/ Nachwuchsgruppe CLiGS]) befassten sich mit der Problematik der Erkennung wörtlicher Rede in französischsprachigen Romanen. Da hier für gewöhnlich keine Anführungszeichen verwendet werden, muss die wörtliche Rede anhand anderer Merkmale erkannt werden; die Projektgruppe setzt dabei auf Verfahren des maschinellen Lernens. Markus Krug stellte die Methoden und erste Ergebnisse des KALLIMACHOS-Teilprojekts ''Leserlenkung in Bezug auf Romanfiguren'' vor. Hier werden Romanfiguren automatisch annotiert und die gewonnenen Informationen zur Erstellung von Figurennetzwerken verwendet. Dabei sollen neben Eigennamen auch Koreferenzen, z.B. durch Pronomina, korrekt erkannt werden. Abschließend erläuterte Isabella Reger (KALLIMACHOS-AG Narrative Techniken), wie im Rahmen einer Sentimentanalyse der Stimmungsverlauf in einem Romantext erkannt werden kann und wie diese Information zur Klassifizierung literarischer Gattungen genutzt werden kann. | Der 2. Seminartag behandelte aktuelle Digital Humanities-Projekte in Würzburg mit besonderem Schwerpunkt auf Textmining-Verfahren. Zunächst erläuterte Stefan Evert ([http://www.linguistik.uni-erlangen.de/index.shtml FAU Nürnberg]) die statistischen Grundlagen des stilometrischen Abstandsmaßes ''Burrow´s Delta'', das sich v.a. für automatische Autorschaftsattribution bewährt hat. Darauf aufbauend stellte Andreas Büttner das KALLIMACHOS-Teilprojekt ''Identifikation von Übersetzern'' vor, in dem Delta eingesetzt wird, um anonyme lateinische Übersetzer von arabischen philosophischen Texten des 12. Jahrhunderts zu ermitteln. Daniel Schlör, Stefanie Popp und Christof Schöch ([https://cligs.hypotheses.org/ Nachwuchsgruppe CLiGS]) befassten sich mit der Problematik der Erkennung wörtlicher Rede in französischsprachigen Romanen. Da hier für gewöhnlich keine Anführungszeichen verwendet werden, muss die wörtliche Rede anhand anderer Merkmale erkannt werden; die Projektgruppe setzt dabei auf Verfahren des maschinellen Lernens. Markus Krug stellte die Methoden und erste Ergebnisse des KALLIMACHOS-Teilprojekts ''Leserlenkung in Bezug auf Romanfiguren'' vor. Hier werden Romanfiguren automatisch annotiert und die gewonnenen Informationen zur Erstellung von Figurennetzwerken verwendet. Dabei sollen neben Eigennamen auch Koreferenzen, z.B. durch Pronomina, korrekt erkannt werden. Abschließend erläuterte Isabella Reger (KALLIMACHOS-AG Narrative Techniken), wie im Rahmen einer Sentimentanalyse der Stimmungsverlauf in einem Romantext erkannt werden kann und wie diese Information zur Klassifizierung literarischer Gattungen genutzt werden kann. | ||