Philtag 13: Unterschied zwischen den Versionen
Aus Kallimachos
Gaede (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
|||
| (17 dazwischenliegende Versionen von einem anderen Benutzer werden nicht angezeigt) | |||
| Zeile 42: | Zeile 42: | ||
Im Nachmittagsprogramm folgte der interaktive OCR-Workshop, bei dem die im Rahmen von KALLIMACHOS etablierten Arbeitsabläufe und Tools vorgestellt wurden und durch die Teilnehmerinnen und Teilnehmer auch ausprobiert werden konnten. Zunächst stellten Felix Kirchner und Marco Dittrich die Anforderungen an die Bilderfassung und -Vorverarbeitung sowie die zu beachtenden Spezifika der Glyphen und Typeninventare historischer Drucktexte vor. Prof. Dr. Frank Puppe und Christian Reul ([http://www.is.informatik.uni-wuerzburg.de/startseite/ Lehrstuhl Informatik VI Würzburg]) präsentierten jüngste Erfolge bei der automatischen Segmentierung von Textblöcken. Benedikt Budig | Im Nachmittagsprogramm folgte der interaktive OCR-Workshop, bei dem die im Rahmen von KALLIMACHOS etablierten Arbeitsabläufe und Tools vorgestellt wurden und durch die Teilnehmerinnen und Teilnehmer auch ausprobiert werden konnten. Zunächst stellten Felix Kirchner und Marco Dittrich die Anforderungen an die Bilderfassung und -Vorverarbeitung sowie die zu beachtenden Spezifika der Glyphen und Typeninventare historischer Drucktexte vor. Prof. Dr. Frank Puppe und Christian Reul ([http://www.is.informatik.uni-wuerzburg.de/startseite/ Lehrstuhl Informatik VI Würzburg]) präsentierten jüngste Erfolge bei der automatischen Segmentierung von Textblöcken. Benedikt Budig | ||
([http://www1.informatik.uni-wuerzburg.de/ Lehrstuhl Informatik I Würzburg]) stellte das eigens entwickelte Tool | ([http://www1.informatik.uni-wuerzburg.de/ Lehrstuhl Informatik I Würzburg]) stellte das eigens entwickelte Tool [https://github.com/benedikt-budig/glyph-miner Glyph Miner] für die vereinfachte Extraktion von Glyphen vor, das von den Anwesenden begeistert aufgenommen wurde. Unter der Anleitung durch die studentischen Hilfskräfte Phillip Beckenbauer und Maximilian Nöth konnten die Teilnehmerinnen und Teilnehmer die Funktionsweise der Tools ''Aletheia'' und ''Franken++'' kennenlernen, die der Vorbereitung von Glypheninventaren für das Training von ''Tesseract'' dienen. Der Workshop endete mit der Produktion und der anschließenden Validierung der OCR-Ergebnisse. | ||
Der Ausklang erfolgte im Rahmen eines gemeinsamen Abendessens im Würzburger Bürgerspital, bei dem zu Speis und Trank die Eindrücke des ersten Seminartags (und mehr) lebhaft diskutiert und zahlreiche Kontakte geknüpft werden konnten. | Der Ausklang erfolgte im Rahmen eines gemeinsamen Abendessens im Würzburger Bürgerspital, bei dem zu Speis und Trank die Eindrücke des ersten Seminartags (und mehr) lebhaft diskutiert und zahlreiche Kontakte geknüpft werden konnten. | ||
| Zeile 51: | Zeile 51: | ||
===Tag 2: Schwerpunkt Textmining=== | ===Tag 2: Schwerpunkt Textmining=== | ||
Der 2. Seminartag behandelte aktuelle Digital Humanities-Projekte in Würzburg mit besonderem Schwerpunkt auf Textmining-Verfahren. Zunächst erläuterte Stefan Evert ([http://www.linguistik.uni-erlangen.de/index.shtml FAU Erlangen-Nürnberg]) die statistischen Grundlagen des stilometrischen Abstandsmaßes ''Burrow´s Delta'', das sich v.a. für automatische Autorschaftsattribution bewährt hat. Darauf aufbauend stellte Andreas Büttner das KALLIMACHOS-Teilprojekt [[Identifikation von Übersetzern]] vor, in dem Delta eingesetzt wird, um bislang anonyme lateinische Übersetzer von arabischen philosophischen Texten des 12. Jahrhunderts zu ermitteln. Daniel Schlör, Stefanie Popp und Christof Schöch ([https://cligs.hypotheses.org/ Nachwuchsgruppe CLiGS]) befassten sich mit der Problematik der Erkennung wörtlicher Rede in französischsprachigen Romanen. Da hier für gewöhnlich keine Anführungszeichen verwendet werden, muss die wörtliche Rede anhand anderer Merkmale erkannt werden; die Projektgruppe setzt | Der 2. Seminartag behandelte aktuelle Digital Humanities-Projekte in Würzburg mit besonderem Schwerpunkt auf Textmining-Verfahren. Zunächst erläuterte Stefan Evert ([http://www.linguistik.uni-erlangen.de/index.shtml FAU Erlangen-Nürnberg]) die statistischen Grundlagen des stilometrischen Abstandsmaßes ''Burrow´s Delta'', das sich v.a. für automatische Autorschaftsattribution bewährt hat. Darauf aufbauend stellte Andreas Büttner das KALLIMACHOS-Teilprojekt [[Identifikation von Übersetzern]] vor, in dem ''Delta'' eingesetzt wird, um bislang anonyme lateinische Übersetzer von arabischen philosophischen Texten des 12. Jahrhunderts zu ermitteln. Daniel Schlör, Stefanie Popp und Christof Schöch ([https://cligs.hypotheses.org/ Nachwuchsgruppe CLiGS]) befassten sich mit der Problematik der Erkennung wörtlicher Rede in französischsprachigen Romanen. Da hier für gewöhnlich keine Anführungszeichen verwendet werden, muss die wörtliche Rede anhand anderer Merkmale erkannt werden; die Projektgruppe setzt hierzu auf Verfahren des maschinellen Lernens. Markus Krug stellte die Methoden und erste Ergebnisse des KALLIMACHOS-Teilprojekts [[Romanfiguren | Leserlenkung in Bezug auf Romanfiguren]] vor. Hier werden Romanfiguren automatisch annotiert und die gewonnenen Informationen zur Erstellung von Figurennetzwerken verwendet. Dabei sollen neben Eigennamen auch Koreferenzen, z.B. durch Pronomina, korrekt erkannt werden. Abschließend erläuterte Isabella Reger (KALLIMACHOS-AG [[Narrative Techniken]]), wie im Rahmen einer Sentimentanalyse der Stimmungsverlauf in einem Romantext erkannt werden kann und wie diese Information zur Klassifizierung literarischer Gattungen genutzt werden kann. | ||
===Fazit=== | ===Fazit=== | ||
| Zeile 112: | Zeile 112: | ||
| Zusammenfassung Tag 1, Abschlussdiskussion | | Zusammenfassung Tag 1, Abschlussdiskussion | ||
|- | |- | ||
| | | ab 19:30 | ||
| Abendessen im Restaurant [https://www.google.de/maps/place/Bürgerspital+Weingut/ Bürgerspital] | | Abendessen im Restaurant [https://www.google.de/maps/place/Bürgerspital+Weingut/ Bürgerspital] | ||
|} | |} | ||
| Zeile 121: | Zeile 121: | ||
{| class="wikitable" cellpadding="10" | {| class="wikitable" cellpadding="10" | ||
| 9:00-9:30 | | 9:00-9:30 | ||
| Stefan Evert,Thomas Proisl ([http://www.linguistik.uni-erlangen.de/index.shtml FAU Nürnberg]): ''Burrows’s Delta verstehen'' | | Stefan Evert, Thomas Proisl ([http://www.linguistik.uni-erlangen.de/index.shtml FAU Nürnberg]): ''Burrows’s Delta verstehen'' | ||
|- | |- | ||
| 9:30-10:00 | | 9:30-10:00 | ||
| Zeile 147: | Zeile 147: | ||
</p> | </p> | ||
= | =Materialien= | ||
==Tagungsplan== | ==Tagungsplan== | ||
<!-- Tagungsplan und Materialien --> | <!-- Tagungsplan und Materialien --> | ||
| Zeile 168: | Zeile 168: | ||
</div> | </div> | ||
--> | --> | ||
* Uwe Springmann: OCR von Inkunabeln: Herausforderungen und Herangehensweisen | * Uwe Springmann: OCR von Inkunabeln: Herausforderungen und Herangehensweisen. | ||
** [[media:AbstractSpringmann.pdf | Abstract]] | ** [[media:AbstractSpringmann.pdf | Abstract]] | ||
** [[media:PresentationSpringmann.pdf | Präsentation]] | ** [[media:PresentationSpringmann.pdf | Präsentation]] | ||
* Elisa Herrmann:OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren | * Elisa Herrmann:OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren. | ||
** [[media:AbstractHerrmann.pdf | Abstract]] | ** [[media:AbstractHerrmann.pdf | Abstract]] | ||
** [[media:PresentationHerrmann.pdf | Präsentation]] | ** [[media:PresentationHerrmann.pdf | Präsentation]] | ||
* Josep Lladós: Social networks of the past: information extraction from historical demographic documents | * Josep Lladós: Social networks of the past: information extraction from historical demographic documents. | ||
** [[media:AbstractLlados.pdf | Abstract]] | ** [[media:AbstractLlados.pdf | Abstract]] | ||
<!--** [[media:PresentationLlados.pdf | Präsentation]]--> | <!--** [[media:PresentationLlados.pdf | Präsentation]]--> | ||
* Dirk Wintergrün (MPIWG Berlin): Von Handarbeit zur Massenware - OCR als Grundlage für die Forschung in der Wissenschaftsgeschichte | * Dirk Wintergrün (MPIWG Berlin): Von Handarbeit zur Massenware - OCR als Grundlage für die Forschung in der Wissenschaftsgeschichte. | ||
** [[media:AbstractWintergrün.pdf | Abstract]] | ** [[media:AbstractWintergrün.pdf | Abstract]] | ||
* Syed Saqib Bukhari (DFKI Kaiserslautern): OCRopus++: A High performance OCR System For Medieval Documents | * Syed Saqib Bukhari (DFKI Kaiserslautern): OCRopus++: A High performance OCR System For Medieval Documents. | ||
** [[media:AbstractBukhari.pdf | Abstract]] | ** [[media:AbstractBukhari.pdf | Abstract]] | ||
** [[media:PresentationBukhari.pdf | Präsentation]] | ** [[media:PresentationBukhari.pdf | Präsentation]] | ||
* Marco Dittrich, Felix Kirchner (JMU Würzburg): Begleitende Präsentation zum OCR-Workshop | * Marco Dittrich, Felix Kirchner <!--,Christian Reul, Benedikt Budig, Phillip Beckenbauer und Maximilian Nöth--> (JMU Würzburg): Begleitende Präsentation zum OCR-Workshop. | ||
** [[media:OCRWorkshop.pdf | Präsentation]] | ** [[media:OCRWorkshop.pdf | Präsentation]] | ||
* Christian Reul (JMU Würzburg): Segmentierung von historischen Drucken. | |||
** [[media:AbstractReul.pdf | Abstract]] | |||
* Benedikt Budig (JMU Würzburg): Erstellung von Typeninventaren mit ''Glyph Miner''. | |||
** [[media:AbstractBudig.pdf | Abstract]] | |||
* Phillip Beckenbauer (JMU Würzburg): Extraktion von Glyphen mit ''Aletheia''. | |||
** [[media:VortragBeckenbauer.pdf | Vortrag und Übung]] | |||
* Maximilian Nöth (JMU Würzburg): Erstellen von Trainingsdaten mit ''Franken+''. | |||
** [[media:VortragNoeth.pdf | Vortrag und Übung]] | |||
===Tag 2: Schwerpunkt Textmining=== | ===Tag 2: Schwerpunkt Textmining=== | ||
* Stefan Evert,Thomas Proisl (FAU Nürnberg): Burrows’s Delta verstehen | * Stefan Evert,Thomas Proisl (FAU Nürnberg): Burrows’s Delta verstehen. | ||
** [[media:AbstractFAU.pdf | Abstract]] | ** [[media:AbstractFAU.pdf | Abstract]] | ||
** [[media:PresentationFAU.pdf | Präsentation]] | ** [[media:PresentationFAU.pdf | Präsentation]] | ||
| Zeile 193: | Zeile 200: | ||
** [[media:AbstractÜbersetzer.pdf | Abstract]] | ** [[media:AbstractÜbersetzer.pdf | Abstract]] | ||
** [[media:PresentationÜbersetzer.pdf | Präsentation]] | ** [[media:PresentationÜbersetzer.pdf | Präsentation]] | ||
*Daniel Schlör, Stefanie Popp, Christof Schöch (Nachwuchsgruppe CLiGS): Direkte Rede im französischen Roman: Automatische Erkennung und gattungsabhängige Verteilungen | *Daniel Schlör, Stefanie Popp, Christof Schöch (Nachwuchsgruppe CLiGS): Direkte Rede im französischen Roman: Automatische Erkennung und gattungsabhängige Verteilungen. | ||
** [[media:AbstractDirekteRede.pdf | Abstract]] | ** [[media:AbstractDirekteRede.pdf | Abstract]] | ||
** [[media:PresentationDirekteRede.pdf | Präsentation]] | ** [[media:PresentationDirekteRede.pdf | Präsentation]] | ||
* Lena Hettinger, Isabella Reger (AG Romangattungen): Mit Sentimentanalyse zum Happy End? Experimente zur Klassifikation literarischer Gattungen | * Lena Hettinger, Isabella Reger (AG Romangattungen): Mit Sentimentanalyse zum Happy End? Experimente zur Klassifikation literarischer Gattungen. | ||
** [[media:AbstractGattungen.pdf | Abstract]] | ** [[media:AbstractGattungen.pdf | Abstract]] | ||
** [[media:PresentationGattungen.pdf | Präsentation]] | ** [[media:PresentationGattungen.pdf | Präsentation]] | ||
| Zeile 214: | Zeile 221: | ||
</p> | </p> | ||
<headertabs /> | <headertabs /> | ||
{{Sprachauswahl|Philtag 13 (english)|Philtag 13}} | |||
__NOTOC__ | |||
Aktuelle Version vom 14. Mai 2020, 23:36 Uhr