Digital Classicist Seminar: "Evaluating Cuneiform in the World Wide Web: fantastic use cases and where to find them"
Vortrag von Adam Anderson
Abstract
Diese Studie adressiert die digitale Repräsentation der Keilschrift als frühester mehrsprachiger Orthographie und zeigt, wie deren historische Polyvalenz und Formatheterogenität reproduzierbare Forschung bis heute erschweren. Aufbauend auf einem UC-Berkeley-Discovery-Projekt (seit 2021) wird ein zweistufiger Ansatz vorgestellt: (1) eine dokumentorientierte Pipeline zur strukturerhaltenden, auditierbaren Umwandlung von Transliteration nach Unicode, und (2) eine zeichenbasierte Pipeline für großskalige NLP-Szenarien. Auf Basis systematischer Vergleiche zentraler digitalen Zeichenlisten (u. a. OSL, Nuolenna, CuneiML, Text-Fabric, Akkademia) entsteht eine harmonisierte Ontologie mit transparenter Provenienz und Publikation der Zeichenwerte als Linked Data in Wikidata. Wörterbuchgestütztes Matching und Fehleranalysen generieren priorisierte Korrekturlisten und Qualitätsmetriken; identifizierte Inkonsistenzen werden hinsichtlich ihrer Auswirkungen auf Downstream-Aufgaben (z. B. maschinelle Übersetzung) evaluiert und fließen in Regelverfeinerungen und Unicode-Vorschläge ein. Zu den Ergebnissen zählen ein Quality-Assurance-Harness für Keilschrift-Rendering, die Integration von Schriftvarianten sowie ein offenes, testbares Rahmenwerk zur Zeichennormalisierung, das philologische Genauigkeit mit Maschinenverarbeitbarkeit verbindet. Insgesamt wird gezeigt, wie born-digital Workflows eine belastbare, nachnutzbare Infrastruktur für die computergestützte Assyriologie schaffen.
Zeit & Ort
24.10.2025 | 16:00 - 18:00
Berlin-Brandenburgische Akademie der Wissenschaften
Unter den Linden 8
10117 Berlin
Lise-Meitner-Saal (Gebäude der Staatsbibliothek Berlin, Eingang Unter den Linden)
&
online