Digital Classicist Seminar: "Evaluating Cuneiform in the World Wide Web: fantastic use cases and where to find them"
Lecture by Adam Anderson
Zoom link
https://hu-berlin.zoom-x.de/j/62272165290?pwd=DmvBO97b3JAJIutndWU2bBILGaJ3AX.1
Abstract
Diese Studie adressiert die digitale Repräsentation der Keilschrift als frühester mehrsprachiger Orthographie und zeigt, wie deren historische Polyvalenz und Formatheterogenität reproduzierbare Forschung bis heute erschweren. Aufbauend auf einem UC-Berkeley-Discovery-Projekt (seit 2021) wird ein zweistufiger Ansatz vorgestellt: (1) eine dokumentorientierte Pipeline zur strukturerhaltenden, auditierbaren Umwandlung von Transliteration nach Unicode, und (2) eine zeichenbasierte Pipeline für großskalige NLP-Szenarien. Auf Basis systematischer Vergleiche zentraler digitalen Zeichenlisten (u. a. OSL, Nuolenna, CuneiML, Text-Fabric, Akkademia) entsteht eine harmonisierte Ontologie mit transparenter Provenienz und Publikation der Zeichenwerte als Linked Data in Wikidata. Wörterbuchgestütztes Matching und Fehleranalysen generieren priorisierte Korrekturlisten und Qualitätsmetriken; identifizierte Inkonsistenzen werden hinsichtlich ihrer Auswirkungen auf Downstream-Aufgaben (z. B. maschinelle Übersetzung) evaluiert und fließen in Regelverfeinerungen und Unicode-Vorschläge ein. Zu den Ergebnissen zählen ein Quality-Assurance-Harness für Keilschrift-Rendering, die Integration von Schriftvarianten sowie ein offenes, testbares Rahmenwerk zur Zeichennormalisierung, das philologische Genauigkeit mit Maschinenverarbeitbarkeit verbindet. Insgesamt wird gezeigt, wie born-digital Workflows eine belastbare, nachnutzbare Infrastruktur für die computergestützte Assyriologie schaffen.
Time & Location
Oct 24, 2025 | 04:00 PM - 06:00 PM
Berlin-Brandenburgische Akademie der Wissenschaften
Unter den Linden 8
10117 Berlin
Lise-Meitner-Saal (Gebäude der Staatsbibliothek Berlin, Eingang Unter den Linden)
&
online