Logo der Bayerischen Akademie der Wissenschaften

QuantiSlav

Menu

QuantiSlav - Quantitative Methoden in der Slavistik

Das QuantiSlav-Projekt -- eine Kooperation zwischen der Digital Humanities-Abteilung der BAdW und dem Slavischen Seminar der Albert-Ludwigs-Universität Freiburg – befasst sich mit verschiedenen komplexen Themen aus dem Bereich der historischen slavistischen Sprachwissenschaft und dem historischen Natural Language Processing. Dabei widmet es sich zugleich der Entwicklung nachhaltiger Ressourcen und Infrastrukturen, die darauf abzielen, Wissenschaftler mit domänenspezifischen technischen Fähigkeiten auszustatten.

Das Projekt (Laufzeit 2022-2025) konzentriert sich auf das kirchenslavische schriftliche Erbe und zielt auf die Zuordnung der Entstehungszeit und des Entstehungsortes einzelner Textzeugnisse. Im 9. Jahrhundert während des Christianisierungsprozesses künstlich als Sprache zur Übersetzung biblischer und liturgischer Texte geschaffen, ist das Kirchenslavische bis heute die Sprache der Liturgie der orthodoxen slavischen Welt byzantinischer Prägung (während die römisch-katholische slavische Welt zum Latein zurückgekehrt ist). Kirchenslavisch wurde zunächst in einer eigens für diesen Zweck geschaffenen Schrift geschrieben, die jedoch bereits in frühester Zeit durch eine an das griechische Schriftbild angelehnte Schrift ersetzt wurde, und die wir mit nur wenigen Modifikationen auch heute noch als Kyrillica kennen. Sprache und Orthographie waren im Verlauf der Jahrhunderte verschiedenen kulturellen Einflüssen ausgesetzt. Vor allem mit dem Hinzukommen weiterer, nichtliturgischer Texte und regionaler Neuübersetzungen haben volkssprachliche Elemente Einzug erhalten, die spezifische Redaktionen des Kirchenslavischen formten. Zugleich beförderten und behinderten Innovationsprozesse und Rearchaisierungstendenzen die Entwicklung dieser Schriftsprache.

Im Rahmen des QuantiSlav-Projekts bereiten wir eine umfangreiche Textsammlung vormoderner kirchenslavischer kyrillischer Texte (die Großen Lesemenäen des Metropoliten Makarij aus dem 16.-17. Jh.) digital auf. Ein zentraler Forschungsschwerpunkt liegt auf der Diagnose von Fehlern und der Verbesserung der Ergebnisse von Erkennungsprogrammen handschriftlicher Texte (HTR). Mit Hilfe sprachtechnologischer Ansätze erstellen wir einen Benchmark-Korpus dieser größtenteils unedierten Texte, der mehrere Millionen Token umfasst. Die derart aufbereiteten Daten ermöglichen es, orthographische und grammatikalische Variationen zu identifizieren und sie bestimmten geografischen Regionen und zeitlichen Abschnitten zuzuordnen, sei es halbautomatisch oder mithilfe von Methoden des maschinellen Lernens. Eine praktische Zielsetzung des Projekts ist die automatische Datierung und Lokalisierung von Texten, die in vormodernen Varianten des Kirchenslavischen verfasst wurden.

Förderung

Das QuantiSlav-Projekt wird als Fördermaßnahme aus der Aufbau- und Resilienzfazilität der EU finanziert und gemäß der Richtlinie zur Förderung von Projekten zur Stärkung der Datenkompetenzen des wissenschaftlichen Nachwuchses vom Bundesministerium der Bildung und Forschung gefördert (Förderkennzeichen: 16DKWN123B).