Ausbau der normativen Datenbasis für die obersorbische Rechtschreibkontrolle. Ausbau der Datenbasis I (BZ, Drittmittelprojekt)

Seit 2009 arbeiteten Informatiker frei- bzw. nebenberuflich und zunächst auf eigene Initiative an einem obersorbischen Rechtschreibmodul für Microsoft Office sowie Open/LibreOffice. Die Basis bildeten der im Obersorbisch-deutschen Wörterbuch von Paul Völkel kodifizierte obersorbische Wortschatz und ein neu entwickelter morphologischer Generator. 2016 wurden von Sprachwissenschaftlern des Sorbischen Instituts die Flexionsklassendefinitionen des morphologischen Generators für die Pronomina, Numeralien und Verben einer zielgerichteten Revision unterzogen. Notwendige Korrekturen wurden in Zusammenarbeit mit dessen Entwicklern, Wito Böhmak und (extern) Bernhard Baier, in das System des Generators implementiert. Damit liegt seit Ende 2016 eine vollständig qualitätsgeprüfte Version des morphologischen Generators als Grundlage für die obersorbische Rechtschreibkontrolle vor.
2017/18 wurde in diesem Anschlussprojekt die lexikalische Basis des Generators erweitert. Eingearbeitet wurden die bisher als Äquivalente aufgenommenen sorbischen Lexeme des entstehenden deutsch-obersorbischen Wörterbuchs aus dem Bereich der Schulterminologie (ca. 15 000 Lexeme) sowie die sorbischen Äquivalente aus dem Deutsch obersorbischen Wörterbuch neuer Lexik . Damit sollte eine verbesserte Abdeckung des modernen obersorbischen Wortschatzes durch die Rechtschreibkontrolle insbesondere im Bereich des Fachwortschatzes und der neueren Lexik erreicht werden. Gleichzeitig diente die Maßnahme der Überprüfung und Weiterentwicklung des morphologischen Generators durch Einbeziehung zusätzlicher Daten.
Das Projekt wurde durch Drittmittel im Rahmen des Programms „Sorbisch in den neuen Medien“ gefördert.


Ergebnisse

Neue Version der obersorbischen Rechtschreibkontrolle mit Silbentrennung unter www.soblex.de

Projektleitung: Dr. habil. Sonja Wölke
Projektbeteiligte: Richard Bígl, Wito Böhmak, Bernhard Baier (extern)

Größe: 0.25 MB