Serbski Institut Serbski Institut Mobil
Navigation

Computerlinguistische Erschliessung ressourcenarmer Sprachen am Beispiel des Niedersorbischen (Dissertationsprojekt) (CB)

Das in der ehemaligen Abteilung für niedersorbische Forschungen erstellte diachrone niedersorbische Textkorpus ist ein nicht annotiertes Korpus unterschiedlicher Textsorten vom 16. Jh. bis heute. Es liegt im XML-Format vor, ist jedoch noch nicht weiter digital erschlossen. Für die geisteswissenschaftliche Nutzung fehlen u. a. Tokenisierung, Lemmatisierung, Annotierungen in jeglicher Form (morphologisch, syntaktisch etc.). Da das manuelle Annotieren zu aufwendig und teilweise unpraktikabel ist (zeitlicher Aufwand, Mangel an Fachkräften usw.) soll die Erschließung computergestützt umgesetzt bzw. eine sehr gute Vorlage für ergänzende manuelle Arbeiten geschaffen werden. Da es zudem an gängigen computerlinguistischen Ressourcen fehlt (keine Tagger, keine umfangreichen Parallelkorpora, im Vergleich zu „großen“ Sprachen wenige digitale Wörterbücher/Lexika/Enzyklopädien, keine hochwertigen großen Korpora), ist spezifische Forschungsarbeit zu leisten. Neue Erkenntnisse werden u. a. im Bereich der Morphologie, der Sprachähnlichkeiten mit verwandten Sprachen (Polnisch, Slowakisch, Tschechisch), mit Blick auf den Einfluss des Deutschen sowie auf diachrone Sprachvariation erwartet. Nebeneffekte des Projekts werden die Entwicklung von speziellen für das Projekt notwendigen Lexika und Tools sein sowie das Eruieren von aktuellen und zukunftsorientierten Speicherformaten für Wörterbücher, Korpora, Metadaten etc. für das SI. Diese Formate und Methoden können eine Grundlage für zukünftige Projekte bilden und sollten kompatibel zu verschiedenen bestehenden Tools/Programmen von Drittanbietern sein.
Zur Unterstützung bei der Beurteilung von Sprachdaten soll dem Projekt, ergänzend zu den laufenden Konsultationen in der Abteilung (insbesondere mit F. Kaulfürst und M. Szczepański), ein(e) weitere(r) Mitarbeiter(in) in Teilzeit zugeordnet werden. Die Finanzierung erfolgt durch die oder gemeinsam mit der HU Berlin.

Projektbearbeiter: Paul Burzlaff
Gutachter: Prof. Roland Meyer (HU Berlin), N. N. (Zweitgutachter)

9.-11.6.2017 Jungakademisches Netzwerktreffen sorabistischer Forschung

Im Sommer treffen sich JungakademikerInnen sorabistischer Forschung in Bautzen.

Marie Skłodowska-Curie Actions

“Expression of Interest” for hosting Fellows

Band 63 der Schriften des Sorbischen Instituts erschienen

Michael Richter: Deutsche Parteien in der sorbischen Oberlausitz 1945–1953.
Die politische Entwicklung in den zweisprachigen Kreisen nach dem Zweiten Weltkrieg
SORBISCHES INSTITUT - SERBSKI INSTITUT
Bahnhofstraße/Dwórnišćowa 6
D-02625 Bautzen/Budyšin