helper
Serbski Institut Serbski Institut Mobil
Navigation
Seite vorlesen ?
korpus-collage.100021-1.jpg
In Umsetzung der UN-Behindertenrechtskonvention (UN-BRK) wurde in die Webseite des Sorbischen Instituts eine Vorlesefunktion für Deutsch implementiert. Leider ist eine entsprechende Technologie für die beiden sorbischen Schriftsprachen nicht verfügbar. Das Sorbische Institut ist sich dieser Problematik bewusst und sondiert zurzeit mit Partnern die Entwicklung einer entsprechenden Software. Außerdem bereiten sorbische Ausdrücke in deutschem Text der deutschen Vorlesefunktion erkennbar Schwierigkeiten. Wir bitten dafür um Verständnis, da wir nicht allein aus diesem Grund auf die sorbischen Ausdrücke verzichten möchten.

Die oben genannte Maßnahme wurde finanziert aus Steuermitteln auf der Grundlage des von den Abgeordneten des Sächsischen Landtags beschlossenen Haushalts.

Computerlinguistische Erschliessung ressourcenarmer Sprachen am Beispiel des Niedersorbischen (Dissertationsprojekt) (CB)

Das in der ehemaligen Abteilung für niedersorbische Forschungen erstellte diachrone niedersorbische Textkorpus ist ein nicht annotiertes Korpus unterschiedlicher Textsorten vom 16. Jh. bis heute. Es liegt im XML-Format vor, ist jedoch noch nicht weiter digital erschlossen. Für die geisteswissenschaftliche Nutzung fehlen u. a. Tokenisierung, Lemmatisierung, Annotierungen in jeglicher Form (morphologisch, syntaktisch etc.). Da das manuelle Annotieren zu aufwendig und teilweise unpraktikabel ist (zeitlicher Aufwand, Mangel an Fachkräften usw.) soll die Erschließung computergestützt umgesetzt bzw. eine sehr gute Vorlage für ergänzende manuelle Arbeiten geschaffen werden. Da es zudem an gängigen computerlinguistischen Ressourcen fehlt (keine Tagger, keine umfangreichen Parallelkorpora, im Vergleich zu „großen“ Sprachen wenige digitale Wörterbücher/Lexika/Enzyklopädien, keine hochwertigen großen Korpora), ist spezifische Forschungsarbeit zu leisten. Neue Erkenntnisse werden u. a. im Bereich der Morphologie, der Sprachähnlichkeiten mit verwandten Sprachen (Polnisch, Slowakisch, Tschechisch), mit Blick auf den Einfluss des Deutschen sowie auf diachrone Sprachvariation erwartet. Nebeneffekte des Projekts werden die Entwicklung von speziellen für das Projekt notwendigen Lexika und Tools sein sowie das Eruieren von aktuellen und zukunftsorientierten Speicherformaten für Wörterbücher, Korpora, Metadaten etc. für das SI. Diese Formate und Methoden können eine Grundlage für zukünftige Projekte bilden und sollten kompatibel zu verschiedenen bestehenden Tools/Programmen von Drittanbietern sein.
Zur Unterstützung bei der Beurteilung von Sprachdaten soll dem Projekt, ergänzend zu den laufenden Konsultationen in der Abteilung (insbesondere mit F. Kaulfürst und M. Szczepański), ein(e) weitere(r) Mitarbeiter(in) in Teilzeit zugeordnet werden. Die Finanzierung erfolgt durch die oder gemeinsam mit der HU Berlin.

Projektbearbeiter: Paul Burzlaff
Gutachter: Prof. Roland Meyer (HU Berlin), N. N. (Zweitgutachter)

30./31.01.2018 - Die Lausitz vor eintausend Jahren

Wissenschaftliche Konferenz zum eintausendsten Jahrestag des Friedens von Bautzen

Lětopis 2017/2-Doppelheft erschienen

Mit Beiträgen der internationalen Konferenz "Dimensionen kultureller Sicherheit bei ethnischen und sprachlichen Minderheiten"

13.-28. Juli 2018 Sommerkurs für sorbische Sprache und Kultur

Anmeldungen ab sofort möglich

Neuerscheinung: Schriften des Sorbischen Instituts 64

Lubina Mahling "Um der Wenden Seelenheyl hochverdient ─ Reichsgraf Friedrich Caspar von Gersdorf"

Marie Skłodowska-Curie Actions

“Expression of Interest” for hosting Fellows
SORBISCHES INSTITUT - SERBSKI INSTITUT
Bahnhofstraße/Dwórnišćowa 6
D-02625 Bautzen/Budyšin