{"id":6530,"date":"2022-02-22T16:32:29","date_gmt":"2022-02-22T15:32:29","guid":{"rendered":"https:\/\/beta.serbski-institut.de\/publikacije\/online-publikacije\/wjace-hornjoserbskeho\/hornjoserbski-tekstowy-korpus-hotko\/informacije-wo-hornjoserbskim-tekstowym-korpusu\/"},"modified":"2022-02-22T16:32:29","modified_gmt":"2022-02-22T15:32:29","slug":"informacije-wo-hornjoserbskim-tekstowym-korpusu","status":"publish","type":"page","link":"https:\/\/www.serbski-institut.de\/os\/publikacije\/online-publikacije\/wjace-hornjoserbskeho\/hornjoserbski-tekstowy-korpus-hotko\/informacije-wo-hornjoserbskim-tekstowym-korpusu\/","title":{"rendered":"Informacije wo hornjoserbskim tekstowym korpusu"},"content":{"rendered":"<p>Hornjoserbski tekstowy korpus je zb\u011brka hornjoserbskich tekstow za korpusowe re\u0161er\u0161e, w\u00f3n ma w pr\u011bnim rjed\u017ae s\u0142u\u017ei\u0107 za linguistiske p\u0159epytowanja, m\u00f3\u017ee pak te\u017e za stawiznarjow, wjesnych chronistow a druhich zajimcow wu\u017eitny by\u0107.<br \/>\nHornjoserbski tekstowy korpus wobsahuje publicistiske, beletristiske, nabo\u017ene a w\u011bdomostne teksty n\u011bhd\u017ae wot po\u0142ojcy 19. l\u011btstotka ha\u010d do p\u0159itomnos\u0107e, zap\u0159ijaty je te\u017e rjad s\u0142ownikow. W\u00f3n ma tuchwilu n\u011bkak 44 milionow tokenow (b\u011b\u017enych s\u0142ownych formow). Digitalna zb\u011brka tekstow je nasta\u0142a w zhromadnym d\u017a\u011ble r\u011b\u010despytneho wotrjada Serbskeho instituta a Serbskeje centralneje biblioteki. Najwjet\u0161i pod\u017a\u011bl matej w hornjoserbskim tekstowym korpusu publicistika (57 %) a beletristika (23 %). Wjac ha\u010d po\u0142ojca tekstow pochad\u017aa z najm\u0142\u00f3d\u0161eho \u010dasa po politiskim p\u0159ewr\u00f3\u0107e 1989\/1990 (54 %). D\u017aakowano zr\u011b\u010denju z Ludowym nak\u0142adnistwom Domowina a R\u011b\u010dnym centrumom WITAJ smy m\u00f3hli wob\u0161\u011brnu zb\u011brku aktualnych tekstow za re\u0161er\u0161owanje sp\u0159istupni\u0107. P\u0159i wu\u017eiwanju korpusa maja so tu\u017e awtorske prawa wobked\u017abowa\u0107.<br \/>\nD\u017a\u011bl tekstow p\u0159edle\u017ei w historiskim prawopisu (hlej <a class=\"link_in\" title=\"lokalny link prawopisne warianty\" href=\"https:\/\/www.serbski-institut.de\/veroeffentlichung\/online-publikationen\/mehr-obersorbisch\/hornjoserbski-tekstowy-korpus-hotko\/prawopisne-warianty\/\" rel=\"noopener\">prawopisne warianty<\/a> ). To potrjechi w zasad\u017ae pom\u011brnje ma\u0142y d\u017a\u011bl tekstow z 19. l\u011btstotka, pisanje kh za d\u017aensni\u0161e ch na spo\u010datku morfemow a mjechke \u0155 pak namakatej so te\u017e hi\u0161\u0107e w tekstach nastatych do l\u011bta 1945. <span style=\"color: #ff0000;\">Teksty su so z wulkeho d\u017a\u011bla z programami za OCR za\u010ditali a njejsu falowaceho personala dla dokorigowane, tohodla dyrbi so zd\u017a\u011bla ze zmylkami li\u010di\u0107.<\/span> W Hornjoserbskim tekstowym korpusu m\u00f3\u017ee so z pomocu <a class=\"link_in\" title=\"lokalny link regularnych wurazow\" href=\"https:\/\/www.serbski-institut.de\/veroeffentlichung\/online-publikationen\/mehr-obersorbisch\/hornjoserbski-tekstowy-korpus-hotko\/regularne-wurazy\/\" rel=\"noopener\">regularnych wurazow<\/a> pyta\u0107.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hornjoserbski tekstowy korpus je zb\u011brka hornjoserbskich tekstow za korpusowe re\u0161er\u0161e, w\u00f3n ma w pr\u011bnim rjed\u017ae s\u0142u\u017ei\u0107 za linguistiske p\u0159epytowanja, m\u00f3\u017ee pak te\u017e za stawiznarjow, wjesnych chronistow a druhich zajimcow wu\u017eitny by\u0107. Hornjoserbski tekstowy korpus wobsahuje publicistiske, beletristiske, nabo\u017ene a w\u011bdomostne teksty n\u011bhd\u017ae wot po\u0142ojcy 19. l\u011btstotka ha\u010d do p\u0159itomnos\u0107e, zap\u0159ijaty je te\u017e rjad s\u0142ownikow. W\u00f3n [&hellip;]<\/p>\n","protected":false},"author":32,"featured_media":0,"parent":6447,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"footnotes":""},"class_list":["post-6530","page","type-page","status-publish","hentry"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/pages\/6530","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/users\/32"}],"replies":[{"embeddable":true,"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/comments?post=6530"}],"version-history":[{"count":0,"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/pages\/6530\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/pages\/6447"}],"wp:attachment":[{"href":"https:\/\/www.serbski-institut.de\/os\/wp-json\/wp\/v2\/media?parent=6530"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}