Viacjazyčné zdroje pre CEF.AT v oblasti práva (MARCELL)
Multilingual Resources for CEF.AT in the legal domain (MARCELL)
2018 – 2020
Zodpovedný riešiteľ: Radovan Garabík
Spoluriešiteľ z SAV: Ivor Uhliarik
Anotácia: Cieľom projektu je spracovanie dvoch zdrojov, ktoré sú k dispozícii vo všetkých siedmich príslušných jazykoch partnerských organizácií, a to a) viacjazyčného, na ontológii založeného tezaura EUROVOC a b) korpusov všetkých vnútroštátnych právnych predpisov v príslušných jazykoch. Očakávané výsledky: 1) Sedem rozsiahlych predbežne spracovaných (tokenizovaných a morfologicky anotovaných) jednojazyčných korpusov národných legislatívnych dokumentov klasifikovaných podľa EUROVOC deskriptorov, obohatených o anotáciu pojmov/tém EUROVOC a IATE. 2) Porovnateľný korpus siedmich jazykov zarovnaných na úrovni tém určených podľa EUROVOC deskriptorov. 3) Chorvátsko-anglický paralelný korpus pozostávajúci z približne 1 800 legislatívnych dokumentov.