Multilingual Resources for CEF.AT in the legal domain (MARCELL)

2018-10-01 – 3/2021-03-31

Zodpovedný riešiteľ: Radovan Garabík

Spoluriešiteľ z SAV: Ivor Uhliarik

Anotácia: Cieľom projektu je spracovanie dvoch zdrojov, ktoré sú k dispozícii vo všetkých siedmich príslušných jazykoch partnerských organizácií, a to a) viacjazyčného, na ontológii založeného tezaura EUROVOC a b) korpusov všetkých vnútroštátnych právnych predpisov v príslušných jazykoch. Očakávané výsledky: 1) Sedem rozsiahlych predbežne spracovaných (tokenizovaných a morfologicky anotovaných) jednojazyčných korpusov národných legislatívnych dokumentov klasifikovaných podľa EUROVOC deskriptorov, obohatených o anotáciu pojmov/tém EUROVOC a IATE. 2) Porovnateľný korpus siedmich jazykov zarovnaných na úrovni tém určených podľa EUROVOC deskriptorov. 3) Chorvátsko-anglický paralelný korpus pozostávajúci z približne 1 800 legislatívnych dokumentov.

Projekt bol spolufinancovaný Európskou úniou prostredníctvom Nástroja na prepájanie Európy.