Korpus právnych predpisov v slovenčine

Korpus obsahuje texty právnych predpisov (aktuálnych aj minulých) v slovenčine. Okrem automatickej lematizácie a morfologickej anotácie je korpus anotovaný aj syntakticky (ide o historicky prvý sprístupnený veľký syntakticky anotovaný slovenský korpus). Anotácie uzlov (syntaktické relácie) sú označené atribútom deprel, podľa koncepcie Universal Depenencies. Vyhľadávať podľa prepojených uzlov zatiaľ nie je možné.

Vizualizácia syntaktických štruktúr: po zobrazení anotácie dokumentu (kliknutím na referenciu (anotáciu v ľavom stĺpci) v konkordancii) je graf v odkaze na atribút štruktúry <s.tree>.

Vyhľadávanie: NoSketch Engine, morfologicá anotácia & lematizácia: MorphoDita, syntaktická anotácia: UDPipe, vizualizácia: conllu viewer; právne predpisy poskytuje právny a informačný portál Ministerstva spravodlivosti SR Slov-Lex.

História

  • verzia 0.4 bola sprístupnená dňa 16. 8. 2019; korpus právnych predpisov ku dňu 1. 7. 2019; 48 643 825 tokenov, 35 283 275 slov, 3 77 408 viet, 23 066 dokumentov; ide stále o pracovnú verziu


Projekt je spolufinancovaný Európskou úniou prostredníctvom Nástroja na prepájanie Európy.