Korpus súdnych rozhodnutí

Korpus súdnych rozhodnutí obsahuje texty súdnych rozhodnutí zverejnené v rámci Iniciatívy pre otvorené vládnutie.

Vyhľadávanie v korpuse (NoSketch Engine)

Morfologická anotácia & lematizácia: MorphoDita, syntaktická anotácia: UDPipe, vizualizácia: conllu viewer.

Korpus na stiahnutie vo vertikálnom formáte: od-justice-2.0.ver.xz (24 GB)

Popis atribútov

word

slovný tvar

lemma

základný tvar slova

tag

morfologická značka

guess

1 ak ide o známe slovo, prítomné v morfologickej databáze; inak 0 (t.j. lema a morfologická značka boli hádané)

prec

počet možných kombinácií lemma+tag, medzi ktorými sa tagger rozhodoval

head

poradové číslo slova vo vete, na ktoré sa syntakticky viaže aktuálne slovo – použité pri zobrazení syntaktickej anotácie

deprel

typ syntaktickej väzby (podľa Universal Depenencies)

lc

slovný tvar (konverzia na malé písmená)

Popis štruktúr

doc

dokument (súdne rozhodnutie)

doc.date

dátum vzniku dokumentu (podľa ISO 8601)

doc.url

URL dokumentu

doc.court

názov súdu

doc.zn

spisová značka

doc.wordcount

počet slov v dokumente

doc.tokcount

počet tokenov v dokumente (vrátane interpunkcie)

doc.tokcountdd

počet tokenov v dokumente po odstránení duplicitných odsekov

p

odsek

p.dup

0, ak odsek nie je duplicitný; 1, ak je

s

veta

g

na tomto mieste medzi tokenami nebola medzera

Predchádzajúce korpusy súdnych rozhodnutí