Korpus súdnych rozhodnutí
Korpus súdnych rozhodnutí obsahuje texty súdnych rozhodnutí zverejnené v rámci Iniciatívy pre otvorené vládnutie.
Toto nie je podkorpus Slovenského národného korpusu, ani nevznikol v Oddelení Slovenského národného korpusu, ale úplne nezávisle.
Vyhľadávanie v korpuse (NoSketch Engine)
Morfologická anotácia & lematizácia: MorphoDita, syntaktická anotácia: UDPipe, vizualizácia: conllu viewer.
Korpus na stiahnutie vo vertikálnom formáte: od-justice-2.0.ver.xz (24 GB)
Popis atribútov
word |
slovný tvar |
lemma |
základný tvar slova |
tag |
morfologická značka |
guess |
1 ak ide o známe slovo, prítomné v morfologickej databáze; inak 0 (t.j. lema a morfologická značka boli hádané) |
prec |
počet možných kombinácií lemma+tag, medzi ktorými sa tagger rozhodoval |
head |
poradové číslo slova vo vete, na ktoré sa syntakticky viaže aktuálne slovo – použité pri zobrazení syntaktickej anotácie |
deprel |
typ syntaktickej väzby (podľa Universal Depenencies) |
lc |
slovný tvar (konverzia na malé písmená) |
Popis štruktúr
doc |
dokument (súdne rozhodnutie) |
doc.date |
dátum vzniku dokumentu (podľa ISO 8601) |
doc.url |
URL dokumentu |
doc.court |
názov súdu |
doc.zn |
spisová značka |
doc.wordcount |
počet slov v dokumente |
doc.tokcount |
počet tokenov v dokumente (vrátane interpunkcie) |
doc.tokcountdd |
počet tokenov v dokumente po odstránení duplicitných odsekov |
p |
odsek |
p.dup |
0, ak odsek nie je duplicitný; 1, ak je |
s |
veta |
g |
na tomto mieste medzi tokenami nebola medzera |
Predchádzajúce korpusy súdnych rozhodnutí
- Predchádzajúci korpus textov súdnych rozhodnutí z textov zverejnených v rámci Iniciatívy pre otvorené vládnutie: od-justice-1.0 (= 0.1) (2018). Korpus na stiahnutie vo vertikálnom formáte: od-justice-0.1.ver.xz (3.5 GB)
- Korpus súdnych rozhodnutí https://korpus.sk/korpus-sudnych-rozhodnuti/ (2015)