Lematizácia, morfologická analýza

Základom klasickej počítačovej analýzy jazyka je lematizácia (nájdenie základného tvaru slova) a morfologická anotácia (určenie slovného druhu, gramatických kategórií). Na spracovanie slovenčiny používame naše jazykové modely v nástroji MorphoDiTa (rôzne korpusy) alebo spaCy (novšie korpusy SNK).

Webové rozhranie

Morfologická databáza

Docker

Lematizácia a morfologická anotácia (MorphoDiTa) je dostupná aj ako docker image: https://hub.docker.com/r/julssav/sk_morpho.

Citácia

Radovan Garabík, Denis Mitana (2023): Analysing Accuracy of Slovak Language Lemmatization and MSD Tagging. In: Slovenská reč, 88(2):129–140.

© 2026 Oddelenie počítačového spracovania prirodzeného jazyka