Lematizácia, morfologická analýza
Základom klasickej počítačovej analýzy jazyka je lematizácia (nájdenie základného tvaru slova) a morfologická anotácia (určenie slovného druhu, gramatických kategórií). Na spracovanie slovenčiny používame naše jazykové modely v nástroji MorphoDiTa (rôzne korpusy) alebo spaCy (novšie korpusy SNK).