Databázy, portály a nástroje
Portály a databázy
- Slovníkový portál
- Terminologický portál
- Lexika slovenských terénnych názvov
- Etymologická databáza slovenskej lexiky
- Portál Retrográdneho slovníka súčasnej slovenčiny
- Slovenský WordNet
- dataset frekvencií a ARF korpusu Araneum Slovacum VII Maximum
- Digitálny Atlas slovenského jazyka
- Mapka – aplikácia pre nárečové nahrávky na mape
Korpusy
- Slovenský národný korpus
- Korpusy ARANEA
- Korpus právnych predpisov v slovenčine
- Korpus súdnych rozhodnutí
- Chybový korpus slovenčiny
- Korpus časopisu Slovenská reč
- Korpus textov rusínskej Wikipédie
- Webový korpus slovenčiny projektu HPLT
- Syntetický korpus slovenčiny vygenerovaný veľkým jazykovým modelom
- Syntetický paralelný slovensko-česko-anglický korpus vygenerovaný veľkým jazykovým modelom
- Webový korpus slovenčiny ARANEUM + HPLT + FineWeb2
Nástroje
- mistral-sk-7b, generatívny veľký jazykový model
- Lematizácia, morfologická analýza a dezambiguácia
- Lematizácia, morfologická analýza a dezambiguácia textu bez diakritiky
- Sémantická podobnosť slov (word embeddings)
- Parafrázovanie slovenčiny (a češtiny)
- Rekonštrukcia diakritiky
- Vitvorťe si Štúrovskuo meno
- Rozpoznávanie pomenovaných entít, demo
- Automatický preklad do štúrovskej slovenčiny
- Časová závislosť výskytu slov
- Vizualizácia kolokácií
- Transliterácia slovenčiny alebo češtiny do hlaholiky