Slovo roka patrí medzi obľúbené publicistické žánre v mnohých krajinách. Kým ešte v nedávnej minulosti sa slovo roka obyčajne vyberalo na základe hlasovania verejnosti, prípadne samotných jazykovedcov, dnes už môžeme riešiť tento problém exaktnejšie – na báze analýzy korpusových dát. Na našom pracovisku sa vyvíjajú dva druhy korpusov: Webové korpusy rodiny Aranea1 sa vytvárajú od roku 2013 tak, že sa jednotlivé texty sťahujú z internetu pomocou automatizovaných nástrojov, následne sa filtrujú a deduplikujú (odstraňujú sa rovnaké alebo podobné texty), aby sa ich podoba čo najviac priblížila tradičným korpusom. O kvalite textov, vyváženosti a reprezentatívnosti je tu však ťažko hovoriť – zloženie korpusu veľmi ovplyvniť nemôžeme. Keďže však webové korpusy možno pre väčšinu jazykov vytvoriť oveľa väčšie než príslušné tradičné korpusy a obsahujú „všetko, čo možno nájsť na internete“, nebýva to s reprezentatívnosťou až také zlé. Ako sme postupovali? Na hľadanie slov, ktoré pribudli do jazyka nedávno, prípadne veľmi vzrástla frekvencia ich výskytu v korpuse, sme použili najnovšiu verziu slovenského webového korpusu Araneum Slovacum VII. Porovnávali sme podkorpus textov, ktoré pribudli do korpusu v roku 2023 so zvyškom korpusu, čiže obdobím 2013 – 2022. Rozhodli sme sa vyhlásiť výsledky v troch kategóriách:
1 Araneum, pl. aranea je latinské slovo označujúce pavúka aj pavučinu.Slovo roka
2024
2 Na prvých miestach zoznamu sa okrem „zmysluplných“ položiek nachádzajú aj chybné slová, ktoré náhodne pribudli v roku 2023, v našom prípade to bolo napríklad „odkazujúna“ (chýbajúca medzera), či „Yahhoo“ (zdvojená hláska) – vytvorený zoznam preto treba kriticky interpretovať s vedomím tohto javu.
Jazykové dáta zozbieral a zinterpretoval Ing. Vladimír Benko, PhD.