Aktuality
O nás
Stanovy
Výkonný výbor (…)
Pobočky
Členovia (…)
Členské poplatky
Podujatia (…)
Publikácie (…)
Celoslovenské stretnutia jazykovedcov (…)
Kolokvium mladých jazykovedcov (…)
Fotogaléria
Kontakty

Tento týždeň blahoželáme

  • Ľudmile Liptákovej
  • Ľubici Balážovej

Novinky na stránke


Archív noviniek

Slovenská jazykovedná spoločnosť

pri Jazykovednom ústave Ľ. Štúra SAV, v. v. i.

Slovenská jazykovedná spoločnosť pri Jazykovednom ústave Ľ. Štúra SAV, v. v. i.,

vás srdečne pozýva na jubilejnú prednášku

Ing. Vladimíra Benka, PhD.,

s názvom

Lematizácia a morfosyntaktická anotácia korpusu metódou „miešaného zboru“,

ktorá sa uskutoční

11. júna 2024 o 14.00 hod.

v zasadacej miestnosti Jazykovedného ústavu Ľ. Štúra SAV, v. v. i. (Panská 26, Bratislava).

Prednáška bude vysielaná aj prostredníctvom aplikácie Zoom.


TÉZY PREDNÁŠKY
Ako „zborové“ („ensemble“) sa v počítačovej lingvistike označujú metódy, pri ktorých sa určitá operácia uskutočňuje pomocou niekoľkých nezávislých nástrojov, pričom sa očakáva, že agregáciou ich výstupov sa docieli celkové zlepšenie výsledku. V kontexte lingvistickej anotácie korpusových dát potom hovoríme o „zborovej lematizácii“ („ensemble lemmatization“), prípadne „zborovom tagovaní“ („ensemble (PoS) tagging“). Využíva sa pri tom skutočnosť, že chyby, ktoré vykazujú jednotlivé nástroje sa obyčajne nevyskytujú na rovnakých pozíciách v texte.
V prednáške predstavíme použitie zborovej metódy pri anotácii najnovších verzií niekoľkých slovenských korpusov, pričom okrem štandardných tagerov a lematizátora sa využili aj lexikálne a morfologické dáta získané z niekoľkých slovenských elektronických slovníkov, korektora pravopisu a anglického a českého jazykového modelu (na detekciu cudzojazyčných fragmentov v texte) – tento postup sme preto nazvali „miešaným zborom“. Vzhľadom na to, že naše korpusy sú určené na lexikografické použitie, aj v tomto prípade bola prioritou lematizácia (najmä) slov nenachádzajúcich sa v morfologických lexikónoch jednotlivých nástrojov, čiže potenciálnych neologizmov vhodných na zaradenie do heslára pripravovaného slovníka.


Informácie k prihláseniu sa do aplikácie Zoom

  • Prihlasovacie údaje na prednášku – odkaz; Meeting ID: 823 8785 2397, Passcode: 790136
  • V prípade, že MÁTE vo svojom PC nainštalovanú aplikáciu Zoom, po kliknutí na odkaz uvedený vyššie sa zobrazí webová stránka s možnosťou Launch Meeting. Po kliknutí na ňu budete automaticky presmerovaní na prednášku cez svoju aplikáciu v počítači.
  • V prípade, že NEMÁTE vo svojom PC nainštalovanú aplikáciu Zoom, po kliknutí na odkaz uvedený vyššie sa zobrazí webová stránka s možnosťou Launch Meeting, pod ktorou sa menším písmom nachádza text Having issues with Zoom Client? Join from Your Browser. Po kliknutí na odkaz Join from Your Browser budete presmerovaní na prednášku cez webový prehliadač.