Vizualizácia kolokácií v korpusoch

Nástroj na vizualizáciu vzdialenosti komponentov v (dvoj)slovných spojeniach v textových korpusoch.

Keďže niektoré slovné spojenia sú ustálené viac, iné menej, prostredníctvom grafického zobrazenia kolokácií sa dá vidieť, či je slovné spojenie „tesné“ alebo „voľné“, koľko slov sa medzi jednotlivými komponentmi nachádza a s akou početnosťou. Niektoré spojenia sú fixné (cica mica), pri iných môže byť druhé slovo rozvíjané inými atribútmi (dať pozor, ale aj dať veľký pozor, dať dobrý pozor, dať veľmi dobrý pozor), niekedy druhý člen "musí" byť rozvinutý («veľvyslanec kráľovstva» sa prakticky nevyskytuje, vždy je to veľvyslanec Spojeného kráľovstva, veľvyslanec Španielskeho kráľovstva, veľvyslanec Belgického kráľovstva...) a pod.

Prístup

Vyhľadávacie rozhranie je tu.

História

  • 2023-04-18: pridané nemecké korpusy
  • apríl 2023: pridané ďalšie slovenské korpusy, možnosť obmedziť kolokáciu na štruktúry korpusu (napr. vety), filtrovanie tokenov medzi slovami
  • aktuálna verza sprístupnená v marci 2023 (rodina korpusov ARANEA)
  • Nástroj na vizualizáciu kolokácií bol pôvodne sprístupnený na stránke Slovenského národného korpusu v prvej verzii dňa 30. 10. 2014 (iba pre slovenčinu, korpus prim-6.1-public-all)