Jazykovedný ústav Ľudovíta Štúra

Slovenskej akadémie vied, v. v. i.

O ústave
Zameranie a činnosť Pracovníčky a pracovníci Štruktúra Vnútorné predpisy Správy o činnosti a akreditácie Výtlačok pre SNK Zverejňovanie Ochrana osobných údajov, GDPR Plán rodovej rovnosti
Veda a výskum
Projekty Doktorandské štúdium a stáže Konferencie Popularizácia vedy
Zdroje
Slovníkový portál Jazyková poradňa Slovenský národný korpus Publikácie Časopisy Databázy a nástroje Odkazy
SJS
Kontakt
🔍
Hľadať:
  • Najčastejších 2000 slov z korpusu prim‑7.0‑public‑vyv, anotovaných podľa jazyka, z ktorého bolo slovo prevzaté: «↓». Creative Commons Attribution-ShareAlike 4.0 International. Citácia: GARABÍK Radovan – KARČOVÁ Agáta: Frekvencia lexikálnych jednotiek cudzieho pôvodu v slovenčine. In: Slovenská reč, Vol. 84, No 1, 2019, pp. 26–46.
  • Zoznam štruktúr (počet, originál, revízia) korpusu CHIBY v0.4 – chybový korpus založený na revíziách slovenskej Wikipédie: spelling, lexicosemantic, punct, typographical, diacritics, unclassified. Creative Commons Attribution-ShareAlike 4.0 International.
  • Zoznam štruktúr (počet, originál, revízia) korpusu CHIBY v0.3 – chybový korpus založený na revíziách slovenskej Wikipédie: spelling, lexicosemantic, punct, typographical, diacritics, unclassified. Creative Commons Attribution-ShareAlike 4.0 International.
  • Korpus slovenských právnych predpisov:
    • k 2022-02-01, v1.9 – celý korpus vo vertikálnom formáte:legal-sk-20220322-1.9.ver.xz
    • k 2020-12-01, v1.4 – celý korpus vo vertikálnom formáte:legal-sk-20210129-1.4.ver.xz, a vo formáte CoNLL-U Plus: legal-sk-20210129-1.4.conllup.xz
    • staršia verzia k 2019-07-01, v1.0 – celý korpus vo formáte CoNLL-U Plus: «↓»
  • 基于Hanku和Litchi语料库的普通话词嵌入模型 / Word embeddings for Pǔtōnghuà trained on the Hanku and Litchi corpora:
    • 词: zh.word.hanku+zhlit1.1word2vec.txt.xz
    • 字: zh.char.hanku+zhlit1.1word2vec.txt.xz
    • pinyin: zh.pinyin.hanku+zhlit1.1word2vec.txt.xz
  • Automaticky preložený a filtrovaný korpus CNEC 2.0, preklad pomocou MOSES-a, preklad pomocou Google Translate; modely pre NameTag 1: trivial, morphodita. CC BY-NC-SA 3.0. Viac informácií.
Jazykovedný ústav Ľ. Štúra SAV, v. v. i., Panská 26, 811 01 Bratislava, tel. +421 2 5443 1761, f X ჻