Najčastejších 2000 slov z korpusu prim‑7.0‑public‑vyv, anotovaných podľa jazyka, z ktorého bolo slovo prevzaté: «↓». Creative Commons Attribution-ShareAlike 4.0 International. Citácia: GARABÍK Radovan – KARČOVÁ Agáta: Frekvencia lexikálnych jednotiek cudzieho pôvodu v slovenčine. In: Slovenská reč, Vol. 84, No 1, 2019, pp. 26–46.
Zoznam štruktúr (počet, originál, revízia) korpusu CHIBY v0.3 – chybový korpus založený na revíziách slovenskej Wikipédie: spelling, lexicosemantic, punct, typographical, diacritics, unclassified. Creative Commons Attribution-ShareAlike 4.0 International.
Korpus slovenských právnych predpisov:
k 2020-12-01, v1.4 – celý korpus vo vertikálnom formáte:legal-sk-20210129-1.4.ver.xz, a vo formáte CoNLL-U Plus: legal-sk-20210129-1.4.conllup.xz
staršia verzia k 2019-07-01, v1.0 – celý korpus vo formáte CoNLL-U Plus: «↓»
基于Hanku和Litchi语料库的普通话词嵌入模型 / Word embeddings for Pǔtōnghuà trained on the Hanku and Litchi corpora: