→English

Korpus textov z Wikipédie a Necyklopédie

Tretia verzia korpusu wiki-2016-02 bola sprístupnená 8. 3. 2016 v rozsahu 42 615 597 tokenov.

Korpus wiki obsahuje slovenské texty z Wikipédie a Necyklopédie dostupné k 26. 2. 2016.

Korpus je lematizovaný a morfologicky anotovaný, pri textoch je uvedená informácia o ich zdroji.

Verzia 2.0

Druhá verzia korpusu wiki-2015-02 bola sprístupnená 6. 3. 2015 v rozsahu 40 248 220 tokenov. Obsahovala slovenské texty z Wikipédie a Necyklopédie dostupné k 28. 2. 2015.

Verzia 1.0

Prvá verzia korpusu wiki-2014-02 bola sprístupnená 25. 2. 2014 v rozsahu 37 548 997 tokenov.