→English

Historický korpus slovenčiny

Verzia 6.0

Aktuálna verzia korpusu hist-6.0 bol sprístupnená v rozsahu 916 743 tokenov.

Oproti predchádzajúcim verziám boli doplnené texty:

Naopak táto verzia neobsahuje oproti predchádzajúcim:

Historický korpus slovenčiny obsahuje v aktuálnej verzii nasledujúce dokumenty:

Vlastný prepis:

Prevzaté texty:

Texty v Historickom korpuse slovenčiny nie sú lematizované ani morfologicky anotované, vyhľadávať sa dá pomocou tvarov slov a CQL.

Verzia 5.0

Verzia korpusu hist-5.0 bola sprístupnená 24. 2. 2020 v rozsahu 997 809 tokenov.

Historický korpus slovenčiny obsahoval nasledujúce dokumenty, z ktorých prvých päť textov bolo doplnených pre túto verziu – ide o vlastné prepisy pre túto verziu korpusu:

Vlastný prepis:

Prevzaté texty:

Texty v Historickom korpuse slovenčiny nie sú lematizované ani morfologicky anotované, vyhľadávať sa dá pomocou tvarov slov a CQL.

Verzia 4.0

Štvrtá verzia korpusu hist-4.0 bola sprístupnená 29. 11. 2016 v rozsahu 917 586 tokenov.

Oproti predchádzajúcim verziám boli doplnené korpusovo spracované texty publikované I. Kotuličom (1959), R. Kucharom (2009) a dva menšie texty publikované v Jazykovednom časopise v r. 1958.

Verzia 3.0

Tretia verzia korpusu hist-3.0 bola sprístupnená 5. 2. 2015 v rozsahu 836 393 tokenov.

Oproti predchádzajúcim verziám boli doplnené korpusovo spracované texty viacerých urbárov zo 17. storočia (publikované pod red. R. Marsinu a M. Kušíka v r. 1959).

Verzia 2.0

Druhá verzia korpusu hist-2.0 bola sprístupnená 20. 10. 2014 v rozsahu 551 973 tokenov.

Oproti prvej verzii bola doplnená o korpusovo spracované texty z publikácií Hugolín Gavlovič: Valaská škola mravúv stodola, Jozef Ignác Bajza: Weselé Učinki, a Rečeňj a o niekoľko ďalších menších historických textov.

Verzia 1.0

Prvá verzia korpusu hist-1.0 bola sprístupnená 30. 12. 2012 a obsahovala 370 758 tokenov korpusovo spracovaných textov z publikácií Pramene k dejinám slovenčiny 1., 2., 3.