→English

Slovenský hovorený korpus

Aktuálna verzia s-hovor-5.0 v rozsahu 5 mil. 720 tisíc textových jednotiek je prístupná od apríla 2015 a obsahuje 695 nahrávok, čo je viac ako 600 hodín zvukových záznamov.

Prvá verzia s-hovor bola sprístupnená 20. 12. 2008, verzia s-hovor-2.0 v januári 2010, verzia s-hovor-3.0 vo februári 2011, verzia s-hovor-4.0 v auguste 2012.

Od verzie s-hovor-4.0 sú k dispozícii aj dva subkorpusy: s-hovor-x-upn obsahuje len prepisy výpovedí pamätníkov z projektu Oral History Ústavu pamäti národa, s-hovor-x-sane obsahuje všetky ostatné nahrávky z primárneho hovoreného korpusu. K textovým prepisom nahrávok možno pristupovať prostredníctvom klienta Bonito (v rámci registrácie do Slovenského národného korpusu) alebo prostredníctvom WWW rozhrania, v ktorom je prepis prepojený s príslušným segmentom zvukového záznamu.

Textový prepis (ortografická rovina) je lematizovaný a morfologicky anotovaný, pri prepisoch je uvedená sociolingvistická informácia o respondentoch a základné informácie o pôvode a obsahu nahrávky.

Vyhľadávať môžeme na základe konkrétneho slova, lemy alebo výslovnosti, vo výstupe nachádzame prepis podľa reálnej výslovnosti.