Korpus výročných správ štátnych inštitúcií SR

Špecializovaný korpus textov výročných správ štátnych inšitúcií SR gov-vs-1.0 bol vytvorený 8. 4. 2020 a zverejnený 22. 7. 2020 v rozsahu 17 864 463 tokenov. Korpus bol vytvorený z textov výročných správ štátnych inštitúcií dostupných do začiatku r. 2018.

Korpus bol vytvorený v SNK pre potreby tvorby termínov z oblasti štátnej správy v rámci projektu Slovenská terminologická databáza.

Korpus je lematizovaný a morfologicky anotovaný, pri textoch sú uvedené základné informácie o ich url a čase získania. Východiskové texty boli deduplikované na úrovni odsekov.