Slovensko-bulharský paralelný korpus
Testovacia verzia par-skbg-free-0.1 bola sprístupnená v januári 2014 v rozsahu 163 mil. tokenov (78 mil. tokenov v slovenskej časti, 85 mil. tokenov v bulharskej časti).
V korpuse sa dá vyhľadávať po registrácii v nástroji NoSketch Engine v bulharskej časti, v slovenskej časti.
Slovensko-bulharský paralelný korpus obsahuje preklady voľne dostupných textov z iných jazykov do slovenčiny a bulharčiny. Texty sú automaticky zarovnané po vetách. Slovenské texty sú automaticky morfologicky anotované tagerom Morče natrénovaným v SNK na báze tagsetu vypracovaného v Slovenskom národnom korpuse, bulharské texty sú anotované TreeTaggerom.