Morfologická databáza

Morfologická databáza SNK obsahuje slovnodruhové a tvarové charakteristiky slov s priradením základného tvaru slova (lemy) ku každému konkrétnemu tvaru. V databáze sa nachádza cca 99 tisíc slov (lem) vybraných z dostupných slovníkov a doplnených o najfrekventovanejšie slová z korpusu. Ku každému základnému tvaru (leme) je priradená plná paradigma spolu so značkami zachytávajúcimi gramatické informácie. Databáza aktuálne obsahuje okolo 1,1 milióna unikátnych slovných tvarov, po zarátaní homoným je to celkovo 3,2 milióna záznamov. Používa sa pri automatickom značkovaní textov Slovenského národného korpusu.

Slovník podstatných mien je k dispozícii v slovníkovom rozhraní, kde sa ku každému tvaru generujú príklady z vybraných korpusov SNK.

Morfologická databáza sa buduje v SNK od r. 2005. Východiskovo bol využitý Model morfologickej databázy slovenčiny (Benko – Hašanová – Kostolanský, 2004), ďalší vývoj a postupy sú opísané v príslušných štúdiách a článkoch na stránke http://korpus.sk/publications.html, napr. (PDF), (PDF), (PDF).

Databázu je možné používať výlučne na vedecko-výskumné ciele v súlade s textami nasledujúcich licencií:

Súbory:

abakus      abakus      SSis1
abakus      abakusu     SSis2
abakus      abakusu     SSis3
abakus      abakus      SSis4
abakus      abakus      SSis5
abakus      abakuse     SSis6
abakus      abakusom    SSis7
abakus      abakusy     SSip1
abakus      abakusov    SSip2
abakus      abakusom    SSip3
abakus      abakusy     SSip4
abakus      abakusy     SSip5
abakus      abakusoch   SSip6
abakus      abakusmi    SSip7
abatiša     abatiša     SSfs1
abatiša     abatiše     SSfs2
abatiša     abatiši     SSfs3
abatiša     abatišu     SSfs4
abatiša     abatiša     SSfs5
abatiša     abatiši     SSfs6
abatiša     abatišou    SSfs7
abatiša     abatiše     SSfp1
abatiša     abatíš      SSfp2
abatiša     abatišiam   SSfp3
abatiša     abatiše     SSfp4
abatiša     abatiše     SSfp5
abatiša     abatišiach  SSfp6
abatiša     abatišami   SSfp7
abažúr      abažúr      SSis1
abažúr      abažúru     SSis2
abažúr      abažúru     SSis3
abažúr      abažúr      SSis4
abažúr      abažúr      SSis5
abažúr      abažúre     SSis6
abažúr      abažúrom    SSis7
abažúr      abažúry     SSip1
abažúr      abažúrov    SSip2
abažúr      abažúrom    SSip3
abažúr      abažúry     SSip4
abažúr      abažúry     SSip5
abažúr      abažúroch   SSip6
abažúr      abažúrmi    SSip7