→English

Bibliografická a štýlovo-žánrová anotácia

Bibliografická a štýlovo-žánrová anotácia je nevyhnutnou súčasťou prvotného spracovania textov v korpuse. Informácie o identite a základnej štruktúre textu sú dôležité pri jeho archivovaní, pri citovaní používateľmi, pri štatistickom vyhodnocovaní parametrov celého korpusu či zisťovaní distribúcie jazykových prostriedkov a javov v jednotlivých druhoch textov. Zobrazuje sa v spodnej časti okna klienta Bonito po kliknutí pravým tlačidlom myši na zvolený riadok v konkordančnom zozname. Anotáciu tvorí zoznam kľúčov a im priradených hodnôt, ktoré sú buď voľné (napr. meno autora), alebo vybrané z fixnej množiny povolených hodnôt (napr. žáner). Kľúče môžu označovať štýlovo-žánrové charakteristiky textu — hlavnými kategóriami sú v tomto prípade typ textu (umelecký, publicistický, odborný text, live komunikácia), žáner (napr. báseň, román, poviedka, článok) a doména, teda vecná oblasť, ktorej sa daný text týka (napr. umelecké vedy, právo, politika, ekonómia). Tieto hlavné kategórie sa ďalej delia na podkategórie. Ostatné kľúče zaznamenávajú bibliografické údaje a iné vlastnosti textu či informácie o autorovi. Zoznam kľúčov v plnom i skrátenom názve je v nasledujúcej tabuľke. Pod príslušným názvom kľúča sa nachádza opis jeho významu a vymenúvajú sa jeho možné hodnoty (ak nie sú voľné).

Zápis dátumu

Všetky dátumy sú v ISO 8601 formáte YYYY-MM-DD, príklad 1998-05-23. Odôvodnenie: odstránenie nejednoznačnosti, ľahké triedenie podľa dátumu

Externá anotácia

Anotácia je tvorená štruktúrou kľúč-hodnota. Hodnota je vždy zapísaná ako reťazec znakov ukončený koncom riadku. Toto vylučuje viacriadkové názvy. Hodnota môže byť buď voľná (príklad: meno autora) alebo vybraná z fixnej množiny povolených hodnôt (príklad: žáner). Nepovinné flags sú tvorené množinou flagov oddelených čiarkami, z ktorých prítomnosť každého určuje konkrétnu vlastnosť hodnoty, neprítomnosť zase neprítomnosť tejto vlastnosti.Tieto hodnoty majú špeciálny význam (nie pre každý kľúč sú všetky zmysluplné):

... (tri bodky)
neurčená hodnota. Túto hodnotu sme neurčovali, prípadne ju môžeme určiť neskôr, ale apriori o nej nič nevieme povedať. Pre úplnosť, nemala by sa objaviť v skutočnej anotácii.
(prázdne miesto, prípadne iba whitespace)
to isté ako „...“. Default hodnota pri automatickej anotácii, predpokladá sa, že sa naozaj bude vyskytovať.
chýbajúci kľúč
má rovnakú hodnotu ako kľúč neurčený („...“ alebo prázdny)
XXX
neznáma hodnota. Nevieme určiť. Príklad: meno autora v novinovom článku.
YYY
neurčiteľná hodnota. Z princípu sa nedá určiť alebo nemá význam. Príklad: pohlavie autora, ak ide o kolektívne dielo, pohlavie prekladateľa, ak nejde o preložené dielo.
MIX
mix. V prípade hodnoty vyberanej z fixnej množiny je hodnota zmes iných. Príklad: pohlavie autora, ak je autor hermafrodit.
MSS
iné. V prípade hodnoty vyberanej z fixnej množiny, hodnota, ktorá nie je v danej množine určená. Príklad: pohlavie autora, ak je autor eunuch.
TTT
neznáma hodnota, ktorú treba určiť. Značka, že k danej anotácii sa nevyhnutne treba neskôr vrátiť a hodnotu doplniť.

Anotácia banky

žiadny z týchto kľúčov nie je povinné mať presne, okrem SourceId. Zoznam kľúčov je v tvare názov (skrátený názov). Pod príslušným názvom kľúča je opísaný jeho význam a vymenované sú jeho možné hodnoty (ak nie sú voľné).

Name (Name)

Origname (OrgN)

Author (Auth)

Origauthor (OrgA)

Translator (Trnr)

Translation (Trnn)

Hodnoty:

ISBN (ISBN)

ISSN (ISSN)

SourceId (ScId)

Id (Id)

Rhyme (Rhym)

Hodnoty:

Type (Type)

Hodnoty:

Subtype (SubT)

Subtype (SubT) podtyp textu — hodnoty

pre Type = img

pre Type = inf

pre Type = prf

pre Type = liv

(umelecký text)

(publicistický, informatívny text)

(odborný text)

(live komunikácia)

poe
poézia

pub
publicistika

sci
vedecká literatúra, články, odborné časopisy, učebnice pre VŠ

spk
hovorený

pro
próza

adv
reklamné materiály, reklama

pop
populárnovedecká literatúra, záujmové časopisy

wri
písomný (internet, ďalekopis, ak je používaný interaktívne, komunikácia ľudí s poruchou reči písaním a pod.)

dra
dráma

adm
administratívne texty

txb
učebnice pre stredné a základné školy

enc
encyklopédie a podobné abecedne usporiadané diela

man
manuály, návody na obsluhu, recepty, ...

Genre (Genr)

Genre (Genr) žáner — hodnoty

pre Type = img

pre Type = inf

pre Type = prf

(umelecký text)

(publicistický, informatívny text)

(odborný text)

ver
báseň

doc (dokumentárne)
zápisnica, protokol, rezolúcia, zmluva; výročná správa, uznesenie

mon
monografia

son
pieseň, libreto

ann (oznamovacie)
smernice, vyhlášky, dotazníky, inzeráty, oznámenia, ponuky

hnd
príručka

scd
divadelný scenár, divadelná hra

lst (heslovité)
zoznamy, programy, pravidlá, stanovy, obsahy, tiráže

dis
dizertácia

scf
filmový scenár, titulky k filmu

rpt (spravodajské)
správa, riport, interview, oznámenie, komuniké

rig
rigorózna práca

scr
prepis rozhlasového vysielania

anl (analytické)
úvodník, komentár, glosa, recenzia, kritika, diskusia, polemika, debata, karikatúra

dpl
diplomové, bakalárske a záverečné práce

nov
román

pbb (beletristické)
fejtón, besednica, reportáž, črta, fíčer, stĺpček

std
štúdia

col
poviedka, súbor poviedok

spc
prejavy (politické, príležitostné), príhovory

abs
abstrakt

ess
esej

dsc
diskusný, polemický/debatný príspevok

tcl
článok

dia
rozhovory

rfl
úvaha

mem
memoáre, biografie, autobiografie

ref
referát, seminárna práca

let
listy

lct
prednáška

chr
kroniky

crs
charakteristika

sen
krátke epické žánre (výroky, citáty, aforizmy, vtipy atď.)

crt
recenzia, kritika

opn
posudok

ins
pracovný návod

Subgenre (SubG)

Hodnoty:

Domain (Domn)

Hodnoty:

Subdomain (SubD)

Subdomain (SubD) subdoména — bližšie určenie odbornej oblasti — hodnoty

pre Domain = ars

pre Domain = hum

pre Domain = law

pre Domain = nat

pre Domain = tec

mus
hudba, opera, opereta, balet

his
história, archeológia

bil
zákony, nariadenia, predpisy

agr
poľnohospodárstvo

tra
doprava, spoje, telekomunikácie

cin
film

psy
psychológia

jud
judikatúry

med
medicína

ene
energetika

arc
architektúra

edu
pedagogika

jur
iné právnické texty

pha
farmácia

ind
priemysel

art
výtvarné umenie, fotografia, sochárstvo

soc
sociológia, komunikácia, médiá

zoo
zoológia

com
informatika, počítače

the
divadlo, divadelná veda a kritika

phi
filozofia, estetika

bot
botanika

bui
stavebníctvo

lit
literatúra, literárna veda a kritika

inf
knihovníctvo a informačné zdroje

bio
biológia

sta
normalizácia, štandardizácia

pol
politológia

che
chémia

lin
lingvistika

mat
matematika

eth
etnológia, etnografia, antropológia

ggr
geografia

cul
kulturológia

phy
fyzika (v tom aj astronómia)

swo
sociálna práca

met
meteorológia

geo
geológia

env
environmentalistika, ekológia

pre Domain = ecn

pre Domain = blf

pre Domain = lif

pre Domain = ins

pre Domain = gov

eco
ekonómia, bankovníctvo, obchod

rel
náboženstvo, viera, sekty

hou
domácnosť (byt, záhrada, ručné práce, kuchyňa, chovateľstvo)

nie je subdoména

uso
ústredné orgány; inštitúcie, centrá a podniky s celoštátnou pôsobnosťou

mng
manažment, riadenie

teo
teológia

fsh
odievanie, móda

sam
orgány miestnej správy a samosprávy

mer
tovaroznalectvo, spotrebiteľská oblasť

exc
nadprirodzeno, okultné vedy, mágia, astrológia

spo
šport

pre Domain = plt

tvs
odborné texty o verejnej správe a samospráve

sct
spoločenský život

nie je subdoména

amu
zábava, hra, koníčky, voľný čas, cestovanie

min
národnostné kultúry

reg
región

cnl
poradňa

clt
kultúra

Medium (Medi)

Hodnoty:

Authsex (AutS)

Hodnoty:

Lang (Lang)

Varieta (Vari)

Hodnoty:

Paragraphs (Para)

Hodnoty:

Emphasis (Emph)

Hodnoty:

Diacritics (Dcrt)

Hodnoty:

Transsex (TrnS)

Origlang (OrgL)

Date (Date)

Dateorig (OrgD)

Conglomerate (Cong)

Bogocong (Bogo)

Comment (Comn)

Corrected (Corr)

Bibliography (Bibl)