A tagset is a list of part-of-speech tags (POS tags for short), i.e. labels used to indicate the part of speech and sometimes also other grammatical categories (case, tense etc.) of each token in a text corpus.

Lithuanian part-of-speech tagset

This Lithuanian part-of-speech tagset is available in the Morphologically Annotated Lithuanian Corpus (MATAS) which was performed manually.

An Example of a tag in the CQL concordance search box: [tag="noun.*"] finds all nouns, e.g. darbo, kartą, metais (note: please make sure that you use straight double quotation marks)

Category Subcategory (English) Subcategory (Lithuanian) PoS Tag
POS noun daiktavardis dkt.
adjective būdvardis bdv.
numeral skaitvardis sktv.
pronoun įvardis įv.
verb veiksmažodis vksm.
adverb prievieksmis prv.
interjection jaustukas jst.
onomatopoeia ištiktukas išt.
particle dalelytė dll.
preposition prielinksnis prl.
conjunction jungtukas jng.
acronym akronimas akronim.
abbreviation sutrumpinimas sutr.
Roman numbers romėniški skaičiai rom. sk.
stable phrases stabiliosios frazės idprl, idPS
residual likę nežinomas
Noun type proper Tikrinis tikr.
common Bendrinis
Verb main pagrindinis
infinitive bendratis bendr.
participle dalyvis dlv.
adverbial participle padalyvis pad.
half participle pusdalyvis pusd.
adverbial participle2 būdinys būdn.
Mood indicative mood tiesioginė nuosaka tiesiog. n.
imperative mood liepiamoji nuosaka liep. n.
subjective mood tariamoji nuosaka tar. n.
Numerals cardinal kiekinis kiek.
ordinal kelintinis kelint.
multiple dauginis daugin.
collective kuopinis kuopin.
Defineteness pronominal įvardžiuotinis įvardž.
non-pronominal neįvardžiuotinis neįvardž.
Reflexivity reflexive sangrąžinis sngr.
non-reflexive nesangrąžinis nesngr.
Voice active veikiamoji rūšis veik. r.
passive neveikiamoji rūšis neveik. r.
necessity reikiamybės reik.
Tense present tense esamasis laikas es. l.
past tense būtasis kartinis laikas būt. k. l.
past frequentative case būtasis dažninis laikas būt. d. l.
future tense būsimasis laikas būs. l.
simple past būtasis laikas būt. l.
Degree positive nelyginamasis laipsnis nelygin. l.
comparative aukštesnysis laipsnis aukšt. l.
superlative aukščiausiasis laipsnis aukšč. l.
Gender feminine moteriškoji giminė mot. g.
masculine vyriškoji giminė vyr. g.
neuter bevardė giminė bev. g.
common bendroji giminė bendr. g.
Number singular vienaskaita vns.
plural daugiskaita dgs.
dual dviskaita dvisk.
Case nominative vardininkas V.
genitive kilmininkas K.
dative naudininkas N.
accusative galininkas G.
instrumental įnagininkas Įn.
locative vietininkas Vt.
vocative šauksmininkas Š.
illiative iliatyvas Il.
Person 1st pirmasis asmuo 1 asm.
2nd antrasis asmuo 2 asm.
3rd trečiasis asmuo 3 asm.
Positive/negative positive teigiamas teig.
negative neigiamas neig.
Phrases idprl. (pvz., be to), stable phrases
idjngt. (pvz., ir kt.),
idPS (p. s., taip žymimas junginio post scriptum sutrumpinimas)

Lithuanian text corpora in Sketch Engine

Sketch Engine offers dozens of Lithuanian language corpora.

or