A tagset is a list of part-of-speech tags (POS tags for short), i.e. labels used to indicate the part of speech and sometimes also other grammatical categories (case, tense etc.) of each token in a text corpus.

MULTEXT-East Ukrainian part-of-speech tagset (version 4)

The MULTEXT-East Ukrainian part-of-speech tagset is used with Ukrainian corpora annotated by the RFTagger tool.

For more information about the tagset itself, please visit http://nl.ijs.si/ME/Vault/V4/msd/html/msd-uk.html

Therefore, the tag Vmeis-sm is to be interpreted, character by character, as follows:

V Category Verb
m Type main
e aspect perfective
i VForm indicative
s tense past
person indefinite
s number s
m gender masculine

An Example of a tag in the CQL concordance search box: [tag=”Vmeis-sm”] finds words such as: сказав, відбувся, почав (note: please make sure that you use straight double quotation marks)

Basic overview of Ukrainian part-of-speech tagset

noun N.*
verb V.*
adjective A.*
pronoun P.*
adverb R.*
adposition S.*
conjunction C.*
numeral M.*
particle Q.*
interjection I.*
abbreviation Y.*
residual X.*

Ukrainian part-of-speech tagset in detail

Specification for nouns

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Noun N частина_мови Іменник
1 Type common c тип загальний
    proper p   власна_назва
2 Gender masculine m рід чоловічий
    feminine f   жіночий
    neuter n   середній
    common c   загальний
3 Number singular s число однина
    plural p   множина
4 Case nominative n відмінок називний
    genitive g   родовий
    dative d   давальний
    accusative a   знахідний
    instrumental i   орудний
    locative l   місцевий
    vocative v   кличний
5 Animate no n істота ні
    yes y   так

Notes

  • Ukrainian pluralia tantum nouns are not encoded directly but can be identified by the absence of a value of Gender (“-“).
  • The Gender value “common” is assigned to nouns that can combine with adjectives in either feminine or masculine,e.g. сирота or either neutral or masculine gender, e.g. Самоа.

Specification for verbs

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Verb V частина_мови Дієслово
1 Type main m тип основне
    auxiliary a   допоміжне
2 Aspect progressive p вид недоконаний
    perfective e   доконаний
    biaspectual b   двовидове
3 VForm indicative i форма дійсна
    imperative m   наказова
    infinitive n   неозначена
    impersonal o   безособова
    gerund g   дієприслівник
4 Tense present p час теперішній
    future f   майбутній
    past s   минулий
5 Person first 1 особа перша
    second 2   друга
    third 3   третя
6 Number singular s число однина
    plural p   множина
7 Gender masculine m рід чоловічий
    feminine f   жіночий
    neuter n   середній

Notes

  • Gerunds are not differentiated, but could be treated as a special class of nouns, nota bene: they possess aspect.
  • No voice for Ukrainian as all verbal forms are active (adjectival/attributive participles are treated as adjectives).
  • The impersonal VForm (o) is characterized by the ending -то/-но. It exists in other Slavic languages as well, although in most of them it coincides with the neutral form of the passive adjectival participle and is classified as such. In Ukrainian, as well as in Polish, the attributive form is different from the predicative one, cf. in Ukrainian писане правило (a written rule) vs писано правило (a rule was/is written).

Specification for adjectives

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Adjective A частина_мови Прикметник
1 Type qualificative f тип якісний
    ordinal o   відносний
    participle p   дієприкметник
2 Degree positive p ступінь основний
    comparative c   вищий
    superlative s   найвищий
3 Gender masculine m рід чоловічий
    feminine f   жіночий
    neuter n   середній
    common c   загальний
4 Number singular s число однина
    plural p   множина
5 Case nominative n відмінок називний
    genitive g   родовий
    dative d   давальний
    accusative a   знахідний
    instrumental i   орудний
    locative l   місцевий
6 Definiteness short-art s форма стягнена
    full-art f   нестягнена
7 Animate no n істота ні
    yes y   так
8 Aspect progressive p вид недоконаний
    perfective e   доконаний
    biaspectual b   двовидове
9 Voice active a стан активний
    passive p   пасивний
10 Tense present p час теперішній
    past s   минулий
  • Relative adjectives (Ukr. відносні прикметники) are here labelled “o(rdinal)” for the sake of continuity with the Slovene tagset, where this term translates Slovene vrstni (pridevniki).
  • The feature “Animate” is used to differentiate between two accusative masculine forms.
  • Adjectival participles are grouped with adjectives and are characterized by voice, quasi-tense and aspect.
  • NB: Although active adjectival participles are considered ungrammatical, being a consequence of russification, they still can be found in the language use. Thus, they are not generated by the Ukrainian grammatical dictionary but codes for them are foreseen in the UGTag and the present MSD index.

Specification for pronous

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Pronoun P частина_мови Займенник
1 Type personal p тип особовий
    demonstrative d   вказівний
    indefinite i   неозначений
    possessive s   присвійний
    interrogative q   питальний
    relative r   відносний
    reflexive x   зворотній
    negative z   заперечний
    general g   загальний
    emphatic h   наголошений
2 Referent_Type possessive s додатковий_тип присвійний
3 Person first 1 особа перша
    second 2   друга
    third 3   третя
4 Gender masculine m рід чоловічий
    feminine f   жіночий
    neuter n   середній
5 Animate yes y істота так
    no n   ні
6 Number singular s число однина
    plural p   множина
7 Case nominative n відмінок називний
    genitive g   родовий
    dative d   давальний
    accusative a   знахідний
    instrumental i   орудний
    locative l   місцевий
8 Syntactic_Type nominal n синтактичний_тип іменник
    adjectival a   прикметник
    adverbial r   прислівник

Notes

  • Many pronouns can be assigned to more than one Type. The Referent_Type feature is used to show the additional feature, like possessiveness or personality. The main type is defined according to the grammatical tradition. Note: there is no PRONOUN as POS in the Ukrainian Grammatical Dictionary, pro-nouns are a class of nouns. The Syntactic_Type shows further POS distribution.
  • The emp(h)atic Type of Pronoun is used for pronoun forms ні”кому, ні”чому, ні”чим, ні”кого, etc., with complex meanings like “there is nobody/nothing (to do sth/to use for doing sth, etc.)”. Orthographically these are identical forms of negative nominal pronouns ніхто, ніщо “nobody, nothing” in oblique cases, however, with differing accent. They are referred to as either separate pronoun lexemes or predicatives in grammars. All Ukrainian emphatic pronoun forms include negation.

Specification for adverbs

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Adverb R частина_мови Прислівник
1 Degree positive p ступінь основний
    comparative c   вищий
    superlative s   найвищий

Specification for adpositions

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Adposition S частина_мови Прийменник
1 Type preposition p тип прийменник
2 Formation simple s форма простий
    compound c   складений
3 Case genitive g відмінок родовий
    dative d   давальний
    accusative a   знахідний
    instrumental i   орудний
    locative l   місцевий

Specification for conjunctions

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Conjunction C частина_мови Сполучник
1 Type coordinating c тип сурядний
    subordinating s   підрядний
2 Formation simple s форма простий
    compound c   складений

Specification for numerals

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Numeral M частина_мови Числівник
1 Form digit d форма цифра
    roman r   римська
    letter l   літера
2 Type cardinal c тип кількісний
    ordinal o   порядковий
3 Gender masculine m рід чоловічий
    feminine f   жіночий
    neuter n   середній
4 Number singular s число однина
    plural p   множина
5 Case nominative n відмінок називний
    genitive g   родовий
    dative d   давальний
    accusative a   знахідний
    instrumental i   орудний
    locative l   місцевий
6 Animate no n істота ні
    yes y   так
P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Particle Q частина_мови Частка

Specification for interjections

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Interjection I частина_мови Вигук

Specification for abbreviations

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Abbreviation Y частина_мови Скорочення

Specification for residual

P Attribute (en) Value (en) Code (en) Attribute (uk) Value (uk)
0 CATEGORY Residual X частина_мови Залишок

Ukrainian Value Index: http://nl.ijs.si/ME/Vault/V4/msd/html/msd.values-uk.html

Ukrainian MSD Index: http://nl.ijs.si/ME/Vault/V4/msd/html/msd.msds-uk.html

(This content of this page was taken from http://nl.ijs.si/ME/Vault/V4/msd/html/msd.attributes-uk.html CC BY-SA 3.0)

Ukrainian text corpora in Sketch Engine

Sketch Engine offers several Ukrainian language corpora.

or