Терминология

лексема

Набор всех форм одного слова. Например, “ёж”, “ежи” и “ежам” входят в одну лексему.

Примечание

Часто не делается различия между леммой и лексемой, или термин “лемма” употребляется в значении “набор форм слова”. Но, похоже, данное выше определение все же более стандартное (см., например, см. википедию или Foundations of Statistical Natural Language Processing), поэтому в pymorphy2 набор всех форм слова называется именно лексемой.

лемма
нормальная форма слова

Каноническая форма слова (например, форма единственного числа, именительного падежа для существительных).

Примечание

В pymorphy1 и в XML-словаре из OpenCorpora слово “лемма” употребляется в значении “лексема”. Чтобы не усугублять путаницу, в pymorphy2 вместо термина “лемма” употребляется термин “нормальная форма слова”.

тег
Набор граммем, характеризующих данное слово. Например, для слова “ежам” тегом может быть 'NOUN,anim,masc plur,datv'.
граммема
Значение какой-либо грамматической характеристики слова. Например, “множественное число” или “деепричастие”. Список граммем используемого в pymorphy2 словаря можно посмотреть тут: http://opencorpora.org/dict.php?act=gram. Множество всех граммем, характеризующих данное слово, образует тег.
парадигма
словоизменительная парадигма

Образец для склонения или спряжения; правила, согласно которым можно получить все формы слов в лексеме для данного стема.

В pymorphy2 для каждого слова в словаре указано, по каким парадигмам это слово могло быть образовано; pymorphy2 также умеет предсказывать парадигму для слов, отсутствующих в словаре.

стем
Неизменяемая часть слова.

Project Versions

Предыдущий раздел

Первоначальный формат словарей (отброшенный)

На этой странице