0.3 (2013-03-11)
- Рефакторинг: теперь при необходимости можно дописывать свои
“шаги” морфологического анализа (“предсказатели”)
и комбинировать их с существующими (документация пока не готова,
и API может поменяться);
- на вход больше не обязательно подавать слова в нижнем регистре
(но на выходе при этом регистр сохраняться не обязан - используйте
функцию pymorphy2.shapes.restore_word_case, если требуется
восстановить регистр полученных слов);
- улучшено предсказание неизвестных слов по словообразовательным префиксам
(учитывается больше таких префиксов);
- реализован разбор (и склонение) слов с дефисами;
- результаты разбора теперь включают в себя полную информацию о том,
как слово разбиралось; наличие para_id и idx при этом
больше не обязательно;
- анализатор теперь отмечает пунктуацию тегом PNCT, числа - тегом NUMB,
слова, записанные латиницей - тегом LATN;
- улучшено предсказание по неизвестному префиксу (добавлено ограничение по
граммеме Apro);
- улучшения в тестах и бенчмарках;
- удален атрибут morph.dict_meta (используйте morph.dictionary.meta);
- удален (возможно, временно) метод MorphAnalyzer.inflect
(используйте метод inflect у результата разбора);
- удален метод MorphAnalyzer.decline (используйте parse.lexeme);
- удалено свойство Parse.paradigm.
В результате этих изменений улучшилось качество разбора, качество склонения
и возможности по расширению библиотеки (втч для настройки под конкретную
задачу), но скорость работы “из коробки” по сравнению с 0.2 снизилась
примерно на треть.
0.1 (2013-02-14)
Первый альфа-релиз. Релизована основа: эффективный разбор и склонение,
обновление словарей, полная поддержка буквы ё.
Многие вещи, которые были доступны в pymorphy, пока не работают
(разбор слов с дефисом, разбор фамилий, поддержка шаблонов django,
утилиты из contrib).
Кроме того, API пока не зафиксирован и может меняться в последующих релизах.