Атрибуты получения текста методами
get_text_value и
get_text_value_of_meta_token класса
MiscHelper. Битовая маска.
Пространство имен: pullenti.ner.coreТип элементов: int
Синтаксис
Python |
class GetTextAttr(IntEnum) |
Элементы
|
Имя |
Значение |
Описание |
 | NO | 0 | Не задано |
 | KEEPREGISTER | 1 | Сохранять ли регистр букв (по умолчанию, верхний регистр) |
 | FIRSTNOUNGROUPTONOMINATIVE | 2 | Первую именную группу преобразовывать к именительному падежу |
 | FIRSTNOUNGROUPTONOMINATIVESINGLE | 4 | Первую именную группу преобразовывать к именительному падежу единственному числу |
 | KEEPQUOTES | 8 | Оставлять кавычки (по умолчанию, кавычки игнорируются). К скобкам это не относится. |
 | IGNOREGEOREFERENT | 0x10 | Игнорировать географические объекты |
 | NORMALIZENUMBERS | 0x20 | Преобразовать ли числовые значения в цифры |
 | RESTOREREGISTER | 0x40 | Если все слова в верхнем регистре, то попытаться восстановить слова в нижнем регистре
на основе их встречаемости в других частях всего документа
(то есть если слово есть в нижнем, то оно переводится в нижний) |
 | IGNOREARTICLES | 0x80 | Для английского языка игнорировать артикли и суффикс 'S |