Атрибуты получения текста методами get_text_value и get_text_value_of_meta_token класса MiscHelper. Битовая маска.

Пространство имен: pullenti.ner.core

Тип элементов: int

Expand
	imageСинтаксис

Элементы

  Имя Значение Описание
Public constructorNO0Не задано
Public constructorKEEPREGISTER1Сохранять ли регистр букв (по умолчанию, верхний регистр)
Public constructorFIRSTNOUNGROUPTONOMINATIVE2Первую именную группу преобразовывать к именительному падежу
Public constructorFIRSTNOUNGROUPTONOMINATIVESINGLE4Первую именную группу преобразовывать к именительному падежу единственному числу
Public constructorKEEPQUOTES8Оставлять кавычки (по умолчанию, кавычки игнорируются). К скобкам это не относится.
Public constructorIGNOREGEOREFERENT0x10Игнорировать географические объекты
Public constructorNORMALIZENUMBERS0x20Преобразовать ли числовые значения в цифры
Public constructorRESTOREREGISTER0x40Если все слова в верхнем регистре, то попытаться восстановить слова в нижнем регистре на основе их встречаемости в других частях всего документа (то есть если слово есть в нижнем, то оно переводится в нижний)
Public constructorIGNOREARTICLES0x80Для английского языка игнорировать артикли и суффикс 'S