Коллекция разных средств лингвистического анализа

Классы

  Имя Описание
Public classAnalysisKitВнутренний аналитический контейнер данных. Создаётся автоматически внутри при вызове Processor.process(...). Все токены Token ссылаются через поле kit на экземпляр контейнера, связанного с обрабатываемым текстом.
Public classAnalyzerDataДанные, полученные в ходе обработки одним анализатором. Каждый анализатор сохраняет в своём класса свои данные, получаемые в ходе анализа. В конце процессор объединяет их все. Получить экземпляр, связанный с анализатором, можно методом AnalyzerKit.get_analyzer_data_by_analyzer_name.
Public classBracketHelperПоддержка анализа скобок и кавычек
Public classBracketSequenceTokenМетатокен - представление последовательности, обрамлённой кавычками (скобками)
Public classComplexNumComparerСравнение номеров (функцией process)
Public classComplexNumTokenПоддержка сложной нумерации разделов, пунктов, формул и т.п. (составная, возможны римские цифры, буквы)
Public classConjunctionHelperПоддержка работы с союзами (запятая тоже считается союзом). Союзы могут быть из нескольких слов, например, "а также и".
Public classConjunctionTokenМетатокен - представление союзов и других служебных слов. Они могут быть из нескольких токенов, например, "из-за того что". Получить можно с помощью ConjunctionHelper.try_parse(t)
Public classMiscHelperРазные полезные процедурки лингвистического анализа. Особо полезные функции выделены шрифтом.
Public classNounPhraseHelperВыделение именных групп - это существительное с согласованными прилагательными (если они есть).
Public classNounPhraseMultivarTokenВариант расщепления именной группы, у которой слиплись существительные. Получается методом get_multivars() у NounPhraseToken, у которой multi_nouns = true.
Public classNounPhraseTokenМетатокен - именная группа (это существительное с возможными прилагательными, морфологичски согласованными). Выделяется методом try_parse() класса NounPhraseHelper.
Public classNumberHelperРабота с числовыми значениями
Public classPrepositionHelperПоддержка работы с предлогами
Public classPrepositionTokenМетатокен - предлог (они могут быть из нескольких токенов, например, "несмотря на", "в соответствии с"). Создаётся методом PrepositionHelper.try_parse(t).
Public classSerializeHelperСериализация сущностей
Public classSingleNumTokenЭлемент составного номера
Public classSingleNumValueВозможное значение номера
Public classStatisticBigrammInfoСтатистическая информация о биграмме - возвращается StatisticCollection.get_bigramm_info
Public classStatisticCollectionСтатистическая информация о словоформах и их биграммах в тексте - поле AnalysisKit.Statistic.
Public classStatisticWordInfoСтатистическая информация о токене - возвращается StatisticCollection.get_word_info
Public classTerminТермин, понятие, система обозначений чего-либо и варианты его написания. Элемент словаря TerminCollection.
Public classTerminCollectionСловарь некоторых обозначений, терминов, сокращений. Очень полезный класс! Рассчитан на быстрый поиск токена или группы токенов среди большого списка терминов.
Public classTerminTokenМетатокен - результат привязки термина Termin словаря TerminCollection. Формируется методом TryParse или try_parse_all у TerminCollection.
Public classVerbPhraseHelperРабота с глагольными группами (последовательность из глаголов и наречий)
Public classVerbPhraseItemTokenЭлемент глагольной группы VerbPhraseToken
Public classVerbPhraseTokenМетатокен - глагольная группа (последовательность глаголов, наречий и причастий). Создаётся методом VerbPhraseHelper.try_parse.

Перечисления

  Имя Описание
Public enumBracketParseAttrАтрибуты выделения последовательности между скобок-кавычек. Битовая маска.
Public enumCanBeEqualsAttrАтрибуты функции can_be_equals_ex класса MiscHelper. Битовая маска.
Public enumComplexNumCompareTypeРезультат сравнения номеров
Public enumConjunctionTypeТипы союзов и служебных слов
Public enumGetTextAttrАтрибуты получения текста методами get_text_value и get_text_value_of_meta_token класса MiscHelper. Битовая маска.
Public enumNounPhraseParseAttrАтрибуты выделения именных групп NounPhraseHelper.try_parse(). Битовая маска.
Public enumReferentsEqualTypeАтрибут сравнения сущностей (методом Referent.can_be_equals)
Public enumSingleNumValueTypeТип значения простого номера
Public enumTerminParseAttrАтрибуты привязки токена к термину словаря TerminCollection методом TryParse. Битовая маска.