Различные утилитки работы с текстами

Пространство имен: pullenti.util

Expand
	imageСинтаксис

Методы

  Имя Тип значения Описание
Public method Staticcompare_textsTextHelper.ComapreTextsResultПроверка совпадения строк, пробелы игнорируются
Public method Staticcorrect_newlines_for_paragraphsstrИсправиление ситуации, когда текстографический формат для размещения слитного фрагмента текста разбивает его на строки (например, для PDF). Производится анализ таких ситуаций и замена переносов на пробелы.
Public method Staticcorrect_whitespacesstrПолучение текста из текстового файла, при этом автоматически определяется кодировка Windows-1251 или DOS и осуществляется соответствующее преобразование (английский текст не изменяется). Также корректируются переходы на новую строку, чтобы везде были бы \r\n .
Public method Staticextract_textstrВыделить текст из всех форматов, какие только поддерживаются (кроме архивов)
Public method Staticget_wordslistПреобразовать текст в список слов (разделителем является любой пробельный символ)
Public method Staticread_string_from_filestrСчитывание текста из текстового файла. Кодировка файла определяется префиксом. Поддерживаются такие префиксы: EF BB BF - для UTF8 FF FE или FE FF - для Unicode, младний байт раньше Если префикс не задан, то подразумевается Windows-1251
Public method Staticwrite_string_to_fileнетСохранение текста в файл. Формат UTF-8, вставляется префикс EF BB BF.
Public method Staticwrite_string1251to_fileнетСохранить строку в файле в кодировке Windows-1251