Различные утилитки работы с текстамиПространство имен: Pullenti.Util
Синтаксис
Методы
Имя | Тип значения | Описание | |
---|---|---|---|
![]() ![]() | CompareTexts | ComapreTextsResult | Проверка совпадения строк, пробелы игнорируются |
![]() ![]() | CorrectNewlinesForParagraphs | string | Исправиление ситуации, когда текстографический формат для размещения слитного фрагмента текста разбивает его на строки (например, для PDF). Производится анализ таких ситуаций и замена переносов на пробелы. |
![]() ![]() | CorrectWhitespaces | string | Получение текста из текстового файла, при этом автоматически определяется кодировка Windows-1251 или DOS и осуществляется соответствующее преобразование (английский текст не изменяется). Также корректируются переходы на новую строку, чтобы везде были бы \r\n . |
![]() ![]() | ExtractText | string | Выделить текст из всех форматов, какие только поддерживаются (кроме архивов) |
![]() ![]() | GetWords | IList<string> | Преобразовать текст в список слов (разделителем является любой пробельный символ) |
![]() ![]() | ReadStringFromFile | string | Считывание текста из текстового файла. Кодировка файла определяется префиксом. Поддерживаются такие префиксы: EF BB BF - для UTF8 FF FE или FE FF - для Unicode, младний байт раньше Если префикс не задан, то подразумевается Windows-1251 |
![]() ![]() | WriteString1251ToFile | нет | Сохранить строку в файле в кодировке Windows-1251 |
![]() ![]() | WriteStringToFile | нет | Сохранение текста в файл. Формат UTF-8, вставляется префикс EF BB BF. |