Параметры создания документа UnitextDocument функцией CreateDocument

Пространство имен: Pullenti.Unitext

Expand
	imageСинтаксис

Методы

  Имя Тип значения Описание
Public methodProgressнетВ наследной функции можно переопределить это для получения бегунка (используется для PDF, когда он очень большой, то прогресс обработки страниц)

Поля

  Имя Тип Описание
Public fieldCorrectParamsCorrectDocumentParamПараметры корректировки результата (по умолчанию, корректировать всё). Если нужно что-либо отключать, то явно задавайте здесь флажки.
Public fieldDontGenerateItemsIdboolНе генерировать Id для элементов. По умолчанию false, то есть генерировать.
Public fieldExtractPageImageContentboolИзвлекать ли картинки для страниц тексто-графических форматов (Pdf, DjVu). Используется для OCR распознаваний
Public fieldIgnoreInnerDocumentsboolДля архивов не извлекать файлы, для почтовых форматов игнорировать вложения
Public fieldIgnoreWord6boolНе разбирать документы формата Word6 и ранее (иначе выделяет из него только текст, и то не всегда правильно)
Public fieldLoadDocumentStructureboolЗагружать ли структуру документа, если есть, оформляя её через UnitextDocblock. Сейчас поддержано только для HTML и FB2.
Public fieldMaxImageSizeintПри установке картинки с содержимым большего размера будут игнорироваться
Public fieldMaxTableRowsintМожно поставить ограничитель на число строк таблиц (больше этого порога будут отбрасываться)
Public fieldOnlyForPureTextboolПризнак того, что создание предназначено только для последующего выделения плоского текста. То есть картинки и пр. можно игнорировать.
Public fieldSetFormulaAsImageboolПредставлять формулы MS Word картинками UnitextImage (но без содержимого)
Public fieldSplitTableRowsboolРазбивать ли слипшиеся строки таблиц на отдельные строки (когда в ячейках таблицы строки моделируются переходами на новую строку)