Базовый класс для всех элементов Unitext:
UnitextPlaintext,
UnitextContainer,
UnitextTable,
UnitextTablecell,
UnitextList,
UnitextListitem,
UnitextNewline,
UnitextPagebreak,
UnitextFootnote,
UnitextImage,
UnitextHyperlink,
UnitextComment,
UnitextDocblock и
UnitextMisc.
Пространство имен: pullenti.unitext
Синтаксис
Свойства (get/set)
|
Имя |
Тип |
Описание |
 | is_inline | bool | Объект не содержит блочных объектов и разрывов строк |
 | is_whitespaces | bool | Только из "пустых" символов и переходов на новую строку |
 | page_section | UnitextPagesection | Страничная секция (параметры страницы и колонтитулы) |
 | starts_on_newline | bool | Объект всегда начинается на новой строке (например, таблица) |
Методы
Поля
|
Имя |
Тип |
Описание |
 | begin_char | int | Начальная позиция в плоском тексте (формируется только после вызова
функции get_plaintext, причём с set_positions = true) |
 | end_char | int | Конечная позиция в плоском тексте (формируется только после вызова
функции get_plaintext, причём с set_positions = true)
Если end_char = begin_char - 1, то элемент занимает нулевую длину. |
 | ext_data | object | Некоторые внешние данные, ассоциированные с элементом. Не сериализуется.
Устанавливается и используется в конечных приложениях произвольным образом. |
 | html_title | str | Это устанавливайте для генерации хинтов в HTML |
 | id0_ | str | Уникальный идентификатор элемента внутри документа
Если не null, то при генерации HTML добавляется <a name=ANCHOR >
для возможной навигации на этот элемент |
 | ignorable | bool | Признак того, что для этого элемента не генерировать html,
а для плоского текста все тексты заменяются на пробелы (по количеству символов).
Устанавливается для служебных таблиц (их текст заменяется на пробелы) и для разных
служебных вставок. |
 | page_section_id | str | Идентификатор секции (см. Section), если они поддержаны для формата |
 | parent | UnitextItem | Ссылка на родительский элемент вверх по иерархии |
 | source_info | str | Это некоторая дополнительная информация из исходного документа.
Сейчас реализовано для Excel:
- для таблицы помещается строка формата: XLS_SHEET:имя листа
- для ячейки таблицы строка формата: XLS_CELL:имя ячейки (типа E5),
- для квадрата ячеек XLS_CELL:имя ячейки1-имя ячейки2 (типа E5-F10) |
 | tag | object | Используется произвольным образом |