SDK Unitext - библиотека для выделения текстов из файлов различных форматов,
таких как Doc, Docx, Pdf, Rft и других. Выделяются не только тексты, но и таблицы, списки, сноски, аннотации и другие структурирующие текст элементы, а также картинки.
Исходный код Python и эта документация сгенерированы программой Unisharping.
Пакеты
Имя | Описание | |
---|---|---|
![]() | pullenti.unitext | Универсальное структурно-текстовое представление документа |
![]() | pullenti.unitext.internal.html | |
![]() | pullenti.unitext.internal.rtf | |
![]() | pullenti.util | Полезные хелперы |