SDK Unitext - библиотека для выделения текстов из файлов различных форматов, таких как Doc, Docx, Pdf, Rft и других. Выделяются не только тексты, но и таблицы, списки, сноски, аннотации и другие структурирующие текст элементы, а также картинки.
Исходный код Python и эта документация сгенерированы программой Unisharping.

Пакеты

  Имя Описание
Namespacepullenti.unitextУниверсальное структурно-текстовое представление документа
Namespacepullenti.unitext.internal.html 
Namespacepullenti.unitext.internal.rtf 
Namespacepullenti.utilПолезные хелперы