Главная
Онлайн-демонстрация
Проекты
Другие системы
Скачать
Бесплатная версия для некоммерческого использования
Текущая версия SDK Pullenti:
Демонстрационный стенд: zip
Документация: Overview   ProgramGuide
SDK для .NET 4.0 (solution for Visual Studio 2010): zip
SDK для .NET Core 2.0 (solution for Visual Studio 2017): zip
SDK для Java (генерируется из исходников .NET): zip
SDK для Python 3 (генерируется из исходников .NET): zip
SDK для JavaScript (Node.js) (генерируется из исходников .NET): zip
SDK для PHP (генерируется из исходников .NET): планируется
Сотрудничество
Приглашаем программистов на C# и группы программистов для реализации проектов по обработке текстов на базе технологии Pullenti. Оплата договорная.
Изменения
Внимание, с версии 3.13 произошли небольшие переименования, связанные с поддержкой Python и PHP. Описание изменения см. здесь
Внимание, с версии 3.0 произошли существенные изменения, несовместимые с предыдущими версиями. Описание изменения см. здесь
Внимание, с версии 2.51 существенно расширена документация, в которой описаны способы работы с различными лингвистическими конструкциями на уровне токенов (именные группы, кавычки и скобки, словари и пр.). В связи с этим произведены небольшие переименования внутри пространства имён EP.Semantix. В основном это касается ранее неописанных возможностей, но в любом случае имейте это в виду при обновлении очередной версии.
Внимание, с версии 2.63 удален проект под .NET20. Если вдруг кому нужно, обращайтесь напрямую - откомпилируем.
Ошибки и доработки
Мы неустанно боремся с ошибками, которые бывают 3-х видов:
  1. Ложная тревога - выделение сущности там, где её нет;
  2. Некорректные атрибуты - сущность выделена, но все или часть атрибутов определились некорректно;
  3. Пропуск цели - сущность не выделена;
Вы можете помочь делу совершенствования продукта, если поделитесь некорректно обрабатываемыми текстами.
Просьба пока отправлять замечания на почту, в скором будущем регистрацию ошибок и мониторинг их состояния можно будет делать через сайт. Спасибо!
Конвертeр C#.NET => Java & Javascript & Python
Для преобразования проектов C# в исходные коды Java, Javascript и Python использовался конвертер UniSharping, статья с кратким описанием здесь.
Скорость работы .NET и Java примерно одинаковая (Java на 15-20% медленнее под Windows, но на других платформах соотношением может быть другим).
Скорость работы Python в 20 раз медленнее, чем на .NET. Подозреваю, что основной причиной является неэффективная работа в этих языках с элементами строк (элемент string[i] имеет не тип char, а тоже string из одного элемента со всеми вытекающими накладными расходами, да и вообще примитивные типы valuetype отсутствуют - все являются объектами). Если производительность критична, что можно оформить Pullenti как web-сервер и использовать его из Python.
Для Python написана обёртка для облегчения использования SDK Pullenti: Pullenti-Wrapper. Отметим, что в неё обёрнуты только NER-возможности, но многое ещё находится на нижнем уровне, что может быть полезным при анализе (морфология с нормализацией, выделение именных групп, работа с разными числовыми представлениями и пр.).
Скорость работы Javascript в 5 раз медленнее, чем на .NET (в прошлой версии было в 30 раз, но на счёт оптимизации конвертера и корректировки исходного алгоритма в плане уменьшения циклических зависимостей удалось сильно ускорить обработку, для Python тоже стало получше - с 30 опустились до 20).
Конвертер C#.NET => PHP
В принципе, конвертер в PHP сделан и Pullenti в него переведён: скорость обработки получилась пока удручающей - на порядок дольше, чем в Python. Вероятно, это связано с тем, что строки в PHP не юникодные, и для работы с ними и моделировании unicode приходится использовать функции mb_..., что негативно сказывается на производительность. Но мы ещё здесь поборемся! SDK пока не выкладываем.
Контакты
Почта: k.smith@mail.ru
Скайп: konstantin.smith
© Кузнецов К.И., 2013. All rights reserved.