Программные инструменты для LSPL - Визуальная среда анализа текста по шаблонам
Среда пользователя служит для поддержки разработки и отладки LSPL-шаблонов и правил, позволяя пользователю задавать шаблоны, инициировать распознавание соответствующих конструкций и их извлечение, просматривать и анализировать полученные результаты.
Кроссплатформенная среда реализована на базе открытой версии библиотеки Qt. Исходный код доступен на github, там же есть данные для сборки среды под платформу *nix-подобных ОС.
Для ОС Windows 32-bit архив (lsplwin.zip) с исполняемым файлом среды.
Среда предоставляет следующие возможности:
- Загрузку и сохранение анализируемых текстов в любых кодировках;
- Создание и редактирование шаблонов с поддержкой истории и подсветкой синтаксиса;
- Загрузку шаблонов из файлов и их сохранение;
- Просмотр сообщений об ошибках, обнаруженных в шаблонах;
- Поиск и выделение в загруженном тексте конструкций по заданным шаблонам; возможность выгрузки результатов в XML-файл;
- Подсчет статистики выявленных конструкций;
- Просмотр морфологических характеристик слов текста;
- Возможность сохранения в файл (в формате XML) и последующей загрузки текущего контекста анализа (текст + шаблоны + результаты).
Пользовательский интерфейс состоит из трех основных, связанных между собой областей.
В области анализируемого текста (левая верхняя часть экрана) найденные по шаблонам конструкции выделяются желтым цветом, и при наведении на них курсора мыши появляется всплывающая подсказка с морфологической информацией.
В области шаблонов (правая верхняя часть) расположен список всех шаблонов и правил, загруженных из файлов или введенных в среде; ниже расположено поле для ввода нового шаблона. Шаблоны и правила, применяемые для анализа текста в текущий момент, помечаются.
В нижней области, в виде таблицы выводится информация о результатах анализа, с возможностью фильтрации по примененным шаблонам. В первом столбце таблицы представлены выделенные фрагменты (конструкции), во втором – результаты извлечения по примененному правилу, а в третьем – их морфологические параметры.
Старая версия среды пользователя для Windows 32-bit Скачать. Для работы этой среды необходима виртуальная Java-машина, для запуска используется исполняемый файл lspl-analyzer, обработка текста производится только шаблонами распознавания.
|