Главная |История |Язык LSPL|Инструменты LSPL|Терминологический анализ|Морфопроцессор|Развитие|Контакты

Программные инструменты для LSPL - LSPL-процессор



Входными данными для LSPL-процессора служат шаблоны и правила для извлечения конструкций, а также обрабатываемый текст на русском языке. С помощью заданных шаблонов и правил процессор настраивается для решения конкретной прикладной задачи. Обрабатываемый текст должен быть в формате txt.

Для поиска конструкций по заданному шаблону распознавания последовательно применяется процедура наложения шаблона на текст, результатом которой в общем случае являются различные варианты наложения.

Вариант наложения – это найденный фрагмент (непрерывный отрезок) текста, удовлетворяющий всем условиям шаблона, вместе с набором конкретных значений морфологических характеристик слов, входящих в этот фрагмент. В общем случае возможно несколько вариантов наложения шаблона – как на разные фрагменты текста, так и на один и тот же (в последнем случае они отличаются морфологическими характеристиками).

Например, при наложении шаблона A N <A=N> на текст этот письменный стол и удобный стул получается четыре варианта наложения: два варианта для письменный стол, отличающиеся падежом существительного (именительный и винительный) и два аналогичных варианта для удобный стул.

При обработке каждого шаблона распознавания процессор определяет все варианты наложения этого шаблона на текст, а при обработке заданного правила извлечения для каждого варианта строится извлекаемый фрагмент текста (с помощью шаблона извлечения). Например, в случае применения правила A N <A=N> =text> #N к тексту: этот письменный стол и удобный стул будут извлечены (дважды) фрагменты стол и стул. Но при применении этого же правила к тексту к этому письменному столу и удобному стулу фрагменты стол и стул будут извлечены по одному разу.


    Главная |История|Язык LSPL|Инструменты LSPL|Терминологический анализ|Морфопроцессор|Развитие|Контакты