Главная |История |Язык LSPL|Инструменты LSPL|Терминологический анализ|Морфопроцессор|Развитие|Контакты

История проекта LSPL



Разработка языка LSPL была начата в 2007 г. на кафедре алгоритмических языков ВМК МГУ имени М.В. Ломоносова, в рамках научных исследований по гранту РФФИ "Методы и средства интеллектуальной автоматической обработки текстов русскоязычных научно-технических документов", под руководством Е. Большаковой.

Активное участие в разработке исходных концепций языка принимали Наталья Ефремова (Васильева), Елена Бордаченкова, Сергей Морозов. В 2008 г. к группе присоединился Алексей Носков, им была создана библиотечная реализация LSPL-процессора, выполняющего поиск и выделение в текстах конструкций по описывающим их лексико-синтаксическим шаблонам. Также была реализована первая версия визуальной среды с графическим пользовательским интерфейсом для просмотра и анализа текстов по шаблонам.

В 2008-2010 гг. на базе созданных программных средств для языка LSPL были разработаны первые приложения по автоматической обработке русскоязычных текстов, различные по сложности и назначению. Эти приложения включали комплекс процедур терминологического анализа научно-технических текстов, вопросно-ответную систему с логическим выводом, модуль генерации программных тестов по комментариям программного кода.

При разработке указанных приложений требовались различные преобразования языковых конструкций, выявленных в тексте с помощью шаблонов (в частности, нормализация входящих в них слов). Поскольку сам язык LSPL-шаблонов эти преобразования не поддерживал, в 2012 г. он был дополнен новыми средствами для спецификации необходимых преобразований распознанных конструкций. Программная реализация этих средств (шаблонов извлечения) была выполнена Георгием Шариковым в 2013 г. Также для быстрого построения приложений была реализована утилита для вывода в XML-файл текстовых конструкций, выявленных по шаблонам.

Для расширенного LSPL новую версию визуальной среды анализа текста по шаблонам в 2016 г. разработал Александр Сапин. В 2017 гг. им была создана первая версия морфологического процессора CrossMorphy (взамен применяемого в проекте морфоанализатора АОТ Диалинг), а к 2022 г. CrossMorphy был существенно доработан и расширен. В 2018 г. Антон Тодуа реализовал сборку программных инструментов LSPL для использования в рамках ОС Windows.

В 2012-2016 гг. с использованием LSPL-шаблонов и инструментов языка были созданы несколько экспериментальных систем, в том числе система для извлечения информации из текстов финансовых обзоров инвестиционных компаний, система автоматизированного построения глоссариев для специализированных документов, вопросно-ответная система по теории элементарных чисел.

В 2016-18 гг. Кириллом Ивановым была разработана система автоматизированного построения предметных указателей для научно-технических текстов. В настоящий момент исследования по разработке и применению LSPL-шаблонов для автоматического терминологического анализа текстов продолжаются.


    Главная |История|Язык LSPL|Инструменты LSPL|Терминологический анализ|Морфопроцессор|Развитие|Контакты