Описание |Скачать|Публикации|Контакты

Описание языка LSPL


Выразительные возможности LSPL-шаблонов


LSPL (LexicoSyntactic Pattern Language) представляет собой язык, на котором можно записывать лексико-синтаксические шаблоны.

Основным элементом лексико-синтаксического шаблона языка LSPL (и простейшим шаблоном) является элемент-слово, соответствующий отдельному слову текста и описывающий конкретную словоформу, множество словоформ конкретной лексемы, обладающих фиксированными морфологическими характе­ристиками, или же произвольное слово заданной части речи, стоящее в определенной грамматической форме.

В элементе-слове латинской буквой указывается часть речи слова, а в угловых скобках записываются нужная лексема и указываются нужные значения грамматических признаков, соответствующих данной части речи. При этом используются символьные обозначения: для частей речи – N (существительное), V (глагол), A (прилагательное) и т.д., для грамматических характеристик и их значений – c (падеж), n (число), g (род), t (время), p (лицо) и др.. Например, шаблон A<важный; c=nom, g=fem> описывает слова важная, важна, поскольку в нем указан именительный падеж и женский род, а признаки формы прилагательного (полное/краткое) не фиксированы.

Для задания словоформы требуется задать морфологические характеристики полностью: шаблон N<теорема; c=ins, n=plur> соответствует словоформе теоремами. Заметим, что конкретную словоформу язык позволяет задать и в виде символьной строки так: «теоремами», однако такое задание исключает возможность последующего согласования с этой словоформой других элементов шаблона.

Опустив все грамматические характеристики в элементе-слове, мы получим шаблон, соответствующий любой словоформе лексемы: например, A<важный>.

Элемент-слово может также описывать произвольное слово определенной части речи, обладающее нужными морфологическими характеристиками, например, глагол настоящего времени третьего лица множественного числа задается шаблоном так: V<t=pres, p=3, n=plur>. Если же не нужны конкретизации характеристик, то можно записать V<> или просто V.

В общем случае в шаблон могут входить как несколько элементов-слов разных частей речи, так и несколько разных слов одной части речи. Для различения элементов-слов одной части речи используются индексы, например, шаблон N1 N2 описывает два стоящих рядом существительных. Чаще всего индексы нужны при задании условий согласования.

Для описания последовательностей одинаковых элементов шаблона служит конструкция повторения – фигурные скобки, например: шаблон {A}N описывает последовательность прилагательных (возможно, пустую), за которой идет существительное (например, большие красные полосатые листья). Если известны ограничения на количество однотипных элементов, то их можно указать в шаблоне непосредственно за конструкцией повторения в угловых скобках: шаблон {A}<1,3> N задает последовательность из одного, двух или трех прилагательных и существительного.

Элементы, входящие в описываемую конструкцию опционально, указываются в шаблоне в квадратных скобках. В шаблоне {A} N ["не"] V частица не перед глаголом указана как факультативная.

Можно задавать альтернативные варианты некоторой конструкции, для этого используется символ |, например, шаблон AP = A|Pa описывает понятие адъектива, т.е. прилагательного (A) или причастия (Pa).

Важная особенность нашего языка – возможность задавать грамматическое согласование элементов шаблона. Условия согласования относятся ко всему шаблону в целом и поэтому они указываются после всех элементов шаблона в виде равенства значений согласуемых морфологических признаков (в угловых скобках). Например, в шаблоне A<тяжелый> N <A.g=N.g, A.n=N.n, A.c=N.c> записано условие, что слово тяжелый и следующее за ним существительное согласованы в роде, числе и падеже. Этот шаблон описывает комбинации тяжелым вечером, тяжелых камней, тяжелое тело и многие другие. Если нужно указать согласование по всем общим морфологическим признакам, то его можно записать короче: A<тяжелый> N <A=N>.

При создании шаблона сложного фрагмента текста имеет смысл выделить его составные части и описывать их по очередности в виде шаблонов, давая этим шаблонам буквенные имена. Например, грамматически согласованную именную группу, состоящую из прилагательных, существительного (главного слова) и нескольких зависящих от него существительных в родительном падеже, можно задать так:

NNG = {A} N1 {N2<c=gen>} <A=N1> (N1)

Имя шаблона NNG записывается слева и отделяется от самого шаблона знаком равенства. Указание в конце шаблона элемента N1 в скобках означает, что именная группа NNG наследует весь набор морфологических характеристик главного существительного N1, и в дальнейшем его можно использовать в условиях согласования. Помещенные в круглые скобки характеристики мы называем параметрами шаблона. В общем случае в качестве параметров шаблона можно указывать несколько отдельных морфологических характеристик входящих в шаблон элементов, например:

NGpn = {A}N1 {N2<c=gen>} <A=N1> (N1.p, N1.n)

В качестве дополнительных примеров приведем:

1) LSPL-шаблон, описывающий один из наиболее распространенных синтаксических образцов научно-технических терминов (согласованную именную группу из нескольких адъективов и существительного): AN = {AP} N <AP=N> (N)

где AP – ранее описанный шаблон адъектива; параметрами шаблона AN устанавливаются грамматические характеристики входящего в него существительного.

2) Шаблон ACT = AN V <AN=V>

использует шаблон AN и его параметры для описания конструкции, состоящей из именной группы и следующего за ней глагола, согласованного в роде и числе, как во фразе Построенный программный комплекс удовлетворяет....

3) Шаблон для выделения однородных членов, которыми могут быть именные группы:

SNG = AN1 {“,” AN2}<1> [“и” AN3] <AN1.c=AN2.c=AN3.c> (AN1)

с помощью этого шаблона и шаблона ACT фразу Дама сдавала в багаж диван, чемодан, саквояж, картину, корзину, картонку и маленькую собачонку можно задать следующим шаблоном

ACT “в багаж” SNG<c=acc>

4) LSPL-шаблон перечислений вида Мышка за кошку, кошка за Жучку, Жучка за внучку, внучка за бабку, бабка за дедку, дедка за репку…

SN = N1 “за” N2<c=acc> {“,” N3 “за” N4<c=acc>}<1> <N1.c=N3.c>

5) Шаблон типичной для деловой и научно-технической прозы определяющей конструкции, которая состоит из адъективов, согласованных с ними существительных и подчиненных существительных (вместе с адъективами) в родительном падеже; при этом как вспомогательный используется шаблон AN более простой конструкции из согласованных адъективов и существительного):

NP = AN1 {AN2<c=gen>} (AN1)

6) Шаблон для одной из характерных конструкций определения новых терминов в научно-технических текстах:

DT = NP1<c=acc> ["мы"] «назовем» NP2<c=ins> <NP1.n = NP2.n>

Этот шаблон описывает, в частности, фразу Указанную операцию назовем операцией поиска примеров, предложение Поддержку динамичности изменения доступного информационного пространства мы назовем динамичностью информационной модели, а также и другие фразы подобной структуры и лексического состава.



    Описание |Скачать|Публикации|Контакты