Centre for Computational Linguistics: Projects
Time Span: 1998 - ..
Fonds voor Wetenschappelijk Onderzoek - Vlaanderen
F. Van Eynde
Computationele syntaxis en semantiek : bijdrage aan de ontwikkeling van een monostrataal en declaratief model voor de analyse van natuurlijke talen, met bijzondere aandacht voor computerlinguïstische toepassingen op het Nederlands en het Engels. Eén van de centrale principes van de semantiek is dat van de compositionaliteit: de betekenis van een samengestelde uitdrukking (zoals een zin) wordt bepaald door de betekenissen van de samenstellende delen en door de wijze waarop die delen gecombineerd zijn. Het belang van die tweede factor wordt algemeen erkend, maar over de kwestie hoe de verhouding tussen syntactische structuur en semantische interpretatie best gemodelleerd wordt, bestaat weinig eensgezindheid. Om mijn project te situeren t.o.v. de recente ontwikkelingen in dit domein zet ik eerst enkele basiskenmerken van mijn benadering op een rij.
Een linguïstische theorie die de meeste van deze kenmerken in zich verenigt is HPSG, cf. C. Pollard & I.A. Sag, Head-driven Phrase Structure Grammar, CSLI-Stanford & University of Chicago Press, 1994. Ik heb deze theorie als algemeen kader gebruikt in mijn proefschrift ter behaling van de graad van Geaggregeerde voor het Hoger Onderwijs (10), in mijn bijdrage aan een computerlinguïstisch project van de Europese Gemeenschap (77) en in diverse publicaties (6,40-44,46,47) en lezingen (117,118,124). (De nummers verwijzen naar de lijst van publicaties in bijlage 1.) Bovendien heb ik twee projecten geleid waarin de toepassing van HPSG op het Nederlands centraal staat (cf. bijlage 2, projecten 5 en 6). Het onderzoek dat ik de komende jaren wil uitvoeren sluit hierbij aan. Het heeft de volgende centrale onderwerpen:
In het Standaardmodel van de transformationele grammatica en in GPSG worden syntactische structuren gegenereerd aan de hand van constructie- specifieke herschrijfregels. In de X-bar theorie daarentegen (Chomsky 1970, Jackendoff 1977) zijn syntactische structuren het resultaat van de interactie van lexicale informatie met een beperkt aantal universele schema's, zoals Hoofd-Complement en Hoofd-Specificeerder. Die schema's generalizeren over syntactische categorieën en zijn dus cross-categoriaal. HPSG neemt het gebruik van algemene schema's over, maar omdat ze moeten gelden voor oppervlaktestructuren en omdat die laatste tegelijk de vorm van de semantische representaties bepalen, kunnen de HPSG schema's niet zonder meer ge\"identificeerd worden met die van de X-bar theorie. In Pollard & Sag 1994 worden 7 combinatieschema's onderscheiden, maar een aantal daarvan zijn constructie-specifiek en dus niet cross- categoriaal (zoals Hoofd-Markeerder en Hoofd-Subject-Complement) en voor sommige schema's (zoals Hoofd-Specificeerder) is het semantische effect niet uitgespeld.
Het is mijn bedoeling om een typologie uit te werken van combinatieschema's (voor oppervlaktestructuren) die cross-categoriaal zijn en waarvan zowel het syntactisch als het semantisch effect is uitgespeld in termen van constraints op samengestelde uitdrukkingen (phrases). Een aanzet daartoe is [46].
2. Functionele categorieën
Als men kiest voor cross-categoriale combinatieschema's vormt de behandeling van functiewoorden een probleem. Zowel in de transformationele grammatica als in GPSG en HPSG worden ze behandeld als leden van aparte categorieën (zoals Complementizer, Conjunction, Article, Auxiliary, e.d.), maar omdat ze andere syntactische en semantische eigenschappen hebben dan de leden van de de lexicale categorieën (Verb, Noun, Adjective, Preposition) is het niet evident dat de combinatieschema's die voor de laatste gelden ook geldig zijn voor de functiewoorden. Om te beschikken over een kader waarin zowel aan de overeenkomsten als aan de verschillen tussen lexicale en functionele elementen recht kan worden gedaan heb ik in [10, 42] het onderscheid tussen functioneel en lexicaal aan een nieuwe analyse onderworpen en betoogd dat het op twee specifiekere distincties berust: een semantische (zelfstandige betekenis of niet) en een syntactische (kan de kern zijn van een phrasale projectie of kan dat niet). Deze distincties zijn wederzijds onafhankelijk en staan ook haaks op de indeling in syntactische categorieën. Het gevolg is dat de functiewoorden worden behandeld als bijzondere leden van de lexicale categorieën, eerder dan als leden van aparte functionele categorieën.
In aansluitend onderzoek zal deze theorie van functionele elementen worden ingepast in de typologie van combinatieschema's en zal ze worden toegepast op het Engels en het Nederlands. Het belang van de analyse van zulke elementen voor computationele toepassingen is groot, omdat ze bijzonder frequent voorkomen.
3. Een constraint-based lexicon
Omwille van het abstracte karakter van de syntaxis dient het lexicon veel specifieke informatie te bevatten. Om redundantie te vermijden is het bijgevolg noodzakelijk om zoveel mogelijk lexicale generaliseringen te vatten. HPSG maakt daartoe o.m. gebruik van lexicale regels, zowel voor de behandeling van inflectie en derivatie als voor de behandeling van een aantal syntactische fenomenen die in de transformationele grammatica d.m.v. transformaties gemodelleerd worden, zoals passief en extrapositie. Het gebruik van lexicale regels heeft echter een aantal nadelige effecten, zowel computationeel als conceptueel, en staat haaks op het streven naar declarativiteit. Om die reden zal ik in aansluiting bij eerder werk (10, 41, 47) exploreren hoe de fenomenen die gewoonlijk d.m.v. lexicale regels behandeld worden ook d.m.v. declaratieve technieken gemodelleerd kunnen worden, zoals onderspecificatie en constraint-based inheritance.
4. De semantiek van tijd, aspect, negatie en quantificatie
Gebruik makend van de grammatica zoals die uit het onderzoek i.v.m. de eerste drie onderwerpen resulteert zal ik vervolgens onderzoeken hoe die kan worden uitgebreid met een model-theoretische analyse van uitdrukkingen voor tijd, aspect, negatie en quantificatie. Zulke uitbreidingen passen heel natuurlijk in de HPSG-strategie om semantische analyses door het gebruik van constraints op syntactische structuren te enten. Tot nu toe is de aandacht voor semantische kwesties in HPSG vooral uitgegaan naar de studie van predikaat-argument structuren en quantoren. Verder bouwend op recent werk over temporele relaties in teksten (DRT, Declerck, Janssen, Tasmowski, Vet, Van Eynde, ...) wil ik een model ontwikkelen voor de semantische analyse van temporele expressies dat geïntegreerd kan worden in het HPSG formalisme. Speciale aandacht zal worden besteed aan de interactie van temporele uitdrukkingen met negatie en quantoren. Een aanzet tot dit onderzoek is [44].
CCL
Layout:
webmaster@ccl.kuleuven.ac.be
Information Provider: Centrum voor Computerlinguïstiek
Comments to the Author:
Frank.Vaneynde@ccl.kuleuven.ac.be
(C) Copyright 1996, CCL.
All Rights Reserved.