Lexikalisch-funktionale Grammatik
aus Wikipedia, der freien Enzyklopädie
Die Lexikalisch-funktionale Grammatik (LFG) ist ein Unifikationsgrammatikmodell. Es entstand als Reaktion auf die Forschung im Bereich der Transformationsgrammatik und bezieht sich vor allem auf die Syntax, Morphologie und Semantik, nicht jedoch auf die Phonologie. In jüngerer Zeit wurden jedoch Ideen aus der Optimalitätstheorie in der LFG populär. Die LFG wurde in den 70er Jahren von Joan Bresnan und Ronald Kaplan entwickelt. Sie wollten ein Grammatikmodell erschaffen, das für Linguisten genug Tiefe besitzt und gleichzeitig dem strengen Formalismus der Computerlinguistik genügt und von einem Parser effizient verarbeitet werden kann.
Inhaltsverzeichnis |
[Bearbeiten] Das Modell
Im Gegensatz zur Syntax Chomskys, die durch Transformationen verbundene separate Ebenen der linguistischen Darstellung beinhaltet, basiert die LFG auf zwei sich gegenseitig einschränkenden Strukturen:
- ein Konstituentenbaum (C-Struktur, englisch constituent)
- eine Merkmalstruktur (F-Struktur, englisch feature)
Konstituenten sind Wortfolgen, die in einem inneren Zusammenhang stehen. Sie werden auch als Phrasen bezeichnet. Ein Satz S besteht in der Regel aus mehreren Konstituenten (z.B. Nominalphrasen NP, Verbalphrasen VP, Adjektivphrasen AdjP).
Viele syntaktische Probleme lassen sich durch die unvollständige Korrespondenz zwischen diesen beiden Strukturen erklären. Sie müssen vereinigt werden, um grammatische Sätze zu bilden. Technisch ausgedrückt: Die LFG widerspricht dem in jüngeren Arbeiten zur Transformationsgrammatik aufgestellten Projektionsprinzip. Demnach sind syntaktische Strukturen direkte Repräsentationen bestimmter lexikalischer Informationen. Die LFG bietet jedoch flexiblere Beziehungen zwischen der syntaktischen und semantischen Struktur und schließt damit die Notwendigkeit von Transformationen aus.
[Bearbeiten] C-Struktur (Konstituenten)
Um die C-Struktur zu verstehen, betrachten wir zunächst folgende einfache formale Grammatik:
Die Begriffe nomen, artikel und verb stehen für Terminalsymbole der Grammatik. Terminalsymbole werden meist klein- und Nonterminalsymbolen großgeschrieben. Genauer sind nomen, artikel und verb Preterminalsymbole. Sie sind lediglich die Vorstufe zum Terminalsymbol, sie stehen für eine Klasse von Terminalsymbolen. Die tatsächlichen Terminalsymbole, die Wörter, werden nicht in der Grammatik angegeben, sondern stehen in einem Lexikon. Kommt ein Wort in zwei Klassen vor, steht es zweimal im Lexikon.
Mit dieser Grammatik lässt sich der Satz Die Kinder essen Brei entwickeln:
Leider erlaubt diese Grammatik auch Sätze wie Das Kind essen Brei oder Autos essen Straßen. Es müssen also zusätzliche Eigenschaften wie Kasus, Genus, Tempus, Numerus und Spezifikation berücksichtigt werden.
[Bearbeiten] F-Struktur (Features)
Da C-Struktur alleine nicht ausreicht, richtige Sätze zu erzeugen, besitzen LFG zusätzlich die F-Struktur. Zunächst legen wir ein Lexikon mit den zusätzlichen Eigenschaften an. Eigenschaften die nicht angegeben sind, sind noch nicht festgelegt.
Wort | Preterminalsymbol | F-Struktur | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Brei | nomen |
|
||||||||||||||
Die | artikel |
|
||||||||||||||
essen | verb |
|
||||||||||||||
Kind | nomen |
|
||||||||||||||
Kinder | nomen |
|
Die oben angegebene Grammatik wird nun zu einer LFG erweitert:
Die Gleichungen geben an, dass eine Unifikation (Zuordnung) erfolgen muss. Bei wird die F-Struktur des übergeordneten Knotens der C-Struktur mit der F-Struktur des untergeordneten Knotens unifiziert. Die Gleichung unifiziert den Knoten Subjekt der F-Struktur des übergeordneten Knotens der C-Struktur mit der F-Struktur des untergeordneten Knotens.
Wir betrachten wieder den Satz Die Kinder essen Brei und die oben angegebene Entwicklung. Jedoch betrachten wir den Vorgang aus Sicht eines Parsers:
Die Kinder erzeugen einen NP-Knoten. Die und Kinder sind ein NP-Knoten in der C-Struktur. Dessen F-Struktur wird durch Unifizieren der F-Strukturen von Die und Kinder erzeugt. Die Notation der Strukturen erfolgt in sogenannten Attribut-Wert-Matrizen (AWMs):
Durch die Gleichung wird diese F-Struktur mit Subjekt aus der F-Struktur von S unifiziert:
Diese wird zum Schluss mit der F-Struktur des VP-Knotens unifiziert:
Das Kind essen Brei ist für die gegebene LFG nicht gültig, da die F-Struktur der NP nicht mit der F-Struktur aus essen unifiziert werden kann:
[Bearbeiten] Ausblick
Tatsächlich werden im Lexikon wesentlich mehr Daten gespeichert. So würde bei Kinder die Spezifikation belebt gespeichert. Des Weiteren werden die zugrunde liegenden Lexeme gespeichert. Das Lexikon muss nicht vollständig aufgelistet werden. Da sich Wörter in Morpheme zerlegen lassen, reicht es häufig aus, Grundformen zu speichern.
[Bearbeiten] Demonstration
Eine On-line Analyse von Sätzen nach dem LFG-Modell illustriert wie die C-Struktur und F-Struktur von deutschen Sätzen aussieht. Dazu muss dort unter Grammar German eingestellt werden.
[Bearbeiten] Weblinks
- What is LFG? (englisch)
- Stanford LFG (englisch)