Nyelvbázis
A Wikipédiából, a szabad lexikonból.
A nyelvbázis fogalma elsősorban a formális nyelvekkel foglalkozó tudományok – tehát a matematika, a szemiotika, az analitikus filozófia és informatika – számára fontos.
Formális nyelven lényegében olyan halmazt vagy halmazrendszert értünk, mely egy adott halmaz, az ábécé (vagy jelkészlet) elemeiből, a betűkből képezett véges sorozatokat tartalmaz. Azt, hogy egy betűsorozat mikor tartozik a nyelvbe, azaz mikor jólképzett, egy formális (vagy extenzionális) nyelvben a szintaktikai szabályok adják meg; azaz olyan szabályok, melyek eltekintenek a betűk jelentésétől, és csak arra vonatkozó utasításokat adnak, hogy egyes betűk milyen betűket követhetnek.
A formális nyelv bázisa azon elemek öszessége, melyek a nyelv szavainak mibenlétét egyértelműen meghatározzák, tehát:
Nyelvbázis | = | Jelek | + | formális szóépítési szabályok ; | |
azaz | |||||
Nyelvbázis | = | Ábécé | + | Szintaxis . |
Tartalomjegyzék |
[szerkesztés] Formális definíció
A formális definíció a következő:
Valamely Λ ábécé feletti extenzionális nyelvbázis olyan négytagú halmazrendszer, ahol
- Λ különféle fajtájú szimbólumokból álló halmaz vagy halmazrendszer, a jelkészlet;
- ha halmaz, akkor ezt nevezzük ábécének;
- ha halmazrendszer, akkor valójában e rendszer uniója az ábécé, de pontatlanul néha magát a rendszert is ábécének nevezik;
- az ábécé felett elvileg felírható szavakat az utóbbi unióhalmaz elemeiből képezett összes véges sorozattal azonosítjuk, vagyis a Λ ábécé feletti összes szó halmaza legyen .
- a valamilyen (köznyelvi vagy formális) formában adott szintaktikai szabályok halmaza, azaz a szintaxis;
- a konkatenáció művelete, azaz a betűk vagy szavak összefűzése; kielégít több axiómát;
- az üres szó.
- A szintaxis azt adja meg, hogy ez utóbbi halmazból melyek azok a szavak, melyeket értelmesnek, jólképzettnek (well-formed) tekintünk, és hogy kell ezeket jól képezni. Tehát szabályokat (a szavak képzésére vonatkozó algoritmust) tartalmaz. Gyakran megelégszünk azzal, hogy ezeket köznyelvi formában, de egyértelműen megadjuk, esetleg felhasználjuk a matematikai nyelv fogalmait, jelöléseit is. Az ilyesfajta megadást akkor fogadhatjuk el, ha a szabályok elvileg valamilyen precíz, formalizált alakban is felírhatóak. Ilyen lehetségers formalizált alakok a [[generatív nyelvtan]gok vagy a Markov-algoritmusok, utóbbiak valójában a nyelvbázis fogalmának speciális esetének is tekinthetőek.
- a szemantika vizsgálja, hogy ha már a szimbólumok értelmesek, akkor mi lehet, mi legyen az értelmük. Azonban az ilyen előírásokat nem tekintjük a nyelvbázisok részeinek.
[szerkesztés] Szóképzési axiómák
A nyelvbázis fogalma a konkatenációra vonatkozó axiómákat is tartalmaz (ezek olyan szintaktikai szabályok, melyek minden nyelvbázisban közösek; ugyanis a betűk egymás mellé rakásának teljesen alapvető és elvárható tulajdonságait rögzítik).
- A betűk szavak;
- Az üres szó szó;
- Két szó konkatenációja is szó;
- A konkatenáció asszociatív;
- Egy szó akkor és csak akkor nem üres, ha előáll egy szónak egy betűvel való meghosszabbításaként,
- Az előző előállítás egyértelmű;
- Egy konkatenáció akkor és csak akkor azonos egy tagjával, ha az egyik tagja üres;
- H B olyan szóosztály, melynek az üres szó tagja, és ha egy szó tagja, akkor bármely betűvel való meghosszabbítása is tagja, akkor az összes szó a B osztályba tartozik.
[szerkesztés] Történet
A nyelvbázis gondolata közvetett módon és kevésbé általános formában több, kiszámíthatóságelmélettel vagy formális nyelvekkel foglalkozó kutató publikációiban is megjelent a XX. szd. 30-as éveitől kezdve (pl. Markov, Chomsky). Egy formális nyelv felépítését lehetővé tévő elemek összességére, ami nálunk a elemhármast jelenti, Magyarországon Ruzsa Imre filozófus vezette be a nyelvbázis fogalmát és ezt az elnevezést. Más szerzők is definiálnak hasonló fogalmakat, csak jelkészletnek vagy valami hasonlónak nevezik (a „jelkészletbe” nem mindig szokás beleérteni a szintaktikai szabályokat, csak az ábécét).
[szerkesztés] Irodalom
- Ruzsa Imre: Logikai szintaxis és szemantika I.. Akadémiai Kiadó, Bp., 1988. ISBN 963 05 4720 1.