Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Web Analytics
Cookie Policy Terms and Conditions Gramatyka regularna - Wikipedia, wolna encyklopedia

Gramatyka regularna

Z Wikipedii

Gramatyka regularna to gramatyka formalna generująca język regularny.

Ważne ograniczenia postaci reguł:

Przykłady poprawnych reguł:

A \rightarrow A
A \rightarrow B
A \rightarrow aA
A \rightarrow aB
A \rightarrow abcA
A \rightarrow abcB
A \rightarrow \epsilon
A \rightarrow a
A \rightarrow abc

Przykłady reguł niepoprawnych:

AB \rightarrow cD (dwa symbole nieterminalne z lewej strony)
A \rightarrow BC (dwa symbole nieterminalne z prawej strony)
A \rightarrow Ba (symbol nieterminalny nie znajduje się na końcu prawej strony)

[edytuj] Zaostrzanie zasad tworzenia reguł

Reguły te można zaostrzyć bez straty mocy, pozwalając na co najwyżej jeden symbol terminalny z prawej strony. Wprowadza się w tym celu kilka stanów pomocniczych Pi, i każdą regułę postaci:

A \rightarrow c_1c_2c_3\cdots c_kB

Można przepisać do zestawu reguł:

A \rightarrow c_1P_1
P_1 \rightarrow c_2P_2
P_3 \rightarrow c_2P_3
\vdots
P_{k-1} \rightarrow c_kB

Analogicznie przepisuje się reguły postaci:

A \rightarrow c_1c_2c_3\cdots c_k

Drugim często nakładanym ograniczeniem jest zabranianie reguł które zmieniają stan bez czytanie żadnych symboli:

A \rightarrow B

Algorytm pozbywania się ich jest następujący:

  • Wybieramy jedną regułę postaci A \rightarrow B, której nie oznaczyliśmy jeszcze jako zbędnej
  • Dla każdej reguły postaci B \rightarrow \Gamma, dodajemy do zbioru reguł regułę postaci A \rightarrow \Gamma, chyba że taka już istnieje
  • Jeśli B było akceptujące, A natomiast nie było, zaznaczamy A jako akceptujące
  • Zaznaczamy wybraną regułę jako zbędną - każde słowo w którego wyprowadzeniu były użyte reguły A\rightarrow B\rightarrow \Gamma możemy teraz wyprowadzić samym A\rightarrow\Gamma. Jeśli natomiast wyprowadzenie słowa kończyło się A\rightarrow B, gdzie B było akceptujące, możemy to wyprowadzenie zakończyć na A, które teraz również jest akceptujące.
  • Jeśli wszystkie reguły postaci A \rightarrow B są zaznaczone jako zbędne, usuwamy je i kończymy. Jeśli nie, wykonujemy kolejną iterację.

Zostają wtedy jedynie reguły postaci:

A\rightarrow a
A\rightarrow aB
A\rightarrow \epsilon

Z takich reguł bardzo łatwo już przejść do niedeterministycznego automatu skończonego.

[edytuj] Łagodzenie zasad budowania reguł

Można też pozwolić na łagodniejsze reguły - kierując się w stronę wyrażeń regularnych. Bez zmiany mocy gramatyk regularnych wolno dodać alternatywę, przy czym na symbole nieterminalne po prawej stronie nakłada się ograniczenie, że muszą one się znajdować na końcu dowolnej ścieżki wyboru alternatyw, np.:

A\rightarrow a(B|aa(C|bD))

Przejście do tradycyjnych gramatyk regularnych dokonuje się rozbibając każdą alternatywę na parę regułek, aż pozbędziemy się ostatniej:

A\rightarrow aB
A\rightarrow aaa(C|bD)
A\rightarrow aaaC
A\rightarrow aaabD

Można też dodać gwiazdkę, oznaczającą powtórzenie fragmentu dowolnie wiele razy, o ile wewnątrz niej znajdują się tylko symbole terminalne, np.:

A\rightarrow aa(ab)^*bb(a)^*B

Każdej gwiazdki pozbywa się wprozadzając nieterminalnych symbol pomocniczy P, i dla regułki postaci A \rightarrow \alpha \beta^* \gamma tworzymy regułki:

A \rightarrow \alpha P
P \rightarrow \beta P
P \rightarrow \gamma

Na przykład:

A\rightarrow aa(ab)^*bb(a)^*B
A\rightarrow aaP_1
P_1 \rightarrow ab P_1
P_1 \rightarrow bbP_2
P_2 \rightarrow aP_2
P_2 \rightarrow B

Używając (z podanymi wyżej ograniczeniami) gwiazdki i alternatywy możemy mieszać gramatyki regularne i wyrażenia regularne. Można też dla każdej gramatyki regularnej zbudować odpowiadające jej wyrażenie regularne. Konstrukcja jest następująca:

  • Przepisujemy gramatykę z użyciem alternatywy, tak żeby dla każdego symbolu nieterminalnego o regułkach A\rightarrow \Gamma_1, A\rightarrow \Gamma_2, ... , A\rightarrow \Gamma_k pozostała tylko jedna regułka A \rightarrow \Gamma_1 | \Gamma_2 | \cdots | \Gamma_k.
  • Wybieramy jeden symbol nieterminalny, oprócz symbolu startowego:
    • Jeśli w jego definicji znajduje się odwołanie do niego samego, przestawiamy te alternatywy do postaci A \rightarrow ((\Gamma_1 | \cdots | \Gamma_k) A) | (\Gamma_{k+1} | \cdots | \Gamma_n) i zamieniamy jego definicję na A \rightarrow (\Gamma_1 | \cdots | \Gamma_k)^* (\Gamma_{k+1} | \cdots | \Gamma_n)
    • Skoro w definicji A nie ma już żadnych odwołań do samego siebie, podstawiamy definicję A w miejsce wszystkich wystąpień A w innych regułkach. Otrzymujemy w ten sposób układ zawierający o jeden symbol mniej.
  • Na końcu zostaje nam tylko symbol startowy. Jeśli zawiera odwołanie do samego siebie, musimy go przekształcić zgodnie z tą samą procedurą.
  • Gramatyka jest postaci S \rightarrow \mbox{wyrażenie regularne}

Na przykład weźmy gramatykę słów nad alfabetem {a,b} nie zawierających podciągu baba. Gramatyka taka może mieć postać:

S\rightarrow aS - jak dotąd baba nie wystąpiło
S\rightarrow bP_{b} - jak dotąd baba nie wystąpiło, podejrzany prefiks to b
P_b\rightarrow bP_b - jak dotąd baba nie wystąpiło, podejrzany prefiks to b
P_b\rightarrow aP_{ba} - jak dotąd baba nie wystąpiło, podejrzany prefiks to ba
P_{ba}\rightarrow bP_{bab} - jak dotąd baba nie wystąpiło, podejrzany prefiks to bab
P_{ba}\rightarrow aS - jak dotąd baba nie wystąpiło
P_{bab}\rightarrow bP_b - jak dotąd baba nie wystąpiło, podejrzany prefiks to b
S\rightarrow \epsilon - możemy skończyć jeśli nie ma podejrzanego prefiksu
P_b\rightarrow \epsilon - możemy skończyć jeśli podejrzany prefiks to b
P_{ba}\rightarrow \epsilon - możemy skończyć jeśli podejrzany prefiks to ba
P_{bab}\rightarrow \epsilon - możemy skończyć jeśli podejrzany prefiks to bab

Można ją przepisać do układu równań gramatycznych:

S\rightarrow aS | bP_{b} | \epsilon
P_b\rightarrow bP_b | aP_{ba} | \epsilon
P_{ba}\rightarrow bP_{bab} | aS | \epsilon
P_{bab}\rightarrow bP_b | \epsilon

Łatwo można się pozbyć Pbab:

S\rightarrow aS | bP_{b} | \epsilon
P_b\rightarrow bP_b | aP_{ba} | \epsilon
P_{ba}\rightarrow b(bP_b | \epsilon) | aS | \epsilon

I Pba:

S\rightarrow aS | bP_{b} | \epsilon
P_b\rightarrow bP_b | a(b(bP_b | \epsilon) | aS | \epsilon) | \epsilon

Pb musiby sprowadzić do wygodnej postaci:

P_b\rightarrow ((b|abb)P_b) | (ab | aaS | a | \epsilon)

I pozbyć się odniesienia do siebie samego:

P_b\rightarrow (b|abb)^*(ab | aaS | a | \epsilon)

Możemy teraz podstawić do S:

S\rightarrow aS | b(b|abb)^*(ab | aaS | a | \epsilon) | \epsilon

Teraz już tylko grupujemy samo-odniesienia:

S\rightarrow (a | b(b|abb)^*aa)S | (b(b|abb)^*(ab | a | \epsilon) | \epsilon)

I usuwamy je:

S\rightarrow (a | b(b|abb)^*aa)^* (b(b|abb)^*(ab | a | \epsilon) | \epsilon)

W ten sposób mechanicznie stworzyliśmy wyrażenie regularne, którego ręczne zbudowanie byłoby znacznie trudniejsze.

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu