Neurónová sieť
Z Wikipédie
Neurónová sieť je výpočtový model, zostavený na základe abstrakcie vlastností biologických nervových systémov. Základnou časťou neurónovej siete je model neurónu s N vstupmi a M výstupmi, ktorý spracúva informáciu podľa nasledovného pravidla:
oik+1 = f( wijk × ojk − Θ ik+1 ) ; kde
- 0 < i <= M,
- 0 < j <= N
- oik+1 je výstupná hodnota i teho neurónu k+1 vrstvy
- k je index vrstvy
- Θ ik+1 je prah excitácie i teho neurónu k+1 vrstvy
- wijk je váha spojenia medzi j-tym neurónom k vrstvy a i-tym neurónom k+1 vrstvy
- f() je ľubovoľná monotónna funkcia
Samotná neurónová sieť je zložená z viac vrstiev o rôznom počte neurónov, rôznym spôsobom poprepájaných.
Obsah |
[úprava] Rozdelenie
V literatúre sa rozoznávajú rôzne architektúry:
- perceptrón,
- viacvrstvová sieť,
- rekurentná sieť,
- Hopfieldova sieť (váhy sú obojsmerné),
- Kohonenova sieť,
- Radial base
Každá z architektúr je vhodná na iný typ úlohy.
[úprava] Vlastnosti
Základnou vlastnosťou neurónových sietí je schopnosť abstrakcie pravidiel medzi vstupnými a výstupnými hodnotami prezentovanými vo vhodnej forme a následnou aplikáciou získaných pravidiel na akékoľvek vstupné hodnoty. Preto sa často využíva v regulačnej a simulačnej technike.
Proces abstrakcie sa nazýva učenie, a môže prebiehať s učiteľom alebo bez učiteľa. Počas tohto procesu sa aktualizujú hodnoty váhových spojení. V literatúre je popísaných niekoľko učiacich algoritmov. Po ukončení učenia, sa už hodnoty váh nemenia a sieť produkuje výstupy podľa uvedeného pravidla aplikovaného na vstupné hodnoty.
[úprava] Použitie
- Rozpoznávanie vzoriek (napr. obrázkov a písma)
- Univerzálny systémový invertor; vie z každého systému F(x) urobiť
, aj takých, čo sa inak matematicky nedajú.
- Univerzálny systémový aproximátor; vie napodobniť správanie každého systému, či už fyzikálneho alebo dokonca masovú psychológiu trhu.
- Umelá inteligencia; hlavne podpora rozhodovania, rozpoznávanie signálov, v tomto prípade sa ale často kombinuje s klasickými počítačovámi algoritmami, pričom NS častejšie len premieňa údaje ktoré klasická binárna logika nespracuje na údaje ktoré spracuje. Čisté umelé inteligencie založené len na NS sa ukázali ako nepraktické.
Niektorí ľudia tak silno veria že NS sú univerzálne (neurofetišizmus), a keď sa ukázalo že často nie sú, tak ich všeobecne zavrhnú.
NS sú len nástroj a ako každý nástroj sú optimálne len pre určitý druh úloh.
[úprava] Výhody
- Paralelné spracovanie informácií, umožnujúce pri vhodnom hardware rozdeliť výpočet na niekoľko súbežných procesorov.
- Nevyžaduje akúkoľvek informáciu o štruktúre procesu, na ktorý je aplikovaný.
- Zahŕňa v sebe možnosť adaptácie na zmenu parametrov, pokiaľ sa aplikuje aj s učiacim algoritmom.
- Je vhodné pre úlohy identifikácie, aproximácie, klasifikácie a triedenia vzorov.
- Siete sú rýchle ak sa implementujú bez učiaceho algoritmu.
- Umožnuje abstrahovať riadiace pravidlá iného regulátora (napr. človeka, alebo regulátora s dlhými výpočtovými časmi) a nahradiť ich.
- Poskytujú redukciu rozmeru dát do menej rozmerného priestoru.
- Sú univerzálnym aproximátorom, schopným aproximovať akúkoľvek spojitú funkciu s ľubovoľnou presnosťou.
[úprava] Nevýhody
- Nie je vypracovaná žiadna metodika pre návrh architektúry siete a voľbu funkcií opisujúcich neurón. Pri implementácii sa preto postupuje metódou pokus-omyl, čo zvyšuje časové nároky riešenia.
- Nie je vhodný pre systémy vyžadujúce presné riešenie (na to sú ale lepšie lineárne systémy, s ktorými sa NS dá ale výborne kombinovať).
- Učenie trvá zvyčajne dlho (menej pri gradientových metódach, viac pri mutácii). Našťastie ale existujú neuro-fuzzy systémy, ktoré sa učia enormne rýchlo.
[úprava] Softvér
Pre výuku NS je celkom dobrý softvér Stuttgart Neural Network Simulator, alebo len SNNS. Medzičasom sa ujal na viacerých univerzitách. Pre simuláciu a vývoj sa celkom dobre využíva aj Matlab, presnejšie jedno z jeho pluginov pre neurónové siete.
[úprava] Referencie
- Kvasnička, V. a kol.: Úvod do teórie neurónových sietí.Vydavateľstvo IRIS, 1997.
- Willems, T.M. : Neural Networks in Control ? Dizertačná práca, Eindhoven University of Technology Eidhoven, Holandsko 1993.