Gervigreind
Úr Wikipediu, frjálsa alfræðiritinu
Gervigreind er vitræn hegðun véla (til dæmis tölvu).
[breyta] Gervigreind á Íslandi
Á Íslandi er gervigreind að færast í aukana. Árið 2005 opnaði fyrsta rannsóknarsetur Íslands á sviði gervigreindar: Gervigreindarsetur Háskólans í Reykjavik (CADIA: Center for Analysis and Design of Intelligent Agents).
Sama ár var fyrsta íslenska félagið um gervigreind stofnað, ISIR, eða "The Icelandic Society for Intelligence Research" - á íslensku „Félag Íslands um gervigreind og vitvísindi“. Til samans má búast við því að þessar tvær stofnanir komi til með að auka talsvert þekkingu og áhuga almennings á málefnum gervigreindar og myndi frjórri farveg fyrir rannsóknir á því sviði.
Fram að þeim tíma hafði þó verið eitthvað um gervigreindartengd rannsóknarverkefni hérlendis. M.a. hafði Dr. Magnús S. Magnússon fengið viðurkenningar fyrir hugbúnað sinn THEME sem notar aðferðir úr g-greind til að greina mynstur.
Árið 1998 tók til starfa IT ráðgjöf og hugbúnaðarþjónusta ehf (IT Consultancy and Software design Ltd). [1], fyritækið sérhæfir sig í ráðgjöf á sviði gervigreindar og þá sérstaklega gervitauganetum og mynsturrannsóknum. Gervitauganet sem fyrirtækið hefur smíðað hafa verið notuð til greiningar á misferlum og mynsturrannsóknum misferla í milliríkjaviðskiptum með plastkort í Evrópu ásamt innanlandsviðskiptum í Bretlandi, Ítalíu og Tyrklandi.
[breyta] Saga gervigreindar
Sumarið 1956 komu tíu manns saman til tveggja mánaða vinnufundar í Dartmouth í Bandaríkjunum. Tilgangur vinnufundarins var að koma saman þeim vísindamönnum sem höfðu áhuga á tauganetum og rannsóknum á greind. Fundurinn var að frumkvæði John McCarthy sem þá hafði nýlokið meistaranámi frá Princeton University og vann nú við Dartmouth College.
Þátttakendur voru:
- John McCarthy frá Princeton
- Marvin Minsky frá Princeton
- Claude Shannon frá Bell Labaratories
- Nathaniel Rochester frá Princeton
- Trenchard More frá Princeton
- Arthur Samuel frá IBM
- Ray Solomonoff frá MIT
- Oliver Selfridge frá MIT
- Allen Newell frá CMU
- Herbert Simon frá CMU
Þessi fundur markar faglegt upphaf gervigreindar og kynnir til sögunar þá menn sem standa í fylkingarbrjósti gervigreindar næstu 20 árin á eftir. þar kemur McCarthy fyrst fram með fagheitið „artificial intelligence“ eða gervigreind eins og það er nefnd á íslensku. Á fundinum kynntu Newell og Simon LT (e. the logic theorist) og sögðu um það að þeir hefðu fundið með því forrit sem væri þess megnugt að hugsa á þann hátt sem ekki var bundinn við tölur og þar með aðskilið huga frá líkama. Stór orð en sönn ef reynt er að aðskilja tilfinningalega hugsun frá hugsun sem snýr að vinnslu upplýsinga.
Þótt faglegur grunnur hafi verið lagður að gervigreind á þessum fundi þá á gervigreind sér lengri sögu. Árið 1943 skrifuðu Warren McCulloch og Walter Pitts fyrstu fræðilegu greinina sem eignuð er gervigreind. Þeir settu saman kenningar um virkni og uppbyggingu taugafruma í heilanum, kenningar Russells og Whiteheads um yrðingarökfræði og tölvunarkenningar Alans Turings. Niðurstaða þeirra var líkan af gervitaugafrumum sem hægt var að kveikja eða slökkva á með því að áreita nálægar frumur. Þeir sýndu fram á að niðurstöðu hvaða reiknanlegs falls f(x) sem er, mátti ná með neti slíkra gervitaugafruma. Þeir lögðu einnig til í greininni að slík gervitauganet gætu lært. Þetta sannaði Donald Hebb sex árum síðar með því að finna upp einfalda aðferð til að uppfæra vigt tenginganna á milli eininganna (taugafrumnanna). Marvin Minsky og Dean Edmonds byggðu fyrstu gervitauganetstölvuna (SNARC) árið 1951 úr 3000 lömpum og sjálfstýringu úr B-24 sprengjuflugvél. Tölvan hafði 40 gervitauganetsfrumur eða eindir. Rekja má aðferðafræði bæði samtengingasinna (e. connectionism) og rökfræðisinna (e. logicism) innan gervigreindar til skrifa McCulloch og Pitts.
Samtengingasinnar vinna með gervitauganet með það að markmiði að útskýra og hanna greind.
Rökfræðisinnar leitast við að útskýra og hanna greind út frá rökfræðilegum forsendum.
Framan af ríkti mikil bjartsýni í notkun gervigreindar. Newell og Simon þróuðu LT áfram í GPS(e. general problem solver), kerfi sem var hannað til þess að líkja eftir atferli manna við lausn vandamála. Herbert Gelenter hannaði GTP (e. geometry theorem prover) sem sannaði kenningar á grundvelli frumreglna líkt og LT. Gelenter sá fljótlega að rökfræðin bauð upp á of margar mögulegar leiðir sem kanna þurfti í kerfinu og flestar enduðu án niðurstöðu. Hann hannaði því aðferðir til þess að flýta leit að niðurstöðu.
Í febrúar 1956 var tölva sýnd í bandarísku sjónvarpi sem hafði lært dam. Þar hafði Arthur Samuel hjá IBM afsannað þá kenningu að tölvur gætu aðeins gert það sem þeim var sagt, því þetta forrit hans lærði dam fljótt og lék betur en höfundurinn.
John McCarthy, sem þá var kominn til MIT skrifaði forritunarmálið LISP árið 1958 sem síðar varð vinsælt innan gervigreindar, sér í lagi í Bandaríkjunum. Sama ár skrifaði hann grein sem bar yfirskriftina „Programs with common cense“ og má þar sjá fyrsta fullkomna gervigreindarkerfið á pappír, sem hann nefndi „The advice taker“. Kerfið átti líkt og LT og GTP að finna lausnir út frá þekkingu sinni en ólíkt LT og GTP átti kerfið að geta aflað sér þekkingar sjálft og jafnframt breytt grundvallarreglum (e. axioms) ef þurfa þótti og í eðlilegi keyrslu kerfisins. Aðgangur að tölvum var mjög takmarkaður á þessum tíma, McCarthy og félagar hans hjá MIT fundu því upp sameiginlegan keyrslutíma (e. time sharing) sem gjörbylti aðgangsmálum að tölvum, þetta gerist einnig 1958. Þessi hópur og þessi nýja uppfinning varð síðan kveikjan að stofnun „Digital Equipment Corporation“ eða DEC. McCarthy fór hins vegar til Stanfordháskóla og setti þar á stofn rannsóknarstofu í gervigreind, en sú rannsóknarstofa lagði áherslu á gerð og notkun almennra aðferða við rökfærslu.
Væntingarnar voru miklar, líklega of miklar. Margt að því sem lagt var upp með brást þegar sýna átti árangur. Gott dæmi hvað þetta varðar voru forrit sem áttu að þýða milli tungumála og voru byggð á gervigreind, frægastur er líklega textinn úr ensk-rússnesku þýðingaforrit „the vodka is good but the meat is rotten“ (vodkað er gott en kjötið þránað) sem átti að vera þýðing á „the spirit is willing but the flesh is weak“ (hugurinn vill en holdið er veikt). Vandamál af þessu tagi leiddu til þess að skipuð var nefnd á vegum Bandaríkjaþings til þess að gera úttekt á árangri af vinnu með gervigreind á þýðingum. Í kjölfarið hætti Bandaríkjastjórn að fjármagna rannsóknir á því sviði 1966.
Áður en tíma-flækju kenningin (NP completeness theory) kom fram, var almennt álitið að einungis þyrfti að auka afl örgjörva og innraminni til þess að kerfi gengu í flóknara umhverfi. Í gervigreind vann fólk með mjög takmarkað umhverfi svonefnd örumhverfi (e. microworld) en þegar umhverfið varð flóknara var ekki nægjalegt að bæta við minni og örgjörfaafli, það tókst ekki að sanna kenningar sem gengu í einfaldara umhverfi, sem er vitaskuld afleitt. Þetta var meginástæða þess að bresk stjórnvöld hættu 1973 að styrkja rannsóknir í gervigreind nema að litlu leyti.
Minsky og Papert sögðu í bók sinni Perceptrons sem kom út 1969 að þó að tauganet gætu lært allt sem þau gátu lýst, þá gætu þau lýst afar litlu. Þetta olli því að allar rannsóknir á tauganetum lögðust af í áratug. Þeir félagar lýstu í bók sinni afar einföldum netum og áttu niðurstöður þeirra engan veginn við flóknari net, þær voru rangar að því leyti. Það er kaldhæðnislegt að sama ár og Perceptrons kom út fundu Bryson og Ho upp bakflutning villu (e. back-propagation) fyrir fjöllaga tauganet sem átti eftir að blása lífi í rannsóknir á tauganetum aftur um 1980.
Fyrstu sérfræðingakerfin (e. expert systems) litu dagsins ljós upp úr 1970. Það var sérfræðingakerfi Dendral frá þeim félögum í Stanford, Ed Feigenbaum, Bruce Buchanan og Joshua Lederberg, sem ruddi brautina. Tilgangur þess var að finna uppbyggingu sameinda út frá upplýsingum um massa. Í kjölfarið fylgdi Mycin, sérfræðingakerfi til þess að finna blóðsýkingar. Feigenbaum og Buchanan nutu aðstoðar Edward Shortliffe við gerð kerfisins. Mycin var frábrugðið Dendral að því leiti að Mycin notaði tilbúnar reglur fengnar frá sérfræðingum í stað þess að vera grundvallað á almennum fræðilegum rökfræðireglum. Mycin notaðist einnig viðloðna rökfræði (e. fuzzy logic) og gat því sagt til um líkur. Líklega er Prospector sérfræðingakerfið einna þekktast frá þessum tíma. Prospector var hannað hjá MRI til þess að finna málmgrýti og reyndist mjög gagnlegt.
Árangur í tungumálaskilningi náðist ekki fyrr en vísindamenn gerðu sér grein fyrir að þekking á viðfangsefninu skiptir sköpum í gervigreind, þegar áherslan fór af verkfærunum og aðferðafræðinni yfir á viðfangsefnið fóru hlutirnir að gerast. Eitt fyrsta sérfræðingakerfið á þessu sviði var SHRDLU en áherslan þar á málfræðireglur sem leiddi til slæmrar þýðingar, það þurfti skilning á viðfangsefninu. Málfræðingurinn Roger Schank hristi upp í vísindamönnum með því að segja að það væri engin málfræði til og skrifaði fjölmörg kerfi þar sem áherslan var á málskilning fyrst og fremst. Með þetta að leiðarljósi skrifaði William Woods Lunarkerfið sem notaði venjulega ensku og var ætlað jarðfræðingum til rannsóknar á grjóti sem Appolo geimflaugin kom með frá tunglinu.
Hugmyndir Japana um fimmtu kynslóðar tölvuna 1981 varð að vítamínsprautu fyrir fagið, ekki sýst vegna hræðslu annarra um japönsk yfirráð í tölvugeiranum. Þessi 10 ára áætlun Japana byggðist á því að hanna skynsaman velbúnað byggðan á Prolog á svipaðan hátt og venjulegar tölvur byggðu á vélamáli.
Á áttunda áratug síðustu aldar má segja að gervigreind hafi orðin að iðnaði, fyrirtæki sem sérhæfðu sig í gervigreind skutu upp kollinum og í flestum stærri fyrirtækja voru reknar deildir eða hópar sem notuðu eða unnu að gerð sérfræðingakerfa. Rannsóknir á gervitauganetum sem höfðu að verulegu leyti verið grundaðar á einnar lags perceptron netum fyrir 1970 höfðu lagst af eftir skrif Minskys og Paperts 1969, hófust nú aftur og má rekja upphaf endurlífgunarinnar til skrifa Rumelhart upp úr 1986. Fjöllaga gervitauganet höfðu sannað gildi sitt og nú hófst þróun sem enn sér ekki fyrir endan á. Hopfield net, Boltzmann machine og fleiri sáu dagsins ljós, en það var Cybenko sem setti fram sönnun um að tveggja-laga gerivitauganet gætu túlkað (eða áætlað) hvaða f(x) sem er en eins-lags gerivitauganet getur túlkað hvaða samfelda fúnksíon sem er (Cybenko theorem). Grannfræði fjöllaga gervitauganeta má að hluta rekja til rannsókna í GA (genetic algorithms) sem er þáttur undir gervigreind sem byggir á því að vélar læri í gegnum þróun. Grannfræði gervitauganeta er þó ekki komið lengra á veg en svo að í flestum tilfellum er byggt á reynslu og innsæji við hönnun gervitauganeta þó aðferðafræði LeCun um „optimal brain damage“ sé oft notuð við við lágmörkun á einingum og aðferðafræði Marchand og Frean um viðbætur á einingum er það enn svo að grannfræði upphafsneta eru byggð á reynslu og innsæi.
Flækja lærdómsferla gervitauganeta hefur verið rannsökuð ítarlega. Niðurstöður Avrim Blum og Ron Rivest 1992 um leysanleika lærdómsferla gervitauganeta eru sannfærandi og sýna að þau eru „NP-complete“ þ.e. þó fjöldi lægða vægisrýmisins sé veldisfall er víðvær kjörstaða vægja finnanleg.
[breyta] Gervigreindarfræði
Gervigreind á ótvírætt heima innan tölvunarfræðinnar, en hún á skurðpunkta við ótal greinar vísinda. Í dag er algengt að skilgreina gervigreind á fjóra mismunandi vegu með mismunandi áherslum:
- Kerfi sem hugsa eins og fólk
- Kerfi sem hugsa rökvíst
- Kerfi sem hegða sér eins og fólk
- Kerfi sem hegða sér skynsamlega
Gerður er greinarmunur á mannlegri hugsun og hegðun annars vegar og rökrænni eða skynsamri hugsun eða hegðun hins vegar. Sá sem tapar í skák hefur gert sig sekan um að beyta ekki rökrænni hugsun og því tapað, hann hefur engu að síður beitt mannlegri hugsun, mannleg hugsun og hegðun er ekki alltaf skynsamleg. Það er rétt að leiða aðeins hugan að hugtakinu „hugsun“ og þó væntanlega fyrir þá sem telja hugsun aðeins framkvæmanlega af lífræðilegum heilum. Hugsun er að sjálfsögðu efnaflutningur á milli eininga þar sem hver eining er sjálfstæð en án heildarinnar væri einingin gagnslaus líkt og maur án bús, það eru tækin sem hugsun notar. Hugsun skilgreinir Eric B. Baum í bók sinni What Is Thought? sem vinnslu sem samanstendur af:
Við þurfum að líta á hugsun með opnum huga, meðvitund í microheimi er öðruvísi en meðvitund okkar. Ef við teljum að það þurfi hugsun til þess að tefla, aka bíl, þekkja andlit, semja ljóð, spá fyrir um veður, spá fyrir um hlutabréfamarkaðinn, sjúkdómsgreina, spila á hljóðfæri, semja tónlist, mála listaverk o.s.frv., þá hljótum að samþykkja að tölvur hugsi því allt þetta hafa tölvur gert. Tölvur geta að sjálfsögðu ekki framkvæmt þá hugsun sem þarf til þess að elska, reiðast eða hata, einfaldlega vegna þess að við skiljum ekki nákvæmlega þessar tilfinningar og hver og einn upplifir þær með mismunandi hætti. Tengingimöguleikar líffræðilegs taugakerfis er eins og gefur að skilja mjög stór tala og því má leiða líkur að því að ekkert okkar hafi nákvæmlega sömu forsendur þó niðurstöður séu líkar. Tölvur geta enn sem komið er ekki framkvæmt hugsanir sem innifela sjálfstæðar tilfinningar.
Kerfi sem hugsa eins og fólk:
Hugfræði (cognitive science), sem er fremur grein innan sálfræðinnar en tölvunarfræðinnar fjallar um þessa hlið gervigreindar þar sem skoðun á mönnum og dýrum í gegnum sálfræðilegar tilraunir og sjálfskoðun eru grundvöllur kenninga um hugsun og samskipti véla og manna.
Kerfi sem hugsa rökvíst:
Aristóteles var fyrstur til þess að skilgreina „rétta hugsun“ þ.e. hugsun sem er rökfræðilega rétt og er því upphafsmaður rökfræðinnar. Nútímarökfræði á upphaf sitt að rekja til 19. aldar og liggur á mörkum heimspeki og stærðfræði. Um miðbik 20. aldar voru komin fram forrit sem gátu leyst vandamál sem sett voru fram með rökfræðilegum hætti. Megin vandamálið hér er að það er ekki auðvelt að breyta óformlegum upplýsingum í rökfræðilegt form, sér í lagi ef upplýsingarnar eru minna en 100% öruggar. Annað vandamál er að það er mikill munur á því að geta leyst vandamál í raunveruleikanum og að setja upp formlegar aðferðir sem útskýra hvernig þau má leysa.
Kerfi sem hegða sér eins og fólk:
Alan Turing skilgreindi vitræna hegðun sem því að líkja eftir fólki þannig að ekki yrði greint á milli vélar og manns, þessi skilgreining er lögð hér til grundvallar. Svokallað Turing test skilgreinir hvað tölvan eða vélin þarf að geta gert til þess að standast þessa skilgreiningu:
- Tungumálakunnátta, til þess að geta haft tjáskipti við fólk.
- Þekking, geymd og numin.
- Rökfræði til þess að nota og setja fram þekkinguna
- Þarf að geta lært, notað þekkinguna til þess að draga nýjar ályktanir.
Áherslan á að standast Turing test innan gervigreindar hefur ekki verið mikil, einfaldlega vegna þess að krafan um að hegða sér eins og fólk hefur aðeins þýðingu þegar gervigreindarforrit hafa samskipti við fólk og er sá þáttur jafnan aðeins hýðið utanum kerfið sem þá sjalnast er hannað með manninn sem fyrirmynd.
Kerfi sem hegða sér skynsamlega:
Að hegða sér skynsamlega þýðir að að hegða sér með þeim hætti að það leiði til þess að settum markmiðum sé náð að gefnum forsendum. Þessi skilgreining gervigreindar hefur með það að gera að hanna skynsama gjörendur (rational agents). Að hugsa rökrænt getur verið þáttur í því er að hegða sér skynsamlega, skynsamir gjörendur þurfa hins vegar líka að geta brugðist við umhverfinu af skynsemi í tilfellum þar sem aðferðir rökrænnar hugsunar koma ekki að notum. Sem dæmi um slíkt má nefna tilfelli þar sem rökræn hugsun gefur enga niðurstöðu eða gefur ekki niðurstöðu innan tímamarka.
Gervitauganet eru vissulega byggð á þekkingu okkar um starfsemi heilans, hvernig við lærum og hvernig við notfærum okkur það sem við lærum. Í mörgum tilfellum eru þau notuð í dag við lausn vandamála sem vélar geta leyst en maðurinn ekki. Við beytum gervitauganetum á þröng svið og nýtum okkur þá kosti sem tölva hefur umfram manninn, sem er að sjálfsögðu hraði í meðhöndlun gagna.