New Immissions/Updates:
boundless - educate - edutalab - empatico - es-ebooks - es16 - fr16 - fsfiles - hesperian - solidaria - wikipediaforschools
- wikipediaforschoolses - wikipediaforschoolsfr - wikipediaforschoolspt - worldmap -

See also: Liber Liber - Libro Parlato - Liber Musica  - Manuzio -  Liber Liber ISO Files - Alphabetical Order - Multivolume ZIP Complete Archive - PDF Files - OGG Music Files -

PROJECT GUTENBERG HTML: Volume I - Volume II - Volume III - Volume IV - Volume V - Volume VI - Volume VII - Volume VIII - Volume IX

Ascolta ""Volevo solo fare un audiolibro"" su Spreaker.
CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Kieliteknologia – Wikipedia

Kieliteknologia

Wikipedia

Kieliteknologia on ihmisten kieleen kohdistuvaa tai sitä hyväksikäyttävää teknologiaa. Nimitystä tietokonelingvistiikka on käytetty kieliteknologian keskeisistä teorioista ja menetelmistä, joilla kieltä voidaan tunnistaa, tuottaa ja jäsentää. Kieliteknologia on varsin monitieteistä, se liittyy mm. tietojenkäsittelytieteeseen ja yleiseen kielitieteeseen.

[muokkaa] Kieliteknologian sovellusalueita

Kieliteknologia soveltaa tietokonelingvistiikan menetelmiä ja kehittää näitä menetelmiä useille sovellusaloille, mm.

  • luonnollisen kielen käyttö tietokoneen käyttöliittymissä,
  • dokumenttien ja tekstimuotoisen tiedon hallinta, tiedonhaku, tekstien automaattinen indeksointi, tekstin automaattinen tiivistäminen ja dokumenttien luokittelu,
  • erilaiset kirjoittajan apuvälineinä toimivat tietokoneohjelmat kuten oikeinkirjoituksen tarkistus, kieliopin tarkistus, automaattinen tavutus ja synonyymisanastot,
  • erilaiset kieliteknologiaan perustuvat kielen kääntämisen apuvälineet sekä automaattiset kielenkääntöohjelmat ynnä terminologiset työkalut,
  • puhesynteesi ja automaattinen puheentunnistus,
  • tietokoneavusteinen kielen oppiminen (CALL) sekä
  • sanakirjojen ja oppimateriaalien laatiminen ja toimittaminen ja tekstin luettavuuden arviointi ja parantaminen.

[muokkaa] Kieliteknologian menetelmiä ja osa-alueita

  • Automaattinen morfologinen analyysi (morfologinen jäsentäminen) s.o. perusmuodon ja kieliopillisen taivutusmuodon tunnistaminen mukaan lukien ennalta tuntemattomien sanojen kohdalla perusmuodon ja muodon arvaaminen.
  • Morfologinen generointi (automaattinen taivuttaminen).
  • Automaattinen syntaktinen analyysi (syntaktinen jäsentäminen).
  • Luonnollisen kielen ilmausten generointi (koneen laskeman vastauksen muuttaminen ihmisten kielelle).
  • Dialogin (eli keskustelun) mallintaminen ja hallinta (mitä koneen tulisi kussakin tilanteessa pyrkiä sanomaan).
  • Kielivirheiden tunnistaminen ja korjausehdotusten tuottaminen.
  • Saneiden alamerkitysten automaattinen tunnistaminen tekstissä (esim. milloin laskea tarkoittaa aritmetiikkaa, milloin liukumista, päästämistä jne.)
  • Anaforan ratkaiseminen (eli mihin aiempaan kohteeseen tekstin pronomini tai lyhyempi ilmaus viittaa).
  • Termeiksi katsottavien ilmausten automaattinen päätteleminen tekstistä (so. kirjan takana olevan asiahakemiston automaattinen tuottaminen).
  • Puheentunnistuksessa puheen erottaminen tauoista, äänteitä kuvaavien piirteiden eristäminen signaalista (FFT, Cepstr, jne), todennäköisimpien sanojen tunnistaminen tilastollisilla menetelmillä (kuten HMM).
  • Puhesynteesissä äännemallit (esim. difonit) ja niiden yhdistely, sanojen ja virkkeen prosodian mallintaminen.
  • Kielentunnistus eli tekstin tai puheen kielen tunnistaminen näytteen perusteella.

[muokkaa] Aiheesta muualla

  • FILT eli Suomen kieliteknologian dokumentointikeskus, jossa linkit Suomessa oleviin kieliteknologian parissa toimiviin firmoihin, laitoksiin, erilaisiin kieliteknologisiin tuotteisiin ym. viittaavaa tietoa.
  • NORDOKNET eli pohjoismainen kieliteknologian dokumentointikeskus, joka yhdistää eri Pohjoismaissa toimivia dokumentointikeskuksia.
  • Language Technology World, jossa on huomattava määrä tietoa siitä, mitä kieliteknologia on. Siellä luetellaan kieliteknologian eri teknologiat, suuri määrä ihmisiä, tuotteita, hankkeita ja firmoja sekä organisaatioita ym. kieliteknologiaan liittyvää.
  • ACL The Association for Computational Linguistics, joka on alan tärkein kansainvälinen organisaatio.

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2006 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia February 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu