Informazioa ateratzea
Wikipedia(e)tik
Informazioa ateratzea (ingelesez, Information Extraction edo IE) informazioa eskuratzeko modu bat da, ordenagailu batek irakur ditzakeen dokumentuetatik informazio egituratu edo erdi-egituratua ateratzea helburu duena.
Informazioa ateratzeko ohiko aplikazio bat lengoaia naturalean idatzitako dokumentu sorta bat eskaneatu eta ateratako informazioa datu-base baten sartzen duena da. Gaur egun lengoaia naturalen prozesamendurako teknikak erabiltzen dira. Adibidez, Message Understanding Conference (MUC) edo Mezuak Ulertzeko Hitzaldia honako aspektu hauetan aritu den lehiaketa da:
- MUC-1 1987, MUC-2 1989: Ontzi-eragiketentzako mezuak.
- MUC-3 1991: Latinamerikar herrialdeetako terrorismoa.
- MUC-5 1993: Mikroelektronika.
- MUC-6 1995: Gerentzia aldaketen inguruko artikulu berriak.
- MUC-7 1998: Sateliteen jaurtiketen txostenak.