PANKOW
De la Wikipedia, enciclopedia liberă
![]() |
Acest articol are nevoie de ajutorul dumneavoastră! Puteţi contribui la dezvoltarea şi îmbunătăţirea lui apăsând butonul "modifică pagina". |
Succesul Webului semantic este dependent de existenţa unor ontologii corespunzătoare si de proliferarea paginilor web adnotate cu metadate conforme acestor ontologii. Obţinerea metadatelor prin definirea manuala a unor reguli de extracţie a informaţiei necesită o munca titanică, timp si expertiza de înalt nivel. Pancow (Anotare prin similaritate utilizind informaţia incorporată de Web), reprezintă o metodă de auto-anotare bazată pe numărarea paginilor Web care includ anumite şabloane lingvistice specificate. Este o abordare similară invăţării automate nesupravegheate a corespondenţei dintre anumiţi termeni şi categoriile unei ontologii, ce combină idea folosiri şabloanelor lingvistice în identificarea relaţiilor ontologice, precum şi a ideii de folosire a Internetului ca sursă gigantică de informaţie.
Sistemul caută, în textul HTML care descrie paginile de internet, termeni care ar putea constitui exemple de categorii ale ontologiei. In general aceştia sint substantive comune ce pot fi identificate cu algoritmi specifici de separare a unităţilor lexicale. Substantivele comune candidate şi termenii ontologiei sint combinaţi în şabloane lingvistice ce sint apoi utilizate ca termeni de cautare în Google. In final, pentru fiecare combinaţie substantiv-categorie ontologică, sistemul rezumă rezultatele interogării la un numar total de pagini regăsite incluzînd combinaţia respectivă si atribuie termenul (substantiv comun) categoriei ontologice cele mai relevante din punct de vedere al acestui numar. PANKOW este ca performantă la nivelul sistemelor celor mai moderne in domeniu, în plus fiind mai simplu si mai intuitiv in ce priveşte anotarea paginilor internet.
Proiectul PANKOW a fost iniţiat la Universitatea Karlsuhe, Germania în 2004.
[modifică] Bibliografie
- Philipp Cimiano, Siegfried Handschuh, Steffen Staab, Towards the Self-Annotating Web In Proceedings of the 13th WWW Conference, pp. 462-471. ACM, New York, May 2004. ISBN: 1-58113-844-X