Teorema lui Bayes
De la Wikipedia, enciclopedia liberă
Teorema lui Bayes este una din teoremele fundamentale ale teoriei probabilităţii, care determină probabilitatea apartenenţei evenimentelor şi a obiectelor la o anumită grupă. A fost enunţată de matematicianul britanic Thomas Bayes.
În cazul filtrelor spam bazate pe teorema lui Bayes (numite şi filtre bayesiene), pentru determinarea probabilităţii apartenenţei unui anumit mesaj la spam, sînt utilizate dicţionarele create în timpul „învăţării” filtrului. De regulă programul „învaţă” analizând arhivele de email-uri, selectate în prealabil manual. Când dicţionarele sînt create definitiv, probabilitatea apartenenţei unui nou mesaj la spam este calculată prin normalizarea şi sumarea probabilităţii fiecărui cuvânt în parte. Prin urmare, adunând informaţii statistice despre rata de apariţie a unor diferite cuvinte şi structuri în mesajele de tip spam sau în mesajele legitime, filtrul compară apoi noile mesaje cu aceste modele şi le clasifică corespunzător.
Filtrele bayesiene oferă o precizie de filtrare de 97%-99%, iar fiind corect „antrenat” poate atinge şi 100%.
[modifică] Legături externe
- SpamAssassin - filtru anti-spam cu funcţii de filtrare bayesiană
- SpamBully - filtru anti-spam Bayesian pentru Outlook şi Outlook Express