Clasificación de documentos
De Wikipedia, la enciclopedia libre
Se define como la tarea de asignar variables Booleanas a cada par < dj,ci > pertenecientes a DxC, donde D es el dominio de los documentos y C = {c1,...,cn} es una colección de categorías predefinidas. T indica archivar un documento dj bajo ci, mientras F indica no archivar dj bajo ci.
Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de e-mail (spam / no spam)
[editar] Enlaces externos
Publicaciones:
- Fabrizio Sebastiani. Machine learning in automated text categorization. ACM Computing Surveys, 34(1):1–47, 2002 [1]