Una representación basada en lógica borrosa para el clustering de páginas web con mapas auto-organizativos

  1. Pérez García-Plaza, Alberto
  2. Fresno Fernández, Víctor
  3. Martínez Unanue, Raquel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2009

Número: 42

Páginas: 79-86

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este trabajo se evalúa un modelo de representación de páginas web para clustering de documentos por medio de mapas autoorganizativos (SOM). Esta representación pretende reproducir o modelar en una primera aproximación la forma en que una persona observa una página web con la intención de saber si su contenido es o no de su interés. Para ello se aplican diferentes heurísticas por medio de una combinación borrosa de criterios. Los experimentos muestran un mejor comportamiento del modelo propuesto respecto a representaciones clásicas como TF, Bin-IDF y TF-IDF, para diferentes dimensiones del vector de representación, y sobre una colección de referencia.