Una representación basada en lógica borrosa para el clustering de páginas web con mapas auto-organizativos
ISSN: 1135-5948
Año de publicación: 2009
Número: 42
Páginas: 79-86
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
En este trabajo se evalúa un modelo de representación de páginas web para clustering de documentos por medio de mapas autoorganizativos (SOM). Esta representación pretende reproducir o modelar en una primera aproximación la forma en que una persona observa una página web con la intención de saber si su contenido es o no de su interés. Para ello se aplican diferentes heurísticas por medio de una combinación borrosa de criterios. Los experimentos muestran un mejor comportamiento del modelo propuesto respecto a representaciones clásicas como TF, Bin-IDF y TF-IDF, para diferentes dimensiones del vector de representación, y sobre una colección de referencia.