Clasificación de páginas web en dominio específico

  1. Rangel Pardo, Francisco Manuel
  2. Peñas Padilla, Anselmo
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2008

Número: 41

Páginas: 89-96

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

El presente trabajo obtiene una representación novedosa y que proporciona un alto rendimiento en la clasificación automática de páginas Web en dominios específicos. Para ello el estudio se centra en obtener una representación formal de la intencionalidad del autor por transmitir información acerca de la página que crea y que se plasma en la meta-información de la misma, en la estructura de enlaces (Links), y en la Url. Se ha construido una colección de pruebas específica del dominio del teatro y la aproximación presentada ha obtenido unas tasas de rendimiento, medidas tanto por el estadístico F como por el intervalo de error cometido, superiores a los métodos existentes en el estado del arte.