Comparativa de aproximaciones a SVM semisupervisado multiclase para clasificación de páginas Web

  1. Zubiaga, Arkaitz
  2. Fresno Fernández, Víctor
  3. Martínez Unanue, Raquel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2009

Número: 42

Páginas: 63-70

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo se realiza un estudio de diferentes aproximaciones a la clasificación semisupervisada multiclase de páginas web mediante SVM. Ante la naturaleza binaria y supervisada de los algoritmos SVM clásicos, y tratando de evitar problemas de optimización complejos, se propone un enfoque basado en la combinación de clasificadores, tanto binarios semisupervisados como clasificadores multiclase supervisados. Los resultados de los experimentos realizados sobre tres colecciones de referencia muestran un rendimiento notablemente superior para la combinación de clasificadores multiclase supervisados. Por otro lado, en este trabajo también se realiza un estudio sobre la aportación de los documentos no etiquetados en la fase de aprendizaje para este tipo de entornos. En nuestro caso, y a diferencia de los problemas binarios, se obtiene una mayor efectividad cuando se ignora este tipo de datos para problemas multiclase.