Un modelo lingüístico-semántico basado en emociones para la clasificación de textos según su polaridad e intensidad
- Pablo Gervás Gómez-Navarro Director/a
Universidad de defensa: Universidad Complutense de Madrid
Año de defensa: 2011
Tipo: Tesis
Resumen
El trabajo presentado en esta tesis describe una nueva aproximación para la clasificación de textos según su polaridad e intensidad emocional, basada en el análisis semántico del texto, y en el uso de reglas lingüísticas avanzadas. El objetivo es determinar cuando una oración o documento expresa un sentimiento positivo, negativo o neutral, así como la intensidad del mismo. El método utiliza un algoritmo de desambiguación semántica para trabajar a nivel de conceptos en lugar de términos, y usa el léxico afectivo SentiSense para extraer el conocimiento emocional y representar cada texto como un conjunto de categorías emocionales. La negación, los cuantificadores y las formas modales son construcciones lingüísticas que pueden modificar el significado emocional del texto, por lo que es imprescindible tener en cuenta su posible efecto. En esta tesis se estudia en profundidad el efecto de dichos modificadores sobre las emociones a las que afectan cuando el texto es representado como un conjunto de emociones. Además, se propone un modelo emocional para la negación, los cuantificadores y la modalidad. El método presentado es comparado con una aproximación basada en expresiones polares. Los resultados obtenidos demuestran que abordar los modificadores mediante un conjunto de categorías emocionales mejora el rendimiento en todas las tareas de clasificación. Finalmente, se ha realizado una evaluación exhaustiva sobre textos de diferentes dominios para determinar la factibilidad de la aproximación presentada en diferentes tareas de clasificación de la polaridad y la intensidad. Los resultados obtenidos muestran que el enfoque propuesto se comporta significativamente mejor que otros sistemas evaluados bajo las mismas condiciones. Estos resultados demuestran, además, que el uso de técnicas de desambiguación semántica, la representación del texto mediante un conjunto de emociones y el tratamiento del efecto de los modificadores emocionales sobre dichas emociones, pueden mejorar el rendimiento de las tareas de análisis sentimental