UNED LSI en TASS 2013Consideraciones acerca de la representación textual para la clasificación de tweets basada en recuperación de Información
- Ángel Castellanos González 1
- Juan Cigarrán Recuero 1
- Ana García Serrano 1
-
1
Universidad Nacional de Educación a Distancia
info
- Alberto Díaz Esteban (coord.)
- Iñaki Alegria Loinaz (coord.)
- Julio Villena Román (coord.)
Editorial: Sociedad Española para el Procesamiento del Lenguaje Natural
ISBN: 978-84-695-8349-4
Año de publicación: 2013
Páginas: 213-219
Congreso: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (29. 2013. Madrid)
Tipo: Aportación congreso
Resumen
Este artículo resume el trabajo planteado para nuestra participación en el TASS 2013, planteado como una extensión del trabajo realizado para el TASS 2012. El trabajo planteado el año anterior estaba enfocado en la clasificación de tweets basada en un enfoque de Recuperación de Información: las clases son modeladas de acuerdo a la información textual de los tweets pertenecientes a ellas y los tweets a ser clasificados son utilizados como query contra estos modelos. Este año hemos aplicado esta aproximación sobre las tareas de Sentiment Analysis y Topic Classification, pero este año nuestro trabajo está enfocado a analizar el tipo de información de los tweets a utilizar para llevar a cabo la clasificación y qué proceso debe seguirse para tener en cuenta esta información. En este sentido, hemos planteado diferentes tipos de modelado, así como diferente maneras de llevar a cabo el proceso de Recuperación de Información de acuerdo a los diferentes tipos de información. Los resultados obtenidos sugieren que si bien la utilización de este tipo de información es valiosa (especialmente las entidades nombradas), debe hacerse siempre en conjunto con el contenido global de los tweets.