UNED LSI en TASS 2013Consideraciones acerca de la representación textual para la clasificación de tweets basada en recuperación de Información

  1. Ángel Castellanos González 1
  2. Juan Cigarrán Recuero 1
  3. Ana García Serrano 1
  1. 1 Universidad Nacional de Educación a Distancia
    info

    Universidad Nacional de Educación a Distancia

    Madrid, España

    ROR https://ror.org/02msb5n36

Libro:
XXIX Congreso de la Sociedad Española de Procesamiento de Lenguaje Natural: SEPLN 2013
  1. Alberto Díaz Esteban (coord.)
  2. Iñaki Alegria Loinaz (coord.)
  3. Julio Villena Román (coord.)

Editorial: Sociedad Española para el Procesamiento del Lenguaje Natural

ISBN: 978-84-695-8349-4

Año de publicación: 2013

Páginas: 213-219

Congreso: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (29. 2013. Madrid)

Tipo: Aportación congreso

Resumen

Este artículo resume el trabajo planteado para nuestra participación en el TASS 2013, planteado como una extensión del trabajo realizado para el TASS 2012. El trabajo planteado el año anterior estaba enfocado en la clasificación de tweets basada en un enfoque de Recuperación de Información: las clases son modeladas de acuerdo a la información textual de los tweets pertenecientes a ellas y los tweets a ser clasificados son utilizados como query contra estos modelos. Este año hemos aplicado esta aproximación sobre las tareas de Sentiment Analysis y Topic Classification, pero este año nuestro trabajo está enfocado a analizar el tipo de información de los tweets a utilizar para llevar a cabo la clasificación y qué proceso debe seguirse para tener en cuenta esta información. En este sentido, hemos planteado diferentes tipos de modelado, así como diferente maneras de llevar a cabo el proceso de Recuperación de Información de acuerdo a los diferentes tipos de información. Los resultados obtenidos sugieren que si bien la utilización de este tipo de información es valiosa (especialmente las entidades nombradas), debe hacerse siempre en conjunto con el contenido global de los tweets.