Síntesis de informacióndesarrollo y evaluación de un modelo interactivo
- Anselmo Peñas Padilla Director
- Julio Gonzalo Arroyo Director
Defence university: UNED. Universidad Nacional de Educación a Distancia
Fecha de defensa: 20 June 2006
- Felisa Vedejo Maillo Chair
- Eneko Agirre Bengoa Secretary
- Raquel Martínez Unannúe Committee member
- Horacio Rodríguez Hontoria Committee member
- Luis Vicedo José Committee member
Type: Thesis
Abstract
En esta tesis se desarrolla un modelo interactivo de acceso a la información orientado a la tarea de "Síntesis de Información", definida como el proceso de extraer, organizar y relacionar entre sí las piezas de información contenidas en un conjunto de documentos relevantes, con el fin de obtener un informe sin informe que satisfaga una necesidad de información compleja, En primer lugar, se realiza en esta tesis una revisión del estado del arte en cuanto a técnicas de resumen automático, tarea que subsume a la Síntesis de Información. Se revisan también los esquemas de interacción entre usuario y máquina en sistemas de acceso a la información, y metodología de evaluación. En segundo lugar, se desarrolla un marco de trabajo compuesto por un corpus de informes generados manualmente, ISCORPUS, y una metodología de evaluación, QARLA, adaptada a nuestro problema. En tercer lugar, se realiza una serie de estudios empíricos sobre el papel de los conceptos clave del asunto tratado en el informe, con vistas al desarrollo y evaluación de un modelo interactivo. Desde el análisis de ISCORPUS, se concluye que la tarea de síntesis de Información, es básicamente extractiva, y presenta diferencias importante dependiendo del tipo de tema tratado. Podemos distinguir entre los asuntos que evolucionan a lo largo del tiempo, (por ejemplo, "el rol del Gobierno España en la guerra de Irak", y los asuntos que tratan diferentes instancias de un mismos tipo de evento por ejemplo, "campañas europeas contra el racismo". QARLA es un marco de evaluación de sistemas de resumen desarrollado en el contexto de este trabajo. La entrada al marco consiste en un con junto de resúmenes de referencia generados manualmente, un conjunto de resúmenes de referencia generados automáticamente, y un conjunto de métrica de similitud. QARLA proporciona una medida para evaluar la calidad de cualquier conjunto de métricas de similitud, una medida para evaluar la calida