Técnicas de expansión en los sistemas de recuperación de información
- ZAZO RODRIGUEZ, ÁNGEL FRANCISCO
- Luis Carlos García de Figuerola Paniagua Director/a
Universidad de defensa: Universidad de Salamanca
Fecha de defensa: 19 de septiembre de 2003
- Luis Antonio Miguel Quintales Presidente/a
- Francisco José García Peñalvo Secretario/a
- Francisco Sanchis Marco Vocal
- Julio Gonzalo Arroyo Vocal
- Ernest Abadal Vocal
Tipo: Tesis
Resumen
Esta tesis, después de analizar el estado del arte en recuperación clásica de la información, analiza el proceso de expansión de consultas. Con la expansión de consultas se pretende mejorar la recuperación respecto de una primera consulta, y es especialmente interesante con consultas cortas, ya que su grado de ambigüedad es más alto. Frecuentemente los usuarios no encuentran respuestas adecuadas a sus necesidades informativas, debido fundamentalmente a problemas de inconsistencia de vocabulario, y tienen que replantear su consulta al sistema. Cuando el proceso se hace automáticamente, la expansión conlleva una ampliación de nuevos términos a la consulta inicial y un recálculo de la importancia de cada término en la nueva consulta. En este contexto, las dos dificultades principales son: A,- La selección de los términos más adecuados para añadir a la consulta original. B,- La elección del mecanismo de pesado de los nuevos términos. En esta tesis se describen y analizan las diferentes técnicas existentes hoy día en expansión de consultas, y se realiza una amplia gama de experimentos conducentes a obtener cirterios de aplicabilidad los suficientemente robustos en diferentes condiciones. Sistemáticamente se desarrollan los experimentos utilizando dos colecciones documentales de prueba bastante diferentes en tamaño y calidad, una de ellas desarrollada en el grupo de investigación del doctorando, y la otra desarrolla en las conferencias CLEF. Son especialmente interesantes los experimentos y resultados en expansión utilizando tesauros de asociación y similitud, aplicados global y localmente.