"Website term browser", un sistema interactivo y multilingüe de búsqueda textual basado en técnicas lingüísticas
- Julio Gonzalo Arroyo Director
- María Felisa Verdejo Maíllo Directora
Universidad de defensa: UNED. Universidad Nacional de Educación a Distancia
Fecha de defensa: 17 de junio de 2002
- Horacio Rodríguez Hontoria Presidente/a
- Manuel de Buenaga Rodríguez Secretario/a
- Ana M. García Serrano Vocal
- Piek Vossen Vocal
- Raquel Martínez Unanue Vocal
Tipo: Tesis
Resumen
Los sistemas de búsqueda han adquirido una gran importancia en el uso cotidiano de los ordenamientos, Sin embargo, la recuperación de información textual tiene asociada una serie de problemas todavaía no resueltos satisfactoriamente. Algunos de estos problemas provienen de las características del lenguaje natural. Por esta razón, diversos autores se han interesado en la aplicación de técnicas lingüísticas automáticas a la recuperación de información, obteniendo resultados que hasta la fecha no son plenamente satisfactorios y que cuestionan la utilidad de estas técnicas en la búsqueda textual. En este trabajo se abordan los problemas de ambigüedad léxica, variación terminológica y translingüísmo en el acceso a la información, con la siguiente línea argumental: 1,- Estudio del papel de las técnicas lingüísticas en el modelo tradicional de recuperación y ordenación de documentos. 2,- Transición a un modelo interactivo en el que los resultados parciales del procesamiento lingüístico se ofrecen al usuario como caminos alternativos de contextualización de la consulta y de acceso a la información. 3,- Creación de un marco en el que sea posible la evaluación de estos sistemas interactivos de acceso a la información. La primera parte muestra una serie de experimentos de recuperación con el fin de discernir si la falta de buenos resultados se debe a los errores que introduce el procesamiento automático o si se debe a que las técnicas lingüísticas no resultan estrategias adecuadas en un modelo tradicional de recuperación de documentos. Estos experimentos se han llevado a cabo sobre una colección etiquetada manualmente en todos los niveles léxicos. De esta forma, los resultados de recuperación quedan libres de los errores de un procesamiento automático permitiendo determinar si las técnicas lingüísticas (en una situación ideal) suponen o no estrategias adecuadas para mejorar la recuperación. L