Selección de contenidos a partir de un corpus enriquecido y especializado para la generación personalizada de documentos

  1. BARRUTIETA ANDUIZA, GUILLERMO
Dirigida per:
  1. Josuka Díaz Labrador Director/a
  2. Joseba Abaitua Codirector/a

Universitat de defensa: Universidad de Deusto

Fecha de defensa: 29 de d’abril de 2004

Tribunal:
  1. Mikel L. Forcada Zubizarreta President/a
  2. Francisco Javier Oliver Bernal Secretari/ària
  3. Xavier Gómez Guinovart Vocal
  4. Ana M. García Serrano Vocal
  5. Anselmo del Moral Bueno Vocal

Tipus: Tesi

Teseo: 106025 DIALNET

Resum

En esta tesis se aborda el uso de la tecnología XML combinada con el marco de análisis de la estructura retórica del discurso RST para la generación de documentos personalizados. Se ha formalizado la construcción del documento maestro. Para esa formalización se utiliza XML-DTD, con la que se representa digitalmente el texto y las referencias a los elementos multimedia que componen el documento maestro. Adicionalmente las etiquetas XML explicitan la estructura del discurso de acuerdo a una variante de la teoría RST que analiza el documento en función de unos segmentos de texto que agrupan una o más de una frase con un mismo objetivo comunicativo. El usuario está modelizado en función de unos aspectos independientes del propio documento en sí. El enfoque utilizado para la implementación del algoritmo de selección de contenido está basado en la utilización de una serie de filtros XSL en cascada que implementan computacionalmente, junto con su mecanismo de activación, dicho algoritmo. Estos filtros tienen como misión la discriminación de las partes del documento maestro que mejor satisfacen las necesidades de información del usuario para incluirlas en el documento a generar. La experimentación y la evaluación-validación se ha llevado a cabo con la construcción de un sistema denominado CourseViewGenerator. Los buenos resultados obtenidos permiten afirmar que tanto la formación del documento maestro como el enfoque utilizado para la implementación del algoritmo de selección de contenido constituyen una aportación al campo de la generación de documentos.