Selección de contenidos a partir de un corpus enriquecido y especializado para la generación personalizada de documentos

  1. BARRUTIETA ANDUIZA, GUILLERMO
Zuzendaria:
  1. Josuka Díaz Labrador Zuzendaria
  2. Joseba Abaitua Zuzendarikidea

Defentsa unibertsitatea: Universidad de Deusto

Fecha de defensa: 2004(e)ko apirila-(a)k 29

Epaimahaia:
  1. Mikel L. Forcada Zubizarreta Presidentea
  2. Francisco Javier Oliver Bernal Idazkaria
  3. Xavier Gómez Guinovart Kidea
  4. Ana M. García Serrano Kidea
  5. Anselmo del Moral Bueno Kidea

Mota: Tesia

Teseo: 106025 DIALNET

Laburpena

En esta tesis se aborda el uso de la tecnología XML combinada con el marco de análisis de la estructura retórica del discurso RST para la generación de documentos personalizados. Se ha formalizado la construcción del documento maestro. Para esa formalización se utiliza XML-DTD, con la que se representa digitalmente el texto y las referencias a los elementos multimedia que componen el documento maestro. Adicionalmente las etiquetas XML explicitan la estructura del discurso de acuerdo a una variante de la teoría RST que analiza el documento en función de unos segmentos de texto que agrupan una o más de una frase con un mismo objetivo comunicativo. El usuario está modelizado en función de unos aspectos independientes del propio documento en sí. El enfoque utilizado para la implementación del algoritmo de selección de contenido está basado en la utilización de una serie de filtros XSL en cascada que implementan computacionalmente, junto con su mecanismo de activación, dicho algoritmo. Estos filtros tienen como misión la discriminación de las partes del documento maestro que mejor satisfacen las necesidades de información del usuario para incluirlas en el documento a generar. La experimentación y la evaluación-validación se ha llevado a cabo con la construcción de un sistema denominado CourseViewGenerator. Los buenos resultados obtenidos permiten afirmar que tanto la formación del documento maestro como el enfoque utilizado para la implementación del algoritmo de selección de contenido constituyen una aportación al campo de la generación de documentos.