Selección de contenidos a partir de un corpus enriquecido y especializado para la generación personalizada de documentos

  1. BARRUTIETA ANDUIZA, GUILLERMO
Dirigée par:
  1. Josuka Díaz Labrador Directeur/trice
  2. Joseba Abaitua Co-directeur/trice

Université de défendre: Universidad de Deusto

Fecha de defensa: 29 avril 2004

Jury:
  1. Mikel L. Forcada Zubizarreta President
  2. Francisco Javier Oliver Bernal Secrétaire
  3. Xavier Gómez Guinovart Rapporteur
  4. Ana M. García Serrano Rapporteur
  5. Anselmo del Moral Bueno Rapporteur

Type: Thèses

Teseo: 106025 DIALNET

Résumé

En esta tesis se aborda el uso de la tecnología XML combinada con el marco de análisis de la estructura retórica del discurso RST para la generación de documentos personalizados. Se ha formalizado la construcción del documento maestro. Para esa formalización se utiliza XML-DTD, con la que se representa digitalmente el texto y las referencias a los elementos multimedia que componen el documento maestro. Adicionalmente las etiquetas XML explicitan la estructura del discurso de acuerdo a una variante de la teoría RST que analiza el documento en función de unos segmentos de texto que agrupan una o más de una frase con un mismo objetivo comunicativo. El usuario está modelizado en función de unos aspectos independientes del propio documento en sí. El enfoque utilizado para la implementación del algoritmo de selección de contenido está basado en la utilización de una serie de filtros XSL en cascada que implementan computacionalmente, junto con su mecanismo de activación, dicho algoritmo. Estos filtros tienen como misión la discriminación de las partes del documento maestro que mejor satisfacen las necesidades de información del usuario para incluirlas en el documento a generar. La experimentación y la evaluación-validación se ha llevado a cabo con la construcción de un sistema denominado CourseViewGenerator. Los buenos resultados obtenidos permiten afirmar que tanto la formación del documento maestro como el enfoque utilizado para la implementación del algoritmo de selección de contenido constituyen una aportación al campo de la generación de documentos.