Hacia un modelo lingüístico de resumen automático de artículos médicos en español

  1. CUNHA FANEGO, IRIA DA
unter der Leitung von:
  1. Leo Wanner Doktorvater/Doktormutter
  2. María Teresa Cabré Co-Doktorvater/Doktormutter

Universität der Verteidigung: Universitat Pompeu Fabra

Fecha de defensa: 25 von April von 2008

Gericht:
  1. Horacio Rodríguez Hontoria Präsident/in
  2. Jaume Llopis Pérez Sekretär/in
  3. Horacio Saggion Vocal
  4. Irene Castellón Masalles Vocal
  5. Juan Manuel Torres Moreno Vocal

Art: Dissertation

Teseo: 265983 DIALNET lock_openTDX editor

Zusammenfassung

En esta tesis se presenta un modelo lingüístico de resumen automático de artículos médicos en español que aúna criterios basados en la estructura textual, en las unidades léxicas y la estructura discursiva y sintáctico-comunicativa de los textos. El modelo se crea partiendo de la hipótesis de que los especialistas de cada ámbito emplean estrategias específicas a la hora de resumir. La validación de esta hipótesis mediante experimentos estadísticos permite tomar los artículos médicos acompañados de sus respectivos resúmenes como material de referencia para analizar, de cara a detectar las estrategias empleadas por los profesionales médicos para resumir sus textos. Una vez detectadas, estas estrategias se formalizan en forma de reglas y se diseña un modo de integración de las mismas. Esto da lugar al modelo presentado en esta tesis, del cual se implementa una parte. Los resúmenes resultantes se evalúan obteniendo buenos resultados, lo cual confirma que el modelo simula correctamente las estrategias empleadas por los especialistas y que estas se refieren a diversos aspectos lingüísticos.