Paraphrase extraction from validated question answering corpora in Spanish

  1. Herrera, Jesús
  2. Peñas Padilla, Anselmo
  3. Verdejo Maíllo, María Felisa
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2007

Número: 39

Páginas: 37-44

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Partiendo del debate sobre la definición de paráfrasis, este trabajo intenta clarificar lo que las personas consideran como paráfrasis. El experimento realizado parte de una de las distintas campañas que generan cada año grandes cantidades de datos validados, susceptibles de ser reutilizados con diferentes fines. En este artículo se describe con detalle un método simple "fundamentado en reconocimiento de patrones y operaciones de inserción y eliminación", capaz de extraer una importante cantidad de paráfrasis de corpora de Pregunta-Respuesta evaluados. Se muestra además la evaluación realizada por expertos del corpus obtenido. Este trabajo ha sido realizado para el español.