Paraphrase extraction from validated question answering corpora in Spanish
- Herrera, Jesús
- Peñas Padilla, Anselmo
- Verdejo Maíllo, María Felisa
ISSN: 1135-5948
Año de publicación: 2007
Número: 39
Páginas: 37-44
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Partiendo del debate sobre la definición de paráfrasis, este trabajo intenta clarificar lo que las personas consideran como paráfrasis. El experimento realizado parte de una de las distintas campañas que generan cada año grandes cantidades de datos validados, susceptibles de ser reutilizados con diferentes fines. En este artículo se describe con detalle un método simple "fundamentado en reconocimiento de patrones y operaciones de inserción y eliminación", capaz de extraer una importante cantidad de paráfrasis de corpora de Pregunta-Respuesta evaluados. Se muestra además la evaluación realizada por expertos del corpus obtenido. Este trabajo ha sido realizado para el español.