Extracción y aprovechamiento de DTDs emparejadas en corpus paralelos
- Casillas Rubio, Arantza
- Martínez Unanue, Raquel
- Abaitua, Joseba
ISSN: 1135-5948
Ano de publicación: 1999
Número: 25
Páxinas: 33-41
Tipo: Artigo
Outras publicacións en: Procesamiento del lenguaje natural
Resumo
El artículo presenta un algoritmo que permite abstraer DTDs a partir de textos etiquetados en SGML. Estas DTDs se utilizan luego para generar textos similares. El algoritmo se ha aplicado a un corpus paralelo y con ello se han obtenido DTDs emparejadas que permiten generar nuevos documentos bilingües. Esta metodología supone una importante contribución al campo de la edición plurilingüe.