La identificación de sublenguajes con fines computacionales basado en corpus electrónicos y en lengua inglesa y en la aplicación de herramientas de análisis y comparación a partir del Modelo Multidimensional de Biber

López Sanjuán, Victoria

La identificación de sublenguajes con fines computacionales basado en corpus electrónicos y en lengua inglesa y en la aplicación de herramientas de análisis y comparación a partir del Modelo Multidimensional de Biber

López Sanjuán, Victoria

Dirigida por:

Elena Bárcena Madera Directora

Universidad de defensa: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 13 de noviembre de 2006

Tribunal:

Aquilino Sánchez Pérez Presidente/a
Beatriz Rodríguez López Secretaria
María Elena Gómez Parra Vocal
Pascual Cantos Gómez Vocal
Martin Read Thimothy Vocal

Tipo: Tesis

Teseo: 138519 DIALNET

Resumen

En el tratamiento computacional delos corpus hoy en día destaca el de los sublenguajes. Es un tipo de variante lingüística que ha cobrado gran importancia en las últimas décadas debido, en primer lugar, a las múltiples dificultades en el tratamiento informatizado de lenguas generales, por ejemplo, cuando se trabaja con aplicaciones del Procesamiento del Lenguaje Natural (PLN) y, en segundo lugar, a su propio interés objetivo en el mundo científico y profesional de hoy. Todo ello ha conducido a la identificación de variantes lingüísticas temáticas, y a la adopción de líneas de investigación ex profeso. Los sublenguajes, que se han definido com ola lengua de un su género textual, identificado a partir de un dominio y género dados, se caracterizan por una serie de rasgos lingüísticos, tanto comunes como divergentes con respecto a la lengua estándar. Estas características pueden ser léxicas, semánticas, morfosintácticas y discursivas. En esta tesis se ha estudiado la utilidad de los corpus lingüísticos en lengua inglesa en los estudios sobre sublenguajes y se ha establecido que los corpus son una fuente de información idónea como base a un estudio de sublenguajes si se procesa con un conjunto de herramientas estándar adecuadas. En segundo lugar, se a investigado la adecuación de las herramientas de análisis existentes en la actualidad a los estudios de sublenguajes. Se ha procesado el corpus con las herramientas de ayuda existentes y ver su validez a la hora de tratar de identificar sublenguajes. Por último, se han analizado los posibles usos de los sublenguajes en diferentes aplicaciones de PLN y se ha determinado si los sublenguajes pueden aportar mayor precisión en el desarrollo de herramientas de PLN, debido a su naturaleza restringida.