La identificación de sublenguajes con fines computacionales basado en corpus electrónicos y en lengua inglesa y en la aplicación de herramientas de análisis y comparación a partir del Modelo Multidimensional de Biber

  1. López Sanjuán, Victoria
Supervised by:
  1. Elena Bárcena Madera Director

Defence university: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 13 November 2006

Committee:
  1. Aquilino Sánchez Pérez Chair
  2. Beatriz Rodríguez López Secretary
  3. María Elena Gómez Parra Committee member
  4. Pascual Cantos Gómez Committee member
  5. Martin Read Thimothy Committee member

Type: Thesis

Teseo: 138519 DIALNET

Abstract

En el tratamiento computacional delos corpus hoy en día destaca el de los sublenguajes. Es un tipo de variante lingüística que ha cobrado gran importancia en las últimas décadas debido, en primer lugar, a las múltiples dificultades en el tratamiento informatizado de lenguas generales, por ejemplo, cuando se trabaja con aplicaciones del Procesamiento del Lenguaje Natural (PLN) y, en segundo lugar, a su propio interés objetivo en el mundo científico y profesional de hoy. Todo ello ha conducido a la identificación de variantes lingüísticas temáticas, y a la adopción de líneas de investigación ex profeso. Los sublenguajes, que se han definido com ola lengua de un su género textual, identificado a partir de un dominio y género dados, se caracterizan por una serie de rasgos lingüísticos, tanto comunes como divergentes con respecto a la lengua estándar. Estas características pueden ser léxicas, semánticas, morfosintácticas y discursivas. En esta tesis se ha estudiado la utilidad de los corpus lingüísticos en lengua inglesa en los estudios sobre sublenguajes y se ha establecido que los corpus son una fuente de información idónea como base a un estudio de sublenguajes si se procesa con un conjunto de herramientas estándar adecuadas. En segundo lugar, se a investigado la adecuación de las herramientas de análisis existentes en la actualidad a los estudios de sublenguajes. Se ha procesado el corpus con las herramientas de ayuda existentes y ver su validez a la hora de tratar de identificar sublenguajes. Por último, se han analizado los posibles usos de los sublenguajes en diferentes aplicaciones de PLN y se ha determinado si los sublenguajes pueden aportar mayor precisión en el desarrollo de herramientas de PLN, debido a su naturaleza restringida.