Polisemia y proximidad semántica a través de relaciones entre sentidosenriquecimiento de redes léxico-semánticas
- Chugur, Irina
- Julio Gonzalo Arroyo Director
Universidade de defensa: UNED. Universidad Nacional de Educación a Distancia
Fecha de defensa: 18 de xuño de 2007
- María Felisa Verdejo Maíllo Presidente/a
- Anselmo Peñas Padilla Secretario
- Germán Rigau Claramunt Vogal
- María Antonia Martí Antonín Vogal
- Ana M. García Serrano Vogal
Tipo: Tese
Resumo
En la tesis se presentan varias vías de enriquecimiento de dos redes léxico-semánticas WordNet (WN) y Euro WordNet (EWN). Aunque los sentidos de una palabra en estos recursos se pueden definir explícitamente por medio de las glosas, la información más importante que caracteriza cada sentido es la que se codifica de forma implícita, a través de enlaces entre nodos. El presente trabajo se centra precisamente en este último componente de los sentidos en WN y EWN: sus relaciones semánticas. Más específicamente, este objetivo general se desglosa en dos líneas: 1,- Codificación de relaciones intercategoriales en el contexto del desarrollo de EWN. 2,- Anotación de relaciones entre los sentidos de palabras polisémicas. En primer lugar, estudiamos la posibilidad de utilizar vínculos morfológicos para codificar relaciones semánticas intercategoriales entre nombres y verbos en WN español. La base de datos léxica enriquecida con estas nuevas relaciones ofrece una colección de prueba muy interesante para aplicaciones de recuperación de información, dando el destacado papel que los nombres y los verbos desempeñan en la semántica de un documento. El mismo objetivo de convertir el WN español en una red más tupida y con una mayor cobertura motivó el trabajo dedicado a la incorporación de adjetivos al WN español. En este marco se han analizado dos acercamientos a la incorporación de nuevas unidades a un WN: 1,- Tratamos de aprovechar la información disponible en diccionarios monolingües para extraer adjetivos y enlazarlos con nombres y verbos ya incorporados a la base de datos, basándonos en las relaciones que unen en el diccionario el adjetivo de la entrada y los términos relevantes de su definición. 2,- Trasladando el centro de interés desde la extracción de relaciones semánticas a la creación automática de synsets adjetivales, abandonamos el enfoque monolingüe para explorar el método bilingüe, plante Q