Desambiguación léxica mediante marcas de especificidad
- Montoyo Guijarro, Andrés
- Manuel Palomar Sanz Doktorvater/Doktormutter
- Germán Rigau Claramunt Doktorvater/Doktormutter
Universität der Verteidigung: Universitat d'Alacant / Universidad de Alicante
Fecha de defensa: 21 von Juni von 2002
- Lluís Padró Cirera Präsident/in
- Patricio Martínez Barco Sekretär/in
- Julio Gonzalo Arroyo Vocal
- Eneko Agirre Bengoa Vocal
- Ferrán Pla Vocal
Art: Dissertation
Zusammenfassung
Esta Tesis presenta un método para resolver la ambigüedad léxica pura (semántica) en textos de dominios no restringidos en cualquier lengua que tenga un repositorio de sentidos organizado como una base de conocimiento léxica, A este método de resolución de la ambigüedad léxica pura propuesto se denomina Método de Marcas de Especificidad y se basa en el uso de conocimiento lingüístico (información léxica y morfológica) y de conocimiento a partir de las relaciones léxicas y semánticas de la taxonomía de nombres de la base de conocimiento léxica WordNet. Además, se presenta la aplicación del método de Marcas de Especificidad con el objetivo de enriquecer semánticamente WordNet con etiquetas de dominio o categorías de otros sistemas de clasificación. Las principales aportaciones de esta Tesis son: * La definición de la noción de Marca de Especificidad, la cual formaliza la relación entre sentidos que se basan en taxonomías. La Marca de Especificidad se aprovecha de la información suministrada por las relaciones de sinonimia, hiperonimia. Aunque en esta Tesis se ha utilizado para nombres, se puede adecuar para trabajar con verbos. Con la utilización de las Marcas de Especificidad se aporta una noción como base para la desambiguación del sentido de las palabras, los cuales están unidos a través de conceptos en las taxonomías. Además, la aplicación de esta noción no requiere desambiguación manual previa para aplicarse. * La definición de un método basado en las Marcas de Especificidad, el cual utiliza el paradigma de los métodos basados en conocimiento, y en concreto que suministra la base de conocimiento léxica WordNet. Debido a las características de las Marcas de Especificidad, se ha diseñado un método que desambigua nombres de un texto libre según estén organizados los sentidos de las palabras en la taxonomía. Por tal motivo, este método puede aplicarse a textos de diferentes idiomas sin