Collaboratively authored web contents as resources for word sense disambiguation and discovery

  1. Santamaría Recio, María Celina
Supervised by:
  1. Julio Gonzalo Arroyo Director
  2. María Felisa Verdejo Maíllo Director

Defence university: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 09 July 2010

Committee:
  1. Ana M. García Serrano Chair
  2. Raquel Martínez Unanue Secretary
  3. Andrés Montoyo Guijarro Committee member
  4. Paloma Martínez Fernández Committee member
  5. Luis Alfonso Ureña López Committee member

Type: Thesis

Abstract

En esta tesis, hemos abordado el uso de contenidos de la Red creados colaborativamente, considerándolos fuentes de información léxica, para realizar desambiguación y descubrimiento de sentidos. Nos hemos centrado en dos recursos, el Open Directory Project (ODP) y Wikipedia, ambos colaborativos pero con planteamientos diferentes: ODP organiza jerárquicamente sitios Web por dominios (información implícita); Wikipedia es un repositorio enciclopédico de conocimiento explícito asociado a un lexicón, de amplia cobertura y continuamente actualizado.