Authority and priority signals in Online Reputation Monitoring

  1. Rodríguez Vidal, Javier
Dirixida por:
  1. Julio Gonzalo Arroyo Director
  2. Laura Plaza Morales Director

Universidade de defensa: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 30 de novembro de 2018

Tribunal:
  1. Pablo Castells Azpilicueta Presidente/a
  2. Víctor Fresno Fernández Secretario
  3. Miriam Fernández Sánchez Vogal

Tipo: Tese

Resumo

La Monitorización de la Reputación Online (ORM) es un conjunto de técnicas que ayudan a monitorizar y mejorar la imagen de una determinada entidad (empresa, organización, individuo) en Internet. Los expertos en ORM tratan de minimizar el impacto negativo de cierta información sobre la imagen de la entidad, maximizando al mismo tiempo el material positivo. Para ello, los expertos en reputación necesitan localizar toda la información (buena o mala) relacionada con la entidad en redes sociales, blogs, sitios especializados, sitios de noticias, etc. para producir informes de reputación, que resumen los temas más importantes relacionados con la entidad detectando oportunamente posibles alertas de reputación, y respondiendo instantáneamente a cuestiones controvertidas o para disipar rumores maliciosos. Antes de la existencia de Internet, el acceso a la información estaba controlado, y sólo las opiniones de personas de gran reputación (periodistas, científicos, etc.) eran tenidas en cuenta por el resto de la población. Hoy en día, ha surgido una nueva figura, especialmente en las redes sociales, que, sin acreditar ningún tipo de autoridad o conocimiento especializado, consigue cambiar la opinión de otros usuarios dentro de una comunidad, los llamados influencers. Estos influencers tienen una legión de seguidores detrás de ellos, de modo que cualquier mensaje negativo sobre las entidades puede ser difundido inmediatamente entre cientos de miles de usuarios, que a su vez lo transmiten a sus seguidores, etc. Pudiendo causar una crisis de reputación muy grave. La detección de influencers es esencial para el proceso de ORM que llevan a cabo los expertos en reputación, pero no es fácil identificar a los influencers, ya que no sólo depende del número de seguidores, sino también del tipo de seguidores que tenga el perfil, el dominio, etc. En esta Tesis, nos centramos en la detección de influencers, específicamente, en Twitter. Para ello, presentamos un estudio exhaustivo de las señales extraídas e introducimos dos formas diferentes de abordar la tarea de detección de influencers: (i) utilizando la información procedente de los perfiles de los que queremos descubrir su identidad; (ii) realizando una búsqueda ascendente en la que utilizamos la información relativa a los seguidores para caracterizar los perfiles que siguen. Por otro lado, la información que se ha extraído sobre las entidades debe incluirse en un informe de reputación. Estos informes recogen y resumen todos los temas que pueden afectar a la reputación de las entidades y que se debaten en las redes sociales. Dado que la cantidad de datos sobre las entidades que se pueden extraer de Internet es enorme, es imposible que un ser humano pueda leerlos todos en un tiempo razonable. Además, puede haber información repetida, por lo que los expertos de ORM deben seleccionar aquellas opiniones que sean más útiles y mostrarlas sin repeticiones al cliente. Como las opiniones de los influencers son amenazas potenciales para la reputación de las entidades, ya que tienen la capacidad de atraer a muchas personas, son buenos candidatos para aparecer en el informe de reputación. En esta tesis, estudiamos la generación automática de informes a partir de resúmenes extractivos de aquellos tweets que son más relevantes para las entidades. Esta relevancia se calcula a partir de las señales que miden la autoridad y el conocimiento del dominio de un usuario junto con otras señales conocidas en el estado-del-arte de la tarea de generación automática de resúmenes (como son la centralidad, la polaridad, etc.).