Análisis de sensibilidad a la evidencia en redes bayesianas gaussianas
- Viviani García, Paola Mariluz
- Paloma Main Yaque Director/a
- Miguel Ángel Gómez Villegas Director/a
Universidad de defensa: Universidad Complutense de Madrid
Fecha de defensa: 05 de junio de 2014
- Beatriz González Pérez Presidente/a
- Luis Sanz San Miguel Secretario/a
- Jorge Martín Arevalillo Vocal
- Juan Miguel Marín Díazaraque Vocal
- Julián de la Horra Navarro Vocal
Tipo: Tesis
Resumen
En general, una red Bayesiana busca modelar algún fenómeno de interés, considerando las variables aleatorias involucradas en el problema y la estructura de dependencia existente entre ellas. Así, el objetivo principal consiste en obtener la distribución de probabilidad condicionada de las variables que no son conocidas, principalmente de alguna de ellas definida como variable respuesta, en base a las variables que sí lo son (variables evidenciales). En este trabajo se consideran redes Bayesianas Gaussianas, es decir redes donde la distribución de probabilidad conjunta asociada a las variable tiene distribución Normal Multivariante.Considerando estos modelos, se propone una metodología para tratar el análisisde sensibilidad a la evidencia en redes Bayesianas Gaussianas. En muchos problemas en que se busca modelar situaciones reales, el conjunto de variables evidenciales no está previamente definido; de hecho, es una práctica usual el intentar recoger la mayor cantidad de información posible, lo cual siempre tendrá un coste asociado. La principal motivación de esta propuesta nació de la idea de que no todas las variables de una RBG influyen de igual manera en la variable de interés. Es importante recalcar en este contexto, que el objetivo del procedimiento consiste en identificar entre las variables disponibles, cuál o cuáles, intervienen más para disminuir la entropía del objetivo, entendiendo esto como una disminución de la incertidumbre.Una segunda aportación del trabajo, consiste en la utilización de la información mutua normalizada para detectar el valor informativo de cada variable respecto del objetivo. Esta extensión al procedimiento, permite que además de priorizar variables en el sentido ya expuesto, sea posible comparar el aporte de diferentes variables alternativas en una misma red, o variables similares en redes distintas. Hasta ahora, en general, los análisis en RBG desarrollados, habían sido de tipo teórico. Luego, una aportación importante de este trabajo fue realizar una aplicación a datos reales. Sin embargo, este procedimiento llevó a enfrentar algunos hechos que no estaban considerados de manera teórica. En primer lugar, la revisión del supuesto de Normalidad. Al trabajar con redes ajustadas bajo el enfoque tradicional, se asume la Normalidad y se desarrollan los análisis sin problema. En cambio, al considerar una base de datos real, se hace necesario revisar el cumplimiento del supuesto de Normalidad. Así, en este trabajo se hizo una búsqueda de diferentes metodologías, y se aplicó un test de Normalidad Multivariante que permite responder a este supuesto.Por otro lado, frente al rechazo de la hipótesis de Normalidad, queda planteado un nuevo problema: cómo resolver la falta de Normalidad para poder ajustar una RedBayesiana Gaussiana. Para responder, se propone considerar para la matriz de datos la distribución Nonparanormal, que a través de una transformación semiparamétrica, permite obtener una matriz de datos que cumple el supuesto de Normalidad. Este hecho toma gran importancia ante la posibilidad de utilizar las redes Bayesianas como una verdadera herramienta de modelado de la realidad, ya que es muy frecuente que datos reales no sigan una distribución Normal Multivariante.