A Review of spatial probit models: estimation, model selection and applications focused on human behavior

DE LA LLAVE MONTIEL, MIGUEL ÁNGEL

A Review of spatial probit modelsestimation, model selection and applications focused on human behavior

DE LA LLAVE MONTIEL, MIGUEL ÁNGEL

Supervised by:

Fernando Antonio López Hernández Director

Defence university: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 28 June 2022

Committee:

Mariano Matilla García Chair
Manuel Ruiz Marín Secretary
Gema Fernández-Avilés Calderón Committee member

Type: Thesis

Teseo: 735416 DIALNET TESEO editor

Abstract

Esta Tesis Doctoral la conforman cuatro estudios independientes enmarcados dentro de la temática del modelo probit espacial. En el primer capítulo mostramos la evolución del conjunto de técnicas econométricas espaciales centrándonos en el probit espacial. Su estimación es un proceso complejo. La interdependencia de las observaciones conlleva la no esfericidad de los residuos y el problema conduce a maximizar el logaritmo de una distribución multivariante N-dimensional. Se desarrollan las metodologías propuestas hasta el momento:(Expectation-Maximization(EM), Generalización de los momentos(GMM), Gibbs Bayesian Sampling(Gibbs), Recursive Importance Sampling(RIS), GMM Lineal(LGMM) y Máxima Verosimilitud Aproximada(ML)). Entre las aportaciones más relevantes se encuentra el cálculo de la precisión en las estimaciones de dichos algoritmos a través de un ejercicio de Monte Carlo ante modelos autorregresivos espaciales. La principal diferencia entre los algoritmos es en el sesgo de los coeficientes y en el coste computacional. Destacan Gibbs y ML, proporcionando ambos una buena precisión y solo distinguiéndose en que Gibbs tiene un proceso de convergencia ligeramente más lento. Otra aportación es la evaluación de la relevancia del factor espacial dentro de la investigación en la modelización del comportamiento humano, concluyendo que aún no tiene un peso muy relevante. El segundo capítulo resolvemos el problema de fuga de clientes a través de un modelo autorregresivo espacial. El estudio se centra en resolver principalmente la correlación entre un set de datos y la variable endógena dicotómica encontrando una forma funcional idónea. El coeficiente autorregresivo del modelo final nos dice que un porcentaje significativo de la probabilidad final del cliente de abandonar la compañía viene por efectos marginales indirectos. Dentro del modelo espacial, introducimos dentro del proceso de estimación una fase de deslinealización a través de la técnica de Multivariate Adaptive Regression Splines(MARS). El modelo espacial final resultante del análisis muestra mejores estadísticos que el modelo clásico tanto en precisión como en idoneidad de los residuos. En el tercer capítulo profundizamos en los factores que mueven al usuario de una aplicación de compra por internet a permanecer inactivo por una larga duración. El modelo probit espacial mejora los resultados del modelo clásico y por lo tanto es una evidencia más sobre los beneficios de este tipo de modelización y su empleabilidad en la gestión de negocios. El comportamiento de la inactividad de clientes cercanos se demuestra estar codeterminado, detectándose conductas miméticas entre ellos. La especificación se ha mejorado con la búsqueda de patrones no-lineales con modelos generales aditivos(GAM) y con la incorporación de variables exógenas retardadas espacialmente. En el cuarto capítulo analizamos las consecuencias de una incorrecta especificación en un modelo probit espacial y abordamos la búsqueda de la correcta selección del probit. La principal aportación es la configuración de dos algoritmos de selección de la verdadera especificación del modelo probit espacial. Proponemos una estrategia de lo específico a lo general(Stge) y otra de lo general a lo específico(Gets). La comparativa entre ambas técnicas la realizamos a través de una simulación de Monte Carlo para 5 tipos de especificaciones reales: Modelo Independiente(SIM), Modelo Autorregresivo Espacial(SAR), Modelo de Dependencia Espacial en el Error(SEM), Modelo con variable retardada espacialmente(SLX) y Modelo autorregresivo con variable retardada espacialmente-Durbin(SDM). Las estrategias de selección presentan un rendimiento superior al 85% de casos correctamente seleccionados. Resulta difícil decidir contundentemente qué estrategia es la mejor. Bajo condiciones ideales Stge funciona ligeramente mejor que Gets. Sin embargo, cuando introducimos situaciones no ideales como entonces hay ciertas ocasiones que Gets es más precisa.