Marco de referencia para el análisis comparativo de métodos de generación de poblaciones sintéticas

  1. CASTILLA ALCALÁ, GUILLERMO
Supervised by:
  1. Alfonso Durán Heras Director
  2. Isabel García Gutiérrez Co-director

Defence university: Universidad Carlos III de Madrid

Fecha de defensa: 15 January 2019

Committee:
  1. Manuel Alonso Castro Gil Chair
  2. Bernardo Prida Romero Secretary
  3. Raúl Poler Escoto Committee member

Type: Thesis

Abstract

En esta tesis se introducen los conceptos de datos y poblaciones sintéticas, su utilidad y los métodos utilizados para generarlos. Se lleva a cabo una revisión y clasificación de dichos métodos y se plantea un marco de referencia donde posicionarlos y poder establecer análisis comparativos entre métodos de generación de poblaciones sintéticas. Se definen los potenciales escenarios, se posicionan los métodos más adecuados para los distintos escenarios y se describe la metodología para llevar a cabo el análisis comparativo de métodos que permite determinar si hay diferencias estadísticamente significativas entre los rendimientos de los métodos y analizar la influencia de distintos factores en el rendimiento de los mismos. Se realizan tres estudios cuantitativos experimentales conforme al marco de referencia propuesto, en los que se obtienen conclusiones sobre el rendimiento relativo de los métodos. El primero de los estudios presenta una comparativa de métodos basados en dos enfoques de uso frecuentemente en la generación de poblaciones, IPF y Simulated Annealing, utilizando poblaciones de referencia y realizando contraste de hipótesis para establecer la significatividad estadística de los resultados obtenidos. Se aplica esta metodología para comparar las dos técnicas y realizar un análisis de sensibilidad en varios escenarios con cada una de las poblaciones de referencias. Las conclusiones pueden ser útiles para los profesionales, particularmente teniendo en cuenta que el redondeo BLP fue propuesto después de que se hubieran publicado análisis comparativos donde distintos autores obtienen mejores resultados para SA que para IPF. En el segundo estudio se comparan métodos de generación de poblaciones multinivel (hogares e individuos) siguiendo la misma metodología. Y en el tercero se analiza el problema que plantea el uso de muestras no representativas. Se propone una estrategia para abordar este problema y se compara con otras estrategias tradicionales, Los análisis comparativos realizados aportan claridad en el campo de los métodos y algoritmos de generación de poblaciones sintéticas multinivel, facilitando a los investigadores nuevas valoraciones para la selección de métodos y técnicas de generación de poblaciones. Esta tesis contribuye a ayudar al investigador a determinar, en cada situación, los métodos que generan las poblaciones que representan al mundo real con mayor precisión, permitiéndole mejorar la calidad de los resultados de las simulaciones y obtener resultados más verídicos.