Automated algorithms for spectroscopic classification of stars and applications to apogee

  1. Garcia Dias, Rafael Augusto
Dirixida por:
  1. Carlos Allende Prieto Director
  2. Jorge Sánchez Almeida Co-director

Universidade de defensa: Universidad de La Laguna

Fecha de defensa: 21 de setembro de 2018

Tribunal:
  1. Ramón Jesús García López Presidente/a
  2. Andrés Asensio Ramos Secretario/a
  3. Luis Manuel Sarro Vogal

Tipo: Tese

Teseo: 569115 DIALNET lock_openRIULL editor

Resumo

El gran volumen de datos generados por los surveys astronómicos modernas ofrece una oportunidad interesante para la aplicación de machine learning. Es esencial explorar todas las herramientas existentes y determinar cuáles son adecuadas para generar conocimiento científico a partir de la observación disponible. El objetivo principal de esta tesis es explorar la aplicación de algoritmos de aprendizaje automático para el estudio Apache Point Galactic Evolution Experiment (APOGEE). A pesar de nuestro enfoque en APOGEE, esta tesis proporciona una guía para la aplicación de los mismos algoritmos a otros conjuntos de datos similares. A lo largo de la tesis, utilizamos dos problemas astrofísicos para probar diferentes algoritmos de aprendizaje automático. Primero, abordamos la clasificación espectral de más de 150,000 estrellas con K-means. Proporcionamos un análisis detallado de las virtudes y limitaciones del algoritmo, y una descripción extensa de las clases generadas con K-means. En segundo lugar, nos centramos en el análisis de abundancias químicas probando ocho algoritmos de agrupación para explorar la viabilidad de una búsqueda a ciegas de poblaciones estelares en el espacio químico. Usando pruebas estadísticas, demostramos que algunos cúmulos de estrellas son indistinguibles entre sí en el espacio de abundancia de APOGEE. Con este resultado, ampliamos la noción de etiquetado químico a la búsqueda de poblaciones estelares a un nivel más allá de los cúmulos estelares, a la cual llamamos familias de estrellas. Finalmente, utilizamos el algoritmo t-distributed stochastic neighbor embedding (t-SNE) para proyectar el espacio de 13 dimensiones de las abundancias químicas de APOGEE en 2 dimensiones. Clasificamos las estrellas en esta proyección usando Density-Based Spatial Clustering of Applications with Noise (DBSCAN) y mostramos que la clasificación puede identificar familias de estrellas relacionadas con poblaciones estelares conocidas. Esta tesis ofrece una visión general del conjunto de datos APOGEE y también una guía para la aplicación de algunos algoritmos de agrupación no supervisados.