Cluster analysis and unsupervised machine learning applied to find open star clusters in the Milky Way

El objetivo principal de este proyecto es caracterizar cúmulos abiertos en la Vía Láctea por medio de aprendizaje automático no supervisado usando el algoritmo de agrupamiento Density-based spatial clustering of applications with noise (DBSCAN), usando la base de datos Gaia DR2 con el fin de obtener...

Full description

Autores:
Amar Lesmes, Andrés Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/51274
Acceso en línea:
http://hdl.handle.net/1992/51274
Palabra clave:
Vía Láctea
Astronomía
Cúmulos estelares
Aprendizaje automático (Inteligencia artificial)
Análisis cluster
Física
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
Description
Summary:El objetivo principal de este proyecto es caracterizar cúmulos abiertos en la Vía Láctea por medio de aprendizaje automático no supervisado usando el algoritmo de agrupamiento Density-based spatial clustering of applications with noise (DBSCAN), usando la base de datos Gaia DR2 con el fin de obtener datos estándares y usados en la literatura para su futura comparación. Los resultados del algoritmo DBSCAN muestran una eficiencia muy alta con respecto a lo comparado en la literatura para los cúmulos de Beehive, Pleiades, NGC 2451, Hyades, Blanco 1 y el cúmulo doble de Perseo. Las estructuras se filtraron de forma precisa y el análisis muestra que los diagramas de color magnitud son similares a la literatura. Se propuso un nuevo parámetro para el algoritmo DBSCAN encargado de optimizar el tiempo de ejecución, gananado así mismo tiempo de cómputo para grandes volúmenes de datos. Los miembros de cada cúmulo calculados son muy similares y en algunos casos superiores a los encontrados en la literatura. Para obtener un mejor modelamiento de los datos es preciso calcular detalladamente de forma iterativa combinaciones de parámetros.