Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables

Este trabajo pretende realizar la implementación de métodos de aprendizaje supervisado en la clasificación de estrellas variables en el disco y bulbo de la Vía Láctea usando las series de tiempo en banda I de los catálogos ASAS II y OGLE II. La clasificación se hizo en las siguientes clases: Cefeida...

Full description

Autores:
González Aguilera, Juan Pablo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2019
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/45156
Acceso en línea:
http://hdl.handle.net/1992/45156
Palabra clave:
Estrellas variables
Aprendizaje automático (Inteligencia artificial)
Análisis del vecino más cercano (Estadística)
Astrofísica
Vía láctea
Física
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
id UNIANDES2_0d01f290f65f8bd61fee0f2dd6a3f45c
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/45156
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.es_CO.fl_str_mv Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
title Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
spellingShingle Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
Estrellas variables
Aprendizaje automático (Inteligencia artificial)
Análisis del vecino más cercano (Estadística)
Astrofísica
Vía láctea
Física
title_short Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
title_full Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
title_fullStr Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
title_full_unstemmed Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
title_sort Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
dc.creator.fl_str_mv González Aguilera, Juan Pablo
dc.contributor.advisor.none.fl_str_mv García Varela, José Alejandro
dc.contributor.author.none.fl_str_mv González Aguilera, Juan Pablo
dc.contributor.jury.none.fl_str_mv Sabogal Martínez, Beatriz Eugenia
dc.subject.armarc.es_CO.fl_str_mv Estrellas variables
Aprendizaje automático (Inteligencia artificial)
Análisis del vecino más cercano (Estadística)
Astrofísica
Vía láctea
topic Estrellas variables
Aprendizaje automático (Inteligencia artificial)
Análisis del vecino más cercano (Estadística)
Astrofísica
Vía láctea
Física
dc.subject.themes.none.fl_str_mv Física
description Este trabajo pretende realizar la implementación de métodos de aprendizaje supervisado en la clasificación de estrellas variables en el disco y bulbo de la Vía Láctea usando las series de tiempo en banda I de los catálogos ASAS II y OGLE II. La clasificación se hizo en las siguientes clases: Cefeidas, RR Lyrae, candidatas a Be, binarias eclipsantes y variables de largo periodo. Se usaron los siguientes métodos en RStudio: k-vecinos más cercanos, máquinas de soporte vectorial, árboles de clasificación y bosques aleatorios. Se usaron los datos clasificados de OGLE IV y una muestra de estrellas Be de la Gran Nube de Magallanes para entrenar los algoritmos con un conjunto de cinco estadísticos robustos para reducir el costo computacional de eliminación de datos atípicos. Los estadísticos utilizados son: desviación mediana absoluta como estimador de escala, sesgo octil como estimador de sesgo, peso octil izquierdo y derecho como estimadores de peso de colas y valor Abbe modificado como estimador de suavidad. Un acercamiento preliminar de la clasificación mostró una alta confusión entre Cefeidas y RR Lyrae, por lo que se decidió definir una súper-clase que las contenía a las dos. Sin embargo, generar un muestreo preliminar con la súper-clase definida es de gran utilidad como una preselección para luego calcular los periodos a una menor cantidad de estrellas debido a que el cálculo de periodos tiene un costo computacional mucho más alto. El método de clasificación con mejor desempeño individual fue bosques aleatorios, con un mayor número de aciertos sobre la muestra de entrenamiento que los demás. Se implementó este método de manera binaria por cada clase para los catálogos de ASAS II y OGLE II.
publishDate 2019
dc.date.issued.none.fl_str_mv 2019
dc.date.accessioned.none.fl_str_mv 2020-09-03T15:51:14Z
dc.date.available.none.fl_str_mv 2020-09-03T15:51:14Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/45156
dc.identifier.pdf.none.fl_str_mv u827068.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/45156
identifier_str_mv u827068.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 62 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Física
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ciencias
dc.publisher.department.es_CO.fl_str_mv Departamento de Física
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/16de726c-0bca-4e6a-8e82-1cceff487948/download
https://repositorio.uniandes.edu.co/bitstreams/c92e74c5-3528-4992-b322-cae072f653da/download
https://repositorio.uniandes.edu.co/bitstreams/d046dbad-fa90-4aa1-9be2-d63b938bd3b9/download
bitstream.checksum.fl_str_mv df94fa807653edf383bae7af467216d0
de601431ae26e9da2d06d42110bf3633
70125aa5ea844bc20362037bf5a085e2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1808390451443531776
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2García Varela, José Alejandrodeebb2fd-a5d2-4279-99c0-13e7ac37f091400González Aguilera, Juan Pabloc73b9a7e-a5b5-439e-96ec-921f9d724ad0500Sabogal Martínez, Beatriz Eugenia2020-09-03T15:51:14Z2020-09-03T15:51:14Z2019http://hdl.handle.net/1992/45156u827068.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este trabajo pretende realizar la implementación de métodos de aprendizaje supervisado en la clasificación de estrellas variables en el disco y bulbo de la Vía Láctea usando las series de tiempo en banda I de los catálogos ASAS II y OGLE II. La clasificación se hizo en las siguientes clases: Cefeidas, RR Lyrae, candidatas a Be, binarias eclipsantes y variables de largo periodo. Se usaron los siguientes métodos en RStudio: k-vecinos más cercanos, máquinas de soporte vectorial, árboles de clasificación y bosques aleatorios. Se usaron los datos clasificados de OGLE IV y una muestra de estrellas Be de la Gran Nube de Magallanes para entrenar los algoritmos con un conjunto de cinco estadísticos robustos para reducir el costo computacional de eliminación de datos atípicos. Los estadísticos utilizados son: desviación mediana absoluta como estimador de escala, sesgo octil como estimador de sesgo, peso octil izquierdo y derecho como estimadores de peso de colas y valor Abbe modificado como estimador de suavidad. Un acercamiento preliminar de la clasificación mostró una alta confusión entre Cefeidas y RR Lyrae, por lo que se decidió definir una súper-clase que las contenía a las dos. Sin embargo, generar un muestreo preliminar con la súper-clase definida es de gran utilidad como una preselección para luego calcular los periodos a una menor cantidad de estrellas debido a que el cálculo de periodos tiene un costo computacional mucho más alto. El método de clasificación con mejor desempeño individual fue bosques aleatorios, con un mayor número de aciertos sobre la muestra de entrenamiento que los demás. Se implementó este método de manera binaria por cada clase para los catálogos de ASAS II y OGLE II.This work aims to implement supervised learning methods in the classification of variable stars in the Milky Way's galactic bulge and disk using the I-band time series available in the ASAS II and OGLE II data. The classification was done in the following classes: Cepheids, RR Lyrae, Be candidates, eclipsing binaries and long period variables. The following methods were implemented in RStudio: K-nearest neighbors, suport vector machines, classification trees and random forest. The classified data in OGLE IV and a sample of Be stars from the Large Magallanic Cloud were used in the training of the algorithms with a set of five robust statistics as features for reducing the computational cost of the elimination of atypical data. The following statistics were used: median absolute deviation as scale estimator, octile skewness as skewness estimator, left and right octile weight as tail weight estimator, and modified Abbe value as smoothness estimator. An overview of the classification showed a high confussion rate between Cepheids and RR Lyrae, so it was necessary to define a super-class containing both. Nevertheless, generating a sample of candidates to this super-class is very useful because it reduces the size of the sample for calculating periods, reducing the overall compuational cost. The classification method with better performance was random forest, as it had the highest accuracy classifying the training sample. This method was implemented as a binary classificator for each of the classes in the ASAS II and OGLE II catalogues.FísicoPregrado62 hojasapplication/pdfspaUniversidad de los AndesFísicaFacultad de CienciasDepartamento de Físicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaImplementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variablesTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPEstrellas variablesAprendizaje automático (Inteligencia artificial)Análisis del vecino más cercano (Estadística)AstrofísicaVía lácteaFísicaPublicationTHUMBNAILu827068.pdf.jpgu827068.pdf.jpgIM Thumbnailimage/jpeg8581https://repositorio.uniandes.edu.co/bitstreams/16de726c-0bca-4e6a-8e82-1cceff487948/downloaddf94fa807653edf383bae7af467216d0MD55ORIGINALu827068.pdfapplication/pdf1665041https://repositorio.uniandes.edu.co/bitstreams/c92e74c5-3528-4992-b322-cae072f653da/downloadde601431ae26e9da2d06d42110bf3633MD51TEXTu827068.pdf.txtu827068.pdf.txtExtracted texttext/plain114918https://repositorio.uniandes.edu.co/bitstreams/d046dbad-fa90-4aa1-9be2-d63b938bd3b9/download70125aa5ea844bc20362037bf5a085e2MD541992/45156oai:repositorio.uniandes.edu.co:1992/451562023-10-10 19:05:12.983http://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co