Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables
Este trabajo pretende realizar la implementación de métodos de aprendizaje supervisado en la clasificación de estrellas variables en el disco y bulbo de la Vía Láctea usando las series de tiempo en banda I de los catálogos ASAS II y OGLE II. La clasificación se hizo en las siguientes clases: Cefeida...
- Autores:
-
González Aguilera, Juan Pablo
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2019
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/45156
- Acceso en línea:
- http://hdl.handle.net/1992/45156
- Palabra clave:
- Estrellas variables
Aprendizaje automático (Inteligencia artificial)
Análisis del vecino más cercano (Estadística)
Astrofísica
Vía láctea
Física
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/4.0/
id |
UNIANDES2_0d01f290f65f8bd61fee0f2dd6a3f45c |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/45156 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.es_CO.fl_str_mv |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables |
title |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables |
spellingShingle |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables Estrellas variables Aprendizaje automático (Inteligencia artificial) Análisis del vecino más cercano (Estadística) Astrofísica Vía láctea Física |
title_short |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables |
title_full |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables |
title_fullStr |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables |
title_full_unstemmed |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables |
title_sort |
Implementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variables |
dc.creator.fl_str_mv |
González Aguilera, Juan Pablo |
dc.contributor.advisor.none.fl_str_mv |
García Varela, José Alejandro |
dc.contributor.author.none.fl_str_mv |
González Aguilera, Juan Pablo |
dc.contributor.jury.none.fl_str_mv |
Sabogal Martínez, Beatriz Eugenia |
dc.subject.armarc.es_CO.fl_str_mv |
Estrellas variables Aprendizaje automático (Inteligencia artificial) Análisis del vecino más cercano (Estadística) Astrofísica Vía láctea |
topic |
Estrellas variables Aprendizaje automático (Inteligencia artificial) Análisis del vecino más cercano (Estadística) Astrofísica Vía láctea Física |
dc.subject.themes.none.fl_str_mv |
Física |
description |
Este trabajo pretende realizar la implementación de métodos de aprendizaje supervisado en la clasificación de estrellas variables en el disco y bulbo de la Vía Láctea usando las series de tiempo en banda I de los catálogos ASAS II y OGLE II. La clasificación se hizo en las siguientes clases: Cefeidas, RR Lyrae, candidatas a Be, binarias eclipsantes y variables de largo periodo. Se usaron los siguientes métodos en RStudio: k-vecinos más cercanos, máquinas de soporte vectorial, árboles de clasificación y bosques aleatorios. Se usaron los datos clasificados de OGLE IV y una muestra de estrellas Be de la Gran Nube de Magallanes para entrenar los algoritmos con un conjunto de cinco estadísticos robustos para reducir el costo computacional de eliminación de datos atípicos. Los estadísticos utilizados son: desviación mediana absoluta como estimador de escala, sesgo octil como estimador de sesgo, peso octil izquierdo y derecho como estimadores de peso de colas y valor Abbe modificado como estimador de suavidad. Un acercamiento preliminar de la clasificación mostró una alta confusión entre Cefeidas y RR Lyrae, por lo que se decidió definir una súper-clase que las contenía a las dos. Sin embargo, generar un muestreo preliminar con la súper-clase definida es de gran utilidad como una preselección para luego calcular los periodos a una menor cantidad de estrellas debido a que el cálculo de periodos tiene un costo computacional mucho más alto. El método de clasificación con mejor desempeño individual fue bosques aleatorios, con un mayor número de aciertos sobre la muestra de entrenamiento que los demás. Se implementó este método de manera binaria por cada clase para los catálogos de ASAS II y OGLE II. |
publishDate |
2019 |
dc.date.issued.none.fl_str_mv |
2019 |
dc.date.accessioned.none.fl_str_mv |
2020-09-03T15:51:14Z |
dc.date.available.none.fl_str_mv |
2020-09-03T15:51:14Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/45156 |
dc.identifier.pdf.none.fl_str_mv |
u827068.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/45156 |
identifier_str_mv |
u827068.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.es_CO.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.es_CO.fl_str_mv |
62 hojas |
dc.format.mimetype.es_CO.fl_str_mv |
application/pdf |
dc.publisher.es_CO.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.es_CO.fl_str_mv |
Física |
dc.publisher.faculty.es_CO.fl_str_mv |
Facultad de Ciencias |
dc.publisher.department.es_CO.fl_str_mv |
Departamento de Física |
dc.source.es_CO.fl_str_mv |
instname:Universidad de los Andes reponame:Repositorio Institucional Séneca |
instname_str |
Universidad de los Andes |
institution |
Universidad de los Andes |
reponame_str |
Repositorio Institucional Séneca |
collection |
Repositorio Institucional Séneca |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/16de726c-0bca-4e6a-8e82-1cceff487948/download https://repositorio.uniandes.edu.co/bitstreams/c92e74c5-3528-4992-b322-cae072f653da/download https://repositorio.uniandes.edu.co/bitstreams/d046dbad-fa90-4aa1-9be2-d63b938bd3b9/download |
bitstream.checksum.fl_str_mv |
df94fa807653edf383bae7af467216d0 de601431ae26e9da2d06d42110bf3633 70125aa5ea844bc20362037bf5a085e2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812134033523474432 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2García Varela, José Alejandrodeebb2fd-a5d2-4279-99c0-13e7ac37f091400González Aguilera, Juan Pabloc73b9a7e-a5b5-439e-96ec-921f9d724ad0500Sabogal Martínez, Beatriz Eugenia2020-09-03T15:51:14Z2020-09-03T15:51:14Z2019http://hdl.handle.net/1992/45156u827068.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Este trabajo pretende realizar la implementación de métodos de aprendizaje supervisado en la clasificación de estrellas variables en el disco y bulbo de la Vía Láctea usando las series de tiempo en banda I de los catálogos ASAS II y OGLE II. La clasificación se hizo en las siguientes clases: Cefeidas, RR Lyrae, candidatas a Be, binarias eclipsantes y variables de largo periodo. Se usaron los siguientes métodos en RStudio: k-vecinos más cercanos, máquinas de soporte vectorial, árboles de clasificación y bosques aleatorios. Se usaron los datos clasificados de OGLE IV y una muestra de estrellas Be de la Gran Nube de Magallanes para entrenar los algoritmos con un conjunto de cinco estadísticos robustos para reducir el costo computacional de eliminación de datos atípicos. Los estadísticos utilizados son: desviación mediana absoluta como estimador de escala, sesgo octil como estimador de sesgo, peso octil izquierdo y derecho como estimadores de peso de colas y valor Abbe modificado como estimador de suavidad. Un acercamiento preliminar de la clasificación mostró una alta confusión entre Cefeidas y RR Lyrae, por lo que se decidió definir una súper-clase que las contenía a las dos. Sin embargo, generar un muestreo preliminar con la súper-clase definida es de gran utilidad como una preselección para luego calcular los periodos a una menor cantidad de estrellas debido a que el cálculo de periodos tiene un costo computacional mucho más alto. El método de clasificación con mejor desempeño individual fue bosques aleatorios, con un mayor número de aciertos sobre la muestra de entrenamiento que los demás. Se implementó este método de manera binaria por cada clase para los catálogos de ASAS II y OGLE II.This work aims to implement supervised learning methods in the classification of variable stars in the Milky Way's galactic bulge and disk using the I-band time series available in the ASAS II and OGLE II data. The classification was done in the following classes: Cepheids, RR Lyrae, Be candidates, eclipsing binaries and long period variables. The following methods were implemented in RStudio: K-nearest neighbors, suport vector machines, classification trees and random forest. The classified data in OGLE IV and a sample of Be stars from the Large Magallanic Cloud were used in the training of the algorithms with a set of five robust statistics as features for reducing the computational cost of the elimination of atypical data. The following statistics were used: median absolute deviation as scale estimator, octile skewness as skewness estimator, left and right octile weight as tail weight estimator, and modified Abbe value as smoothness estimator. An overview of the classification showed a high confussion rate between Cepheids and RR Lyrae, so it was necessary to define a super-class containing both. Nevertheless, generating a sample of candidates to this super-class is very useful because it reduces the size of the sample for calculating periods, reducing the overall compuational cost. The classification method with better performance was random forest, as it had the highest accuracy classifying the training sample. This method was implemented as a binary classificator for each of the classes in the ASAS II and OGLE II catalogues.FísicoPregrado62 hojasapplication/pdfspaUniversidad de los AndesFísicaFacultad de CienciasDepartamento de Físicainstname:Universidad de los Andesreponame:Repositorio Institucional SénecaImplementación de algoritmos de aprendizaje supervisado en la búsqueda de estrellas variablesTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPEstrellas variablesAprendizaje automático (Inteligencia artificial)Análisis del vecino más cercano (Estadística)AstrofísicaVía lácteaFísicaPublicationTHUMBNAILu827068.pdf.jpgu827068.pdf.jpgIM Thumbnailimage/jpeg8581https://repositorio.uniandes.edu.co/bitstreams/16de726c-0bca-4e6a-8e82-1cceff487948/downloaddf94fa807653edf383bae7af467216d0MD55ORIGINALu827068.pdfapplication/pdf1665041https://repositorio.uniandes.edu.co/bitstreams/c92e74c5-3528-4992-b322-cae072f653da/downloadde601431ae26e9da2d06d42110bf3633MD51TEXTu827068.pdf.txtu827068.pdf.txtExtracted texttext/plain114918https://repositorio.uniandes.edu.co/bitstreams/d046dbad-fa90-4aa1-9be2-d63b938bd3b9/download70125aa5ea844bc20362037bf5a085e2MD541992/45156oai:repositorio.uniandes.edu.co:1992/451562023-10-10 19:05:12.983http://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |