Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural

Se aplicó una serie de modelos que predicen el Índice de Calidad del Aire (ICA) a partir de las publicaciones realizadas por los habitantes de Bucaramanga en Twitter, para determinar la calidad del aire en la ciudad. Se seleccionó el mejor modelo a partir de diferentes métricas con base en el accura...

Full description

Autores:
Naranjo Reyes, Kevin Alejandro
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/15350
Acceso en línea:
http://hdl.handle.net/20.500.12749/15350
Palabra clave:
Mechatronic
Cerebrovascular disease
Air quality index
Temporal series
Natural language
Air pollution
Algorithm
Neural networks
Artificial intelligence
Machine learning
Mecatrónica
Contaminación del aire
Algoritmo
Redes neuronales
Inteligencia artificial
Aprendizaje automático
Enfermedad cerebrovascular
Índice calidad de aire
Series temporales
Lenguaje natural
Twitter
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_9ff91c2299f2c6193da6fbee6b37b85f
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/15350
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
dc.title.translated.spa.fl_str_mv Correlation analysis between the air quality index and the impact on Twitter for the city of Bucaramanga applying time series analysis, extraction and natural language processing
title Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
spellingShingle Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
Mechatronic
Cerebrovascular disease
Air quality index
Temporal series
Natural language
Air pollution
Algorithm
Neural networks
Artificial intelligence
Machine learning
Mecatrónica
Contaminación del aire
Algoritmo
Redes neuronales
Inteligencia artificial
Aprendizaje automático
Enfermedad cerebrovascular
Índice calidad de aire
Series temporales
Lenguaje natural
Twitter
title_short Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
title_full Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
title_fullStr Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
title_full_unstemmed Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
title_sort Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
dc.creator.fl_str_mv Naranjo Reyes, Kevin Alejandro
dc.contributor.advisor.none.fl_str_mv Arizmendi Pereira, Carlos Julio
dc.contributor.author.none.fl_str_mv Naranjo Reyes, Kevin Alejandro
dc.contributor.cvlac.spa.fl_str_mv Arizmendi Pereira, Carlos Julio [0001381550]
dc.contributor.googlescholar.spa.fl_str_mv Arizmendi Pereira, Carlos Julio [es&oi=ao]
dc.contributor.orcid.spa.fl_str_mv Arizmendi Pereira, Carlos Julio [0000-0002-5850-0775]
dc.contributor.researchgate.spa.fl_str_mv Arizmendi Pereira, Carlos Julio [Carlos-Arizmendi]
dc.subject.keywords.spa.fl_str_mv Mechatronic
Cerebrovascular disease
Air quality index
Temporal series
Natural language
Air pollution
Algorithm
Neural networks
Artificial intelligence
Machine learning
topic Mechatronic
Cerebrovascular disease
Air quality index
Temporal series
Natural language
Air pollution
Algorithm
Neural networks
Artificial intelligence
Machine learning
Mecatrónica
Contaminación del aire
Algoritmo
Redes neuronales
Inteligencia artificial
Aprendizaje automático
Enfermedad cerebrovascular
Índice calidad de aire
Series temporales
Lenguaje natural
Twitter
dc.subject.lemb.spa.fl_str_mv Mecatrónica
Contaminación del aire
Algoritmo
Redes neuronales
Inteligencia artificial
Aprendizaje automático
dc.subject.proposal.spa.fl_str_mv Enfermedad cerebrovascular
Índice calidad de aire
Series temporales
Lenguaje natural
Twitter
description Se aplicó una serie de modelos que predicen el Índice de Calidad del Aire (ICA) a partir de las publicaciones realizadas por los habitantes de Bucaramanga en Twitter, para determinar la calidad del aire en la ciudad. Se seleccionó el mejor modelo a partir de diferentes métricas con base en el accuracy de la clasificación. Para ello, se recopilaron mediciones reales del ICA en varios puntos de la ciudad y se hizo la extracción de Tweets para la misma serie temporal. Al emplear distintos algoritmos de reducción de dimensionalidad junto con técnicas de clasificación, tales técnicas son FSCNCA, Forward Selection, LDA y Redes Neuronales, se desarrollaron los modelos de predicción y se seleccionó el de mayor porcentaje de clasificación. El modelo que emplea FSCNCA como técnica de reducción de dimensionalidad y LDA como clasificador fue el que obtuvo el mejor porcentaje de clasificación, con un Accuracy de 69.07% en el conjunto Validation.
publishDate 2021
dc.date.issued.none.fl_str_mv 2021
dc.date.accessioned.none.fl_str_mv 2022-01-25T12:10:32Z
dc.date.available.none.fl_str_mv 2022-01-25T12:10:32Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv Trabajo de Grado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/15350
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/15350
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
repourl:https://repository.unab.edu.co
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv FANG, Guor-Cheng et al., “Characterization of particulate, metallic elements of TSP, PM2.5 and PM2.5-10 aerosols at a farm sampling site in Taiwan, Taichung,” Sci. Total Environ., Jun. 2003, vol. 308, no. 1–3, pp. 157–166, doi: 10.1016/S0048-9697(02)00648-4
BILLET. Sylvain et al., “Ambient particulate matter (PM2.5): physicochemical characterization and metabolic activation of the organic fraction in human lung epithelial cells (A549),” Environ. Res., Oct. 2007, vol. 105, no. 2, pp. 212–223, doi: 10.1016/J.ENVRES.2007.03.001.
ARCINIÉGAS, Cesar S., “Diagnóstico y control de material particulado: partículas suspendidas totales y fracción respirable PM10,” 2012, doi: 10.17151/luaz.2012.34.12
“Contaminantes del aire: Materias particuladas.” http://www.murciasalud.es/pagina.php?id=244308&# (accessed Oct. 04, 2021).
“Monitoreo aire - IDEAM.” http://www.siac.gov.co/monitoreoaire (accessed Oct. 04, 2021).
“Informe Carga de Enfermedad Ambiental en Colombia.” https://www.ins.gov.co/Noticias/Paginas/Informe-Carga-de-EnfermedadAmbiental-en-Colombia.aspx (accessed Oct. 04, 2021).
M. y E. A. IDEAM, Instituto de hidrología, “Índice de calidad del aire (ICA),” no. 571, p. 2013, 2012, [Online]. Available: http://www.ideam.gov.co/documents/11769/641368/2.01+HM+Indice+calidad +aire.pdf/5130ffb3-a1bf-4d23-a663-b4c51327cc05
“Series Temporales: Introducción,” Accessed: Oct. 04, 2021. [Online]. Available: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/tema7. pdf
“How Dynamic Neural Networks Work - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/how-dynamic-neuralnetworks-work.html (accessed Oct. 05, 2021).
“Choose a Multilayer Neural Network Training Function - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/choose-a-multilayer-neuralnetwork-training-function.html (accessed Oct. 05, 2021).
BENRHMACH, G., NAMIR, K., NAMIR, A. and BOUYAGHROUMNI, J., “Nonlinear Autoregressive Neural Network and Extended Kalman Filters for Prediction of Financial Time Series,” J. Appl. Math., 2020, vol. 2020, doi: 10.1155/2020/5057801
“Design Time Series NARX Feedback Neural Networks - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/design-time-series-narxfeedback-neural-networks.html (accessed Oct. 05, 2021).
“Levenberg-Marquardt backpropagation - MATLAB trainlm - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainlm.html (accessed Oct. 05, 2021).
“Bayesian regularization backpropagation - MATLAB trainbr - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainbr.html?s_tid=doc_ta (accessed Oct. 05, 2021).
“Scaled conjugate gradient backpropagation - MATLAB trainscg - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainscg.html?searchHighlight =trainscg&s_tid=srchtitle (accessed Oct. 05, 2021).
“What is Natural Language Processing? | IBM.” https://www.ibm.com/cloud/learn/natural-language-processing#toc-what-isna-jLju4DjE (accessed Oct. 05, 2021).
“Procesamiento del lenguaje natural con NLTK para Ingeniería social automatizada – Seguridad en Sistemas y Técnicas de Hacking. TheHackerWay (THW).” https://thehackerway.com/2015/02/17/procesamiento-del-lenguaje-naturalcon-nltk-para-ingenieria-social-automatizada/ (accessed Oct. 05, 2021).
“Análisis discriminante lineal (LDA) y análisis discriminante cuadrático (QDA).” https://www.cienciadedatos.net/documentos/28_linear_discriminant_analysis _lda_y_quadratic_discriminant_analysis_qda (accessed Oct. 05, 2021).
“Introduction to Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/feature-selection.html (accessed Oct. 06, 2021).
YANG, W., WANG, K., and ZUO, W. “Neighborhood component feature selection for high-dimensional data,” J. Comput., 2012, vol. 7, no. 1, pp. 162–168, doi: 10.4304/JCP.7.1.161-168.
“Neighborhood Component Analysis (NCA) Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/neighborhood-component-analysis.html (accessed Oct. 06, 2021).
MARCANO, A. C., QUINTANILLA, J. D., CORTINA M. G. J., and ANDINA, D. “Feature selection using Sequential Forward Selection and classification 79 applying Artificial Metaplasticity Neural Network,” IECON Proc. 2010 (Industrial Electron. Conf., pp. 2845–2850, doi: 10.1109/IECON.2010.5675075
CHANDRA, B. “Gene Selection Methods for Microarray Data,” Appl. Comput. Med. Heal., Jan. 2016 pp. 45–78, doi: 10.1016/B978-0-12-803468-2.00003-5.
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spatial.spa.fl_str_mv Bucaramanga (Santander, Colombia)
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Pregrado Ingeniería Mecatrónica
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/15350/1/2021_Tesis_Kevin_Naranjo%281%29.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/15350/2/2021_Licencia_Kevin_Naranjo.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/15350/3/license.txt
https://repository.unab.edu.co/bitstream/20.500.12749/15350/4/2021_Tesis_Kevin_Naranjo%281%29.pdf.jpg
https://repository.unab.edu.co/bitstream/20.500.12749/15350/5/2021_Licencia_Kevin_Naranjo.pdf.jpg
bitstream.checksum.fl_str_mv a28c89039ade8e41d039294ef5854bcf
7ec01421dfc920189f6f4be421bacf1f
3755c0cfdb77e29f2b9125d7a45dd316
e117618b23a6cd76b1951d85c5341332
8678fc16e0516c836e26d43f393916c9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1808410587384774656
spelling Arizmendi Pereira, Carlos JulioNaranjo Reyes, Kevin AlejandroArizmendi Pereira, Carlos Julio [0001381550]Arizmendi Pereira, Carlos Julio [es&oi=ao]Arizmendi Pereira, Carlos Julio [0000-0002-5850-0775]Arizmendi Pereira, Carlos Julio [Carlos-Arizmendi]Bucaramanga (Santander, Colombia)2022-01-25T12:10:32Z2022-01-25T12:10:32Z2021http://hdl.handle.net/20.500.12749/15350instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coSe aplicó una serie de modelos que predicen el Índice de Calidad del Aire (ICA) a partir de las publicaciones realizadas por los habitantes de Bucaramanga en Twitter, para determinar la calidad del aire en la ciudad. Se seleccionó el mejor modelo a partir de diferentes métricas con base en el accuracy de la clasificación. Para ello, se recopilaron mediciones reales del ICA en varios puntos de la ciudad y se hizo la extracción de Tweets para la misma serie temporal. Al emplear distintos algoritmos de reducción de dimensionalidad junto con técnicas de clasificación, tales técnicas son FSCNCA, Forward Selection, LDA y Redes Neuronales, se desarrollaron los modelos de predicción y se seleccionó el de mayor porcentaje de clasificación. El modelo que emplea FSCNCA como técnica de reducción de dimensionalidad y LDA como clasificador fue el que obtuvo el mejor porcentaje de clasificación, con un Accuracy de 69.07% en el conjunto Validation.Resumen…………………………………………………………………..….....….......…3 Listado de tablas………………………………………………….……...……….........…4 Listado de figuras………………………………………………………….……...........…7 Listado de símbolos……………………………………….……….…...……..................9 Introducción………………………………………………………………....…...........…15 Objetivos……………………………………………………..…...….........................…17 1. Marco teórico……………………………………….…….............................….…...18 1.1. Calidad del aire…………………………………………....................................…18 1.1.1. Material particulado…………………………………………....…..................…18 1.1.2. Sistema de Vigilancia de Calidad del Aire (SVCA Tipo III) …………...........…19 1.1.3. Resolución 2254 de 2017 …………………….................................................20 1.1.4. Índice de Calidad del Aire (ICA) …………………………….........................…21 1.1.4.1. Cálculo del ICA………………………………………………........……...........23 1.2. Completar datos faltantes de Material Particulado ……………………..........…23 1.2.1. Series Temporales……………………………………………………………..…23 1.2.2. NAR (Nonlinear autoregressive neural network) …………………………………...……………………………………………………...…25 1.2.3. NARX (Nonlinear autoregressive network with exogenous inputs) …………………………………………………………………………………………..…26 1.2.4. Nonlinear Input/Output …………………………………..………………………27 1.2.5. Trainlm………………………………………………………….………………….27 1.2.6. Trainbr…………………………………………………………………............….27 1.3. Procesamiento de Lenguaje Natural (NLP) ………………………….................28 1.3.1. Minería de texto: Extracción de Tweets ……………………............................29 1.3.2. Data Wrangling para Tweets …………………………....................................30 1.4. Técnicas de Inteligencia Artificial (Machine Learning) …………………….........31 1.4.1. Análisis Discriminante Lineal…………………………….................................32 1.5. Algoritmos de selección de características ………………….............................32 1.5.1. FSCNCA (Feature Selection Using Neighborhood Component Analysis)………………………………………...........................................................34 1.5.2. Forward Selection ………………………………………...................................36 2. Metodología ……………………………………………...........................................38 2.1. Etapa 1: Problema………………………………………......................................38 2.2. Etapa 2: Definir……………………………………...............................................38 2.2.1. Diseño de la investigación ………………......................................................38 2.2.2. Enfoque de la investigación ……………………….........................................39 2.2.3. Población ………………………………...........................................................41 2.2.4. Muestra y muestreo.......................................................................................41 2.2.5. Técnicas de recolección de datos ………………………................................41 2.2.6. Instrumento de recolección de datos……………………….............................41 2.2.7. Técnicas de procesamiento de datos………………………............................42 2.2.8. Herramientas para el procesamiento de datos………………………..............42 2.3. Etapa 3: Índice de Calidad del Aire (ICA) ……………………….........................42 2.3.1. Datos recogidos por los Sistemas de Vigilancia de Calidad del Aire…………42 2.3.1.1. Lagos 1 Floridablanca ……………………...................................................42 2.3.1.2. Estación Ciudadela …………………………................................................43 2.3.1.3. Estación Lagos del Cacique Bucaramanga …………………………...........44 2.3.1.4. Estación San Francisco Bucaramanga …………………….........................45 2.3.2. Data Wrangling para completar los datos de PM10 y PM2.5 ………………...47 2.3.2.1. Modelo seleccionado para completar los datos faltantes ….......................52 2.3.3. PM10 y PM2.5 diario en Bucaramanga ……………………............................53 2.3.4. Determinación del ICA según Resolución 2254 de 2017 …………….............54 2.4. Etapa 4: Publicaciones en Twitter ……………………………….........................56 2.4.1. API Twitter ………………………………………………...................................56 2.4.2. Octoparse…………………………………………………………….......…….....56 2.4.3. Twint………………………………………………………………………….…....57 2.4.4. Limpieza de Tweets ………..........................................................................58 2.4.5. Conteo del número de palabras (variables) en cada Tweet …………..........60 2.5. Etapa 5: Eliminación de palabras que provocan ruido en el clasificador ….....62 2.5.1. FSCNCA ……………………………………………..........................................62 2.5.1.1. FSCNCA + Análisis Discriminante ……………………................................63 2.5.1.2. FSCNCA + Redes Neuronales ………………….........................................65 2.5.2. Forward Selection ……………………………………………………….............66 2.5.2.1. Forward Selection + Análisis Discriminante ……………………………........66 2.5.2.2. Forward Selection + Redes Neuronales …………………....……................71 2.6. Etapa 6: Modelo de Clasificación ………………………………..........................73 2.6.1. Algoritmos obtenidos e implementados ………………………........................74 3. Conclusiones………………………………………………………………................75 Referencias ………………………………………………………................................76PregradoA series of models that predict the Air Quality Index (AQI) from Twitter posts made by Bucaramanga residents were applied to determine air quality in the city. The best model was selected different metrics based (accuracy of the classification). For this purpose, real AQI measurements were collected at several points in the city and Tweets were extracted for the same time series. By employing different dimensionality reduction algorithms along with classification techniques, as FSCNCA, Forward Selection, LDA and Neural Networks, the prediction models were developed and the one with the highest classification percentage was selected. The model using FSCNCA as dimensionality reduction technique and LDA as classifier was the one that obtained the best classification percentage, with an Accuracy of 69.07% in the Validation set.application/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje naturalCorrelation analysis between the air quality index and the impact on Twitter for the city of Bucaramanga applying time series analysis, extraction and natural language processingIngeniero MecatrónicoUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería Mecatrónicainfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/redcol/resource_type/TPMechatronicCerebrovascular diseaseAir quality indexTemporal seriesNatural languageAir pollutionAlgorithmNeural networksArtificial intelligenceMachine learningMecatrónicaContaminación del aireAlgoritmoRedes neuronalesInteligencia artificialAprendizaje automáticoEnfermedad cerebrovascularÍndice calidad de aireSeries temporalesLenguaje naturalTwitterFANG, Guor-Cheng et al., “Characterization of particulate, metallic elements of TSP, PM2.5 and PM2.5-10 aerosols at a farm sampling site in Taiwan, Taichung,” Sci. Total Environ., Jun. 2003, vol. 308, no. 1–3, pp. 157–166, doi: 10.1016/S0048-9697(02)00648-4BILLET. Sylvain et al., “Ambient particulate matter (PM2.5): physicochemical characterization and metabolic activation of the organic fraction in human lung epithelial cells (A549),” Environ. Res., Oct. 2007, vol. 105, no. 2, pp. 212–223, doi: 10.1016/J.ENVRES.2007.03.001.ARCINIÉGAS, Cesar S., “Diagnóstico y control de material particulado: partículas suspendidas totales y fracción respirable PM10,” 2012, doi: 10.17151/luaz.2012.34.12“Contaminantes del aire: Materias particuladas.” http://www.murciasalud.es/pagina.php?id=244308&# (accessed Oct. 04, 2021).“Monitoreo aire - IDEAM.” http://www.siac.gov.co/monitoreoaire (accessed Oct. 04, 2021).“Informe Carga de Enfermedad Ambiental en Colombia.” https://www.ins.gov.co/Noticias/Paginas/Informe-Carga-de-EnfermedadAmbiental-en-Colombia.aspx (accessed Oct. 04, 2021).M. y E. A. IDEAM, Instituto de hidrología, “Índice de calidad del aire (ICA),” no. 571, p. 2013, 2012, [Online]. Available: http://www.ideam.gov.co/documents/11769/641368/2.01+HM+Indice+calidad +aire.pdf/5130ffb3-a1bf-4d23-a663-b4c51327cc05“Series Temporales: Introducción,” Accessed: Oct. 04, 2021. [Online]. Available: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/tema7. pdf“How Dynamic Neural Networks Work - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/how-dynamic-neuralnetworks-work.html (accessed Oct. 05, 2021).“Choose a Multilayer Neural Network Training Function - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/choose-a-multilayer-neuralnetwork-training-function.html (accessed Oct. 05, 2021).BENRHMACH, G., NAMIR, K., NAMIR, A. and BOUYAGHROUMNI, J., “Nonlinear Autoregressive Neural Network and Extended Kalman Filters for Prediction of Financial Time Series,” J. Appl. Math., 2020, vol. 2020, doi: 10.1155/2020/5057801“Design Time Series NARX Feedback Neural Networks - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/design-time-series-narxfeedback-neural-networks.html (accessed Oct. 05, 2021).“Levenberg-Marquardt backpropagation - MATLAB trainlm - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainlm.html (accessed Oct. 05, 2021).“Bayesian regularization backpropagation - MATLAB trainbr - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainbr.html?s_tid=doc_ta (accessed Oct. 05, 2021).“Scaled conjugate gradient backpropagation - MATLAB trainscg - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainscg.html?searchHighlight =trainscg&s_tid=srchtitle (accessed Oct. 05, 2021).“What is Natural Language Processing? | IBM.” https://www.ibm.com/cloud/learn/natural-language-processing#toc-what-isna-jLju4DjE (accessed Oct. 05, 2021).“Procesamiento del lenguaje natural con NLTK para Ingeniería social automatizada – Seguridad en Sistemas y Técnicas de Hacking. TheHackerWay (THW).” https://thehackerway.com/2015/02/17/procesamiento-del-lenguaje-naturalcon-nltk-para-ingenieria-social-automatizada/ (accessed Oct. 05, 2021).“Análisis discriminante lineal (LDA) y análisis discriminante cuadrático (QDA).” https://www.cienciadedatos.net/documentos/28_linear_discriminant_analysis _lda_y_quadratic_discriminant_analysis_qda (accessed Oct. 05, 2021).“Introduction to Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/feature-selection.html (accessed Oct. 06, 2021).YANG, W., WANG, K., and ZUO, W. “Neighborhood component feature selection for high-dimensional data,” J. Comput., 2012, vol. 7, no. 1, pp. 162–168, doi: 10.4304/JCP.7.1.161-168.“Neighborhood Component Analysis (NCA) Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/neighborhood-component-analysis.html (accessed Oct. 06, 2021).MARCANO, A. C., QUINTANILLA, J. D., CORTINA M. G. J., and ANDINA, D. “Feature selection using Sequential Forward Selection and classification 79 applying Artificial Metaplasticity Neural Network,” IECON Proc. 2010 (Industrial Electron. Conf., pp. 2845–2850, doi: 10.1109/IECON.2010.5675075CHANDRA, B. “Gene Selection Methods for Microarray Data,” Appl. Comput. Med. Heal., Jan. 2016 pp. 45–78, doi: 10.1016/B978-0-12-803468-2.00003-5.ORIGINAL2021_Tesis_Kevin_Naranjo(1).pdf2021_Tesis_Kevin_Naranjo(1).pdfTesisapplication/pdf2512021https://repository.unab.edu.co/bitstream/20.500.12749/15350/1/2021_Tesis_Kevin_Naranjo%281%29.pdfa28c89039ade8e41d039294ef5854bcfMD51open access2021_Licencia_Kevin_Naranjo.pdf2021_Licencia_Kevin_Naranjo.pdfLicenciaapplication/pdf64545https://repository.unab.edu.co/bitstream/20.500.12749/15350/2/2021_Licencia_Kevin_Naranjo.pdf7ec01421dfc920189f6f4be421bacf1fMD52metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/15350/3/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD53open accessTHUMBNAIL2021_Tesis_Kevin_Naranjo(1).pdf.jpg2021_Tesis_Kevin_Naranjo(1).pdf.jpgIM Thumbnailimage/jpeg4808https://repository.unab.edu.co/bitstream/20.500.12749/15350/4/2021_Tesis_Kevin_Naranjo%281%29.pdf.jpge117618b23a6cd76b1951d85c5341332MD54open access2021_Licencia_Kevin_Naranjo.pdf.jpg2021_Licencia_Kevin_Naranjo.pdf.jpgIM Thumbnailimage/jpeg9856https://repository.unab.edu.co/bitstream/20.500.12749/15350/5/2021_Licencia_Kevin_Naranjo.pdf.jpg8678fc16e0516c836e26d43f393916c9MD55metadata only access20.500.12749/15350oai:repository.unab.edu.co:20.500.12749/153502022-01-25 18:01:04.972open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg==