Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural
Se aplicó una serie de modelos que predicen el Índice de Calidad del Aire (ICA) a partir de las publicaciones realizadas por los habitantes de Bucaramanga en Twitter, para determinar la calidad del aire en la ciudad. Se seleccionó el mejor modelo a partir de diferentes métricas con base en el accura...
- Autores:
-
Naranjo Reyes, Kevin Alejandro
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2021
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/15350
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/15350
- Palabra clave:
- Mechatronic
Cerebrovascular disease
Air quality index
Temporal series
Natural language
Air pollution
Algorithm
Neural networks
Artificial intelligence
Machine learning
Mecatrónica
Contaminación del aire
Algoritmo
Redes neuronales
Inteligencia artificial
Aprendizaje automático
Enfermedad cerebrovascular
Índice calidad de aire
Series temporales
Lenguaje natural
Twitter
- Rights
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_9ff91c2299f2c6193da6fbee6b37b85f |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/15350 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural |
dc.title.translated.spa.fl_str_mv |
Correlation analysis between the air quality index and the impact on Twitter for the city of Bucaramanga applying time series analysis, extraction and natural language processing |
title |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural |
spellingShingle |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural Mechatronic Cerebrovascular disease Air quality index Temporal series Natural language Air pollution Algorithm Neural networks Artificial intelligence Machine learning Mecatrónica Contaminación del aire Algoritmo Redes neuronales Inteligencia artificial Aprendizaje automático Enfermedad cerebrovascular Índice calidad de aire Series temporales Lenguaje natural |
title_short |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural |
title_full |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural |
title_fullStr |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural |
title_full_unstemmed |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural |
title_sort |
Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje natural |
dc.creator.fl_str_mv |
Naranjo Reyes, Kevin Alejandro |
dc.contributor.advisor.none.fl_str_mv |
Arizmendi Pereira, Carlos Julio |
dc.contributor.author.none.fl_str_mv |
Naranjo Reyes, Kevin Alejandro |
dc.contributor.cvlac.spa.fl_str_mv |
Arizmendi Pereira, Carlos Julio [0001381550] |
dc.contributor.googlescholar.spa.fl_str_mv |
Arizmendi Pereira, Carlos Julio [es&oi=ao] |
dc.contributor.orcid.spa.fl_str_mv |
Arizmendi Pereira, Carlos Julio [0000-0002-5850-0775] |
dc.contributor.researchgate.spa.fl_str_mv |
Arizmendi Pereira, Carlos Julio [Carlos-Arizmendi] |
dc.subject.keywords.spa.fl_str_mv |
Mechatronic Cerebrovascular disease Air quality index Temporal series Natural language Air pollution Algorithm Neural networks Artificial intelligence Machine learning |
topic |
Mechatronic Cerebrovascular disease Air quality index Temporal series Natural language Air pollution Algorithm Neural networks Artificial intelligence Machine learning Mecatrónica Contaminación del aire Algoritmo Redes neuronales Inteligencia artificial Aprendizaje automático Enfermedad cerebrovascular Índice calidad de aire Series temporales Lenguaje natural |
dc.subject.lemb.spa.fl_str_mv |
Mecatrónica Contaminación del aire Algoritmo Redes neuronales Inteligencia artificial Aprendizaje automático |
dc.subject.proposal.spa.fl_str_mv |
Enfermedad cerebrovascular Índice calidad de aire Series temporales Lenguaje natural |
description |
Se aplicó una serie de modelos que predicen el Índice de Calidad del Aire (ICA) a partir de las publicaciones realizadas por los habitantes de Bucaramanga en Twitter, para determinar la calidad del aire en la ciudad. Se seleccionó el mejor modelo a partir de diferentes métricas con base en el accuracy de la clasificación. Para ello, se recopilaron mediciones reales del ICA en varios puntos de la ciudad y se hizo la extracción de Tweets para la misma serie temporal. Al emplear distintos algoritmos de reducción de dimensionalidad junto con técnicas de clasificación, tales técnicas son FSCNCA, Forward Selection, LDA y Redes Neuronales, se desarrollaron los modelos de predicción y se seleccionó el de mayor porcentaje de clasificación. El modelo que emplea FSCNCA como técnica de reducción de dimensionalidad y LDA como clasificador fue el que obtuvo el mejor porcentaje de clasificación, con un Accuracy de 69.07% en el conjunto Validation. |
publishDate |
2021 |
dc.date.issued.none.fl_str_mv |
2021 |
dc.date.accessioned.none.fl_str_mv |
2022-01-25T12:10:32Z |
dc.date.available.none.fl_str_mv |
2022-01-25T12:10:32Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.local.spa.fl_str_mv |
Trabajo de Grado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/15350 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.unab.edu.co |
url |
http://hdl.handle.net/20.500.12749/15350 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB repourl:https://repository.unab.edu.co |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
FANG, Guor-Cheng et al., “Characterization of particulate, metallic elements of TSP, PM2.5 and PM2.5-10 aerosols at a farm sampling site in Taiwan, Taichung,” Sci. Total Environ., Jun. 2003, vol. 308, no. 1–3, pp. 157–166, doi: 10.1016/S0048-9697(02)00648-4 BILLET. Sylvain et al., “Ambient particulate matter (PM2.5): physicochemical characterization and metabolic activation of the organic fraction in human lung epithelial cells (A549),” Environ. Res., Oct. 2007, vol. 105, no. 2, pp. 212–223, doi: 10.1016/J.ENVRES.2007.03.001. ARCINIÉGAS, Cesar S., “Diagnóstico y control de material particulado: partículas suspendidas totales y fracción respirable PM10,” 2012, doi: 10.17151/luaz.2012.34.12 “Contaminantes del aire: Materias particuladas.” http://www.murciasalud.es/pagina.php?id=244308&# (accessed Oct. 04, 2021). “Monitoreo aire - IDEAM.” http://www.siac.gov.co/monitoreoaire (accessed Oct. 04, 2021). “Informe Carga de Enfermedad Ambiental en Colombia.” https://www.ins.gov.co/Noticias/Paginas/Informe-Carga-de-EnfermedadAmbiental-en-Colombia.aspx (accessed Oct. 04, 2021). M. y E. A. IDEAM, Instituto de hidrología, “Índice de calidad del aire (ICA),” no. 571, p. 2013, 2012, [Online]. Available: http://www.ideam.gov.co/documents/11769/641368/2.01+HM+Indice+calidad +aire.pdf/5130ffb3-a1bf-4d23-a663-b4c51327cc05 “Series Temporales: Introducción,” Accessed: Oct. 04, 2021. [Online]. Available: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/tema7. pdf “How Dynamic Neural Networks Work - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/how-dynamic-neuralnetworks-work.html (accessed Oct. 05, 2021). “Choose a Multilayer Neural Network Training Function - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/choose-a-multilayer-neuralnetwork-training-function.html (accessed Oct. 05, 2021). BENRHMACH, G., NAMIR, K., NAMIR, A. and BOUYAGHROUMNI, J., “Nonlinear Autoregressive Neural Network and Extended Kalman Filters for Prediction of Financial Time Series,” J. Appl. Math., 2020, vol. 2020, doi: 10.1155/2020/5057801 “Design Time Series NARX Feedback Neural Networks - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/design-time-series-narxfeedback-neural-networks.html (accessed Oct. 05, 2021). “Levenberg-Marquardt backpropagation - MATLAB trainlm - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainlm.html (accessed Oct. 05, 2021). “Bayesian regularization backpropagation - MATLAB trainbr - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainbr.html?s_tid=doc_ta (accessed Oct. 05, 2021). “Scaled conjugate gradient backpropagation - MATLAB trainscg - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainscg.html?searchHighlight =trainscg&s_tid=srchtitle (accessed Oct. 05, 2021). “What is Natural Language Processing? | IBM.” https://www.ibm.com/cloud/learn/natural-language-processing#toc-what-isna-jLju4DjE (accessed Oct. 05, 2021). “Procesamiento del lenguaje natural con NLTK para Ingeniería social automatizada – Seguridad en Sistemas y Técnicas de Hacking. TheHackerWay (THW).” https://thehackerway.com/2015/02/17/procesamiento-del-lenguaje-naturalcon-nltk-para-ingenieria-social-automatizada/ (accessed Oct. 05, 2021). “Análisis discriminante lineal (LDA) y análisis discriminante cuadrático (QDA).” https://www.cienciadedatos.net/documentos/28_linear_discriminant_analysis _lda_y_quadratic_discriminant_analysis_qda (accessed Oct. 05, 2021). “Introduction to Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/feature-selection.html (accessed Oct. 06, 2021). YANG, W., WANG, K., and ZUO, W. “Neighborhood component feature selection for high-dimensional data,” J. Comput., 2012, vol. 7, no. 1, pp. 162–168, doi: 10.4304/JCP.7.1.161-168. “Neighborhood Component Analysis (NCA) Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/neighborhood-component-analysis.html (accessed Oct. 06, 2021). MARCANO, A. C., QUINTANILLA, J. D., CORTINA M. G. J., and ANDINA, D. “Feature selection using Sequential Forward Selection and classification 79 applying Artificial Metaplasticity Neural Network,” IECON Proc. 2010 (Industrial Electron. Conf., pp. 2845–2850, doi: 10.1109/IECON.2010.5675075 CHANDRA, B. “Gene Selection Methods for Microarray Data,” Appl. Comput. Med. Heal., Jan. 2016 pp. 45–78, doi: 10.1016/B978-0-12-803468-2.00003-5. |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) Atribución-NoComercial-SinDerivadas 2.5 Colombia http://purl.org/coar/access_right/c_abf2 |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spatial.spa.fl_str_mv |
Bucaramanga (Santander, Colombia) |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Pregrado Ingeniería Mecatrónica |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/15350/1/2021_Tesis_Kevin_Naranjo%281%29.pdf https://repository.unab.edu.co/bitstream/20.500.12749/15350/2/2021_Licencia_Kevin_Naranjo.pdf https://repository.unab.edu.co/bitstream/20.500.12749/15350/3/license.txt https://repository.unab.edu.co/bitstream/20.500.12749/15350/4/2021_Tesis_Kevin_Naranjo%281%29.pdf.jpg https://repository.unab.edu.co/bitstream/20.500.12749/15350/5/2021_Licencia_Kevin_Naranjo.pdf.jpg |
bitstream.checksum.fl_str_mv |
a28c89039ade8e41d039294ef5854bcf 7ec01421dfc920189f6f4be421bacf1f 3755c0cfdb77e29f2b9125d7a45dd316 e117618b23a6cd76b1951d85c5341332 8678fc16e0516c836e26d43f393916c9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814277327799975936 |
spelling |
Arizmendi Pereira, Carlos JulioNaranjo Reyes, Kevin AlejandroArizmendi Pereira, Carlos Julio [0001381550]Arizmendi Pereira, Carlos Julio [es&oi=ao]Arizmendi Pereira, Carlos Julio [0000-0002-5850-0775]Arizmendi Pereira, Carlos Julio [Carlos-Arizmendi]Bucaramanga (Santander, Colombia)2022-01-25T12:10:32Z2022-01-25T12:10:32Z2021http://hdl.handle.net/20.500.12749/15350instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coSe aplicó una serie de modelos que predicen el Índice de Calidad del Aire (ICA) a partir de las publicaciones realizadas por los habitantes de Bucaramanga en Twitter, para determinar la calidad del aire en la ciudad. Se seleccionó el mejor modelo a partir de diferentes métricas con base en el accuracy de la clasificación. Para ello, se recopilaron mediciones reales del ICA en varios puntos de la ciudad y se hizo la extracción de Tweets para la misma serie temporal. Al emplear distintos algoritmos de reducción de dimensionalidad junto con técnicas de clasificación, tales técnicas son FSCNCA, Forward Selection, LDA y Redes Neuronales, se desarrollaron los modelos de predicción y se seleccionó el de mayor porcentaje de clasificación. El modelo que emplea FSCNCA como técnica de reducción de dimensionalidad y LDA como clasificador fue el que obtuvo el mejor porcentaje de clasificación, con un Accuracy de 69.07% en el conjunto Validation.Resumen…………………………………………………………………..….....….......…3 Listado de tablas………………………………………………….……...……….........…4 Listado de figuras………………………………………………………….……...........…7 Listado de símbolos……………………………………….……….…...……..................9 Introducción………………………………………………………………....…...........…15 Objetivos……………………………………………………..…...….........................…17 1. Marco teórico……………………………………….…….............................….…...18 1.1. Calidad del aire…………………………………………....................................…18 1.1.1. Material particulado…………………………………………....…..................…18 1.1.2. Sistema de Vigilancia de Calidad del Aire (SVCA Tipo III) …………...........…19 1.1.3. Resolución 2254 de 2017 …………………….................................................20 1.1.4. Índice de Calidad del Aire (ICA) …………………………….........................…21 1.1.4.1. Cálculo del ICA………………………………………………........……...........23 1.2. Completar datos faltantes de Material Particulado ……………………..........…23 1.2.1. Series Temporales……………………………………………………………..…23 1.2.2. NAR (Nonlinear autoregressive neural network) …………………………………...……………………………………………………...…25 1.2.3. NARX (Nonlinear autoregressive network with exogenous inputs) …………………………………………………………………………………………..…26 1.2.4. Nonlinear Input/Output …………………………………..………………………27 1.2.5. Trainlm………………………………………………………….………………….27 1.2.6. Trainbr…………………………………………………………………............….27 1.3. Procesamiento de Lenguaje Natural (NLP) ………………………….................28 1.3.1. Minería de texto: Extracción de Tweets ……………………............................29 1.3.2. Data Wrangling para Tweets …………………………....................................30 1.4. Técnicas de Inteligencia Artificial (Machine Learning) …………………….........31 1.4.1. Análisis Discriminante Lineal…………………………….................................32 1.5. Algoritmos de selección de características ………………….............................32 1.5.1. FSCNCA (Feature Selection Using Neighborhood Component Analysis)………………………………………...........................................................34 1.5.2. Forward Selection ………………………………………...................................36 2. Metodología ……………………………………………...........................................38 2.1. Etapa 1: Problema………………………………………......................................38 2.2. Etapa 2: Definir……………………………………...............................................38 2.2.1. Diseño de la investigación ………………......................................................38 2.2.2. Enfoque de la investigación ……………………….........................................39 2.2.3. Población ………………………………...........................................................41 2.2.4. Muestra y muestreo.......................................................................................41 2.2.5. Técnicas de recolección de datos ………………………................................41 2.2.6. Instrumento de recolección de datos……………………….............................41 2.2.7. Técnicas de procesamiento de datos………………………............................42 2.2.8. Herramientas para el procesamiento de datos………………………..............42 2.3. Etapa 3: Índice de Calidad del Aire (ICA) ……………………….........................42 2.3.1. Datos recogidos por los Sistemas de Vigilancia de Calidad del Aire…………42 2.3.1.1. Lagos 1 Floridablanca ……………………...................................................42 2.3.1.2. Estación Ciudadela …………………………................................................43 2.3.1.3. Estación Lagos del Cacique Bucaramanga …………………………...........44 2.3.1.4. Estación San Francisco Bucaramanga …………………….........................45 2.3.2. Data Wrangling para completar los datos de PM10 y PM2.5 ………………...47 2.3.2.1. Modelo seleccionado para completar los datos faltantes ….......................52 2.3.3. PM10 y PM2.5 diario en Bucaramanga ……………………............................53 2.3.4. Determinación del ICA según Resolución 2254 de 2017 …………….............54 2.4. Etapa 4: Publicaciones en Twitter ……………………………….........................56 2.4.1. API Twitter ………………………………………………...................................56 2.4.2. Octoparse…………………………………………………………….......…….....56 2.4.3. Twint………………………………………………………………………….…....57 2.4.4. Limpieza de Tweets ………..........................................................................58 2.4.5. Conteo del número de palabras (variables) en cada Tweet …………..........60 2.5. Etapa 5: Eliminación de palabras que provocan ruido en el clasificador ….....62 2.5.1. FSCNCA ……………………………………………..........................................62 2.5.1.1. FSCNCA + Análisis Discriminante ……………………................................63 2.5.1.2. FSCNCA + Redes Neuronales ………………….........................................65 2.5.2. Forward Selection ……………………………………………………….............66 2.5.2.1. Forward Selection + Análisis Discriminante ……………………………........66 2.5.2.2. Forward Selection + Redes Neuronales …………………....……................71 2.6. Etapa 6: Modelo de Clasificación ………………………………..........................73 2.6.1. Algoritmos obtenidos e implementados ………………………........................74 3. Conclusiones………………………………………………………………................75 Referencias ………………………………………………………................................76PregradoA series of models that predict the Air Quality Index (AQI) from Twitter posts made by Bucaramanga residents were applied to determine air quality in the city. The best model was selected different metrics based (accuracy of the classification). For this purpose, real AQI measurements were collected at several points in the city and Tweets were extracted for the same time series. By employing different dimensionality reduction algorithms along with classification techniques, as FSCNCA, Forward Selection, LDA and Neural Networks, the prediction models were developed and the one with the highest classification percentage was selected. The model using FSCNCA as dimensionality reduction technique and LDA as classifier was the one that obtained the best classification percentage, with an Accuracy of 69.07% in the Validation set.application/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Análisis de correlación entre el índice de calidad del aire y el impacto en Twitter para la ciudad de Bucaramanga aplicando análisis de series temporales, extracción y procesamiento de lenguaje naturalCorrelation analysis between the air quality index and the impact on Twitter for the city of Bucaramanga applying time series analysis, extraction and natural language processingIngeniero MecatrónicoUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería Mecatrónicainfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/redcol/resource_type/TPMechatronicCerebrovascular diseaseAir quality indexTemporal seriesNatural languageAir pollutionAlgorithmNeural networksArtificial intelligenceMachine learningMecatrónicaContaminación del aireAlgoritmoRedes neuronalesInteligencia artificialAprendizaje automáticoEnfermedad cerebrovascularÍndice calidad de aireSeries temporalesLenguaje naturalTwitterFANG, Guor-Cheng et al., “Characterization of particulate, metallic elements of TSP, PM2.5 and PM2.5-10 aerosols at a farm sampling site in Taiwan, Taichung,” Sci. Total Environ., Jun. 2003, vol. 308, no. 1–3, pp. 157–166, doi: 10.1016/S0048-9697(02)00648-4BILLET. Sylvain et al., “Ambient particulate matter (PM2.5): physicochemical characterization and metabolic activation of the organic fraction in human lung epithelial cells (A549),” Environ. Res., Oct. 2007, vol. 105, no. 2, pp. 212–223, doi: 10.1016/J.ENVRES.2007.03.001.ARCINIÉGAS, Cesar S., “Diagnóstico y control de material particulado: partículas suspendidas totales y fracción respirable PM10,” 2012, doi: 10.17151/luaz.2012.34.12“Contaminantes del aire: Materias particuladas.” http://www.murciasalud.es/pagina.php?id=244308&# (accessed Oct. 04, 2021).“Monitoreo aire - IDEAM.” http://www.siac.gov.co/monitoreoaire (accessed Oct. 04, 2021).“Informe Carga de Enfermedad Ambiental en Colombia.” https://www.ins.gov.co/Noticias/Paginas/Informe-Carga-de-EnfermedadAmbiental-en-Colombia.aspx (accessed Oct. 04, 2021).M. y E. A. IDEAM, Instituto de hidrología, “Índice de calidad del aire (ICA),” no. 571, p. 2013, 2012, [Online]. Available: http://www.ideam.gov.co/documents/11769/641368/2.01+HM+Indice+calidad +aire.pdf/5130ffb3-a1bf-4d23-a663-b4c51327cc05“Series Temporales: Introducción,” Accessed: Oct. 04, 2021. [Online]. Available: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/tema7. pdf“How Dynamic Neural Networks Work - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/how-dynamic-neuralnetworks-work.html (accessed Oct. 05, 2021).“Choose a Multilayer Neural Network Training Function - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/choose-a-multilayer-neuralnetwork-training-function.html (accessed Oct. 05, 2021).BENRHMACH, G., NAMIR, K., NAMIR, A. and BOUYAGHROUMNI, J., “Nonlinear Autoregressive Neural Network and Extended Kalman Filters for Prediction of Financial Time Series,” J. Appl. Math., 2020, vol. 2020, doi: 10.1155/2020/5057801“Design Time Series NARX Feedback Neural Networks - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ug/design-time-series-narxfeedback-neural-networks.html (accessed Oct. 05, 2021).“Levenberg-Marquardt backpropagation - MATLAB trainlm - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainlm.html (accessed Oct. 05, 2021).“Bayesian regularization backpropagation - MATLAB trainbr - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainbr.html?s_tid=doc_ta (accessed Oct. 05, 2021).“Scaled conjugate gradient backpropagation - MATLAB trainscg - MathWorks América Latina.” https://la.mathworks.com/help/deeplearning/ref/trainscg.html?searchHighlight =trainscg&s_tid=srchtitle (accessed Oct. 05, 2021).“What is Natural Language Processing? | IBM.” https://www.ibm.com/cloud/learn/natural-language-processing#toc-what-isna-jLju4DjE (accessed Oct. 05, 2021).“Procesamiento del lenguaje natural con NLTK para Ingeniería social automatizada – Seguridad en Sistemas y Técnicas de Hacking. TheHackerWay (THW).” https://thehackerway.com/2015/02/17/procesamiento-del-lenguaje-naturalcon-nltk-para-ingenieria-social-automatizada/ (accessed Oct. 05, 2021).“Análisis discriminante lineal (LDA) y análisis discriminante cuadrático (QDA).” https://www.cienciadedatos.net/documentos/28_linear_discriminant_analysis _lda_y_quadratic_discriminant_analysis_qda (accessed Oct. 05, 2021).“Introduction to Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/feature-selection.html (accessed Oct. 06, 2021).YANG, W., WANG, K., and ZUO, W. “Neighborhood component feature selection for high-dimensional data,” J. Comput., 2012, vol. 7, no. 1, pp. 162–168, doi: 10.4304/JCP.7.1.161-168.“Neighborhood Component Analysis (NCA) Feature Selection - MATLAB & Simulink - MathWorks América Latina.” https://la.mathworks.com/help/stats/neighborhood-component-analysis.html (accessed Oct. 06, 2021).MARCANO, A. C., QUINTANILLA, J. D., CORTINA M. G. J., and ANDINA, D. “Feature selection using Sequential Forward Selection and classification 79 applying Artificial Metaplasticity Neural Network,” IECON Proc. 2010 (Industrial Electron. Conf., pp. 2845–2850, doi: 10.1109/IECON.2010.5675075CHANDRA, B. “Gene Selection Methods for Microarray Data,” Appl. Comput. Med. Heal., Jan. 2016 pp. 45–78, doi: 10.1016/B978-0-12-803468-2.00003-5.ORIGINAL2021_Tesis_Kevin_Naranjo(1).pdf2021_Tesis_Kevin_Naranjo(1).pdfTesisapplication/pdf2512021https://repository.unab.edu.co/bitstream/20.500.12749/15350/1/2021_Tesis_Kevin_Naranjo%281%29.pdfa28c89039ade8e41d039294ef5854bcfMD51open access2021_Licencia_Kevin_Naranjo.pdf2021_Licencia_Kevin_Naranjo.pdfLicenciaapplication/pdf64545https://repository.unab.edu.co/bitstream/20.500.12749/15350/2/2021_Licencia_Kevin_Naranjo.pdf7ec01421dfc920189f6f4be421bacf1fMD52metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/15350/3/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD53open accessTHUMBNAIL2021_Tesis_Kevin_Naranjo(1).pdf.jpg2021_Tesis_Kevin_Naranjo(1).pdf.jpgIM Thumbnailimage/jpeg4808https://repository.unab.edu.co/bitstream/20.500.12749/15350/4/2021_Tesis_Kevin_Naranjo%281%29.pdf.jpge117618b23a6cd76b1951d85c5341332MD54open access2021_Licencia_Kevin_Naranjo.pdf.jpg2021_Licencia_Kevin_Naranjo.pdf.jpgIM Thumbnailimage/jpeg9856https://repository.unab.edu.co/bitstream/20.500.12749/15350/5/2021_Licencia_Kevin_Naranjo.pdf.jpg8678fc16e0516c836e26d43f393916c9MD55metadata only access20.500.12749/15350oai:repository.unab.edu.co:20.500.12749/153502022-01-25 18:01:04.972open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg== |