Afectación por datos faltantes en un modelo PLS ajustado a los registros de Ozono en Santiago de Cali para el año 2019.

La estación de monitoreo Compartir, en Cali, Colombia, registra datos horarios del Ozono troposférico y las variables climáticas: temperatura, humedad relativa, lluvia, velocidad del viento y radiación solar. Sin embargo esta base de datos contiene datos faltantes sistemáticos. Usando los registros...

Full description

Autores:
Cifuentes Rodríguez, Víctor Hugo
Espinosa Maca, Juan David
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Universidad del Valle
Repositorio:
Repositorio Digital Univalle
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.univalle.edu.co:10893/21728
Acceso en línea:
https://hdl.handle.net/10893/21728
Palabra clave:
Estadística
Regresión lineal múltiple
ozono
Modelación de medicamentos
Regresión de Mínimos Cuadrados Parciales (PLS)
Variables climáticas
Probabilidad
Rights
openAccess
License
http://purl.org/coar/access_right/c_abf2
Description
Summary:La estación de monitoreo Compartir, en Cali, Colombia, registra datos horarios del Ozono troposférico y las variables climáticas: temperatura, humedad relativa, lluvia, velocidad del viento y radiación solar. Sin embargo esta base de datos contiene datos faltantes sistemáticos. Usando los registros del año 2019 se construye un conjunto de datos con todas las filas que tienen datos completos y se ajusta un modelo de regresión PLS con un componente y MCO del Ozono en función de las variables climáticas, encontrando que la diferencia de R2 entre los modelos son de 0.022, no obstante, los intervalos de confianza para los coeficientes de regresión en el PLS tienen menos amplitud, ya que corrige la multicolinealidad presentada en las variables predictoras. Posteriormente, se contamina la base con el 5 %, 10 %, 15 %, 20 %, 30 %, 40 %,.