Evaluación del desempeño en métodos clásicos y datos funcionales para la estimación de datos faltantes con mediciones de ozono en la ciudad de Santiago de Cali

En este estudio, se introducen varios métodos de imputación que han sido diseñados con base a las técnicas de análisis de datos funcionales (ADF) y se investiga la capacidad de los métodos para estimar valores faltantes óptimos, es decir, que cuenten con el mínimo error posible. Los métodos de imput...

Full description

Autores:
Henao Peña, Lina Marcela
Silva Guamanga, Sergio Andrés
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2018
Institución:
Universidad del Valle
Repositorio:
Repositorio Digital Univalle
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.univalle.edu.co:10893/17628
Acceso en línea:
https://hdl.handle.net/10893/17628
Palabra clave:
Evaluación del desempeño
Ozono troposférico
Datos faltantes
Análisis de datos funcionales
Rights
openAccess
License
http://purl.org/coar/access_right/c_abf2
Description
Summary:En este estudio, se introducen varios métodos de imputación que han sido diseñados con base a las técnicas de análisis de datos funcionales (ADF) y se investiga la capacidad de los métodos para estimar valores faltantes óptimos, es decir, que cuenten con el mínimo error posible. Los métodos de imputación única y los métodos de imputación iterativa se realizan mediante la estimación de curvas a través de métodos de regresión y de suavizado. Por otra parte, se realizan estimaciones por medio de métodos clásicos comunmente utilizados en investigaciones científicas por su fácil aplicabilidad y entendimiento, como lo son los métodos de medias y de regresión. El rendimiento de los métodos basados en datos funcionales y clásico, se comparan mediante un conjunto de datos reales de Ozono troposférico (datos de referencia), obtenidos de la estación Compartir, localizada en la parte oriental de la ciudad de Santiago de Cali. Mil conjuntos de datos faltantes se generan a partir de los datos de referencia con seis patrones diferentes de valores faltantes, los cuales se desarrollan con el objetivo de investigar el rendimiento de los métodos considerados. Los patrones se simulan de acuerdo con tres porcentajes (5, 10 y 15) de valores faltantes con respecto a dos tamaños diferentes (3 y 7) de longitudes de espacio máximos (puntos perdidos consecutivos). La decisión conjunta de los indicadores evaluados muestran que el método de imputación iterativa es más flexible y preciso a los otros métodos evaluados para altos porcentajes de valores aleatorios faltantes y longitudes máximas, logrando optimizar el proceso de imputación.