Evaluación de una versión modificada de la prueba Shapiro-Wilk Generalizada con estimación Shrinkage de la matriz de covarianzas : caso de alta dimensión con muestras pequeñas
La hipótesis nula de la prueba Shapiro-Wilk Generalizada se define como H0 : Y1, ..., Yn ∈ Rp es una muestra que proviene de una Np(μ,Σ). Para el cálculo del estadístico W∗ de esta prueba se utilizan los estimadores de matriz de covarianzas S y la matriz de precisión S −1 Es bien conocido que la mat...
- Autores:
-
Ospina Santander, Elizabeth
Roldan Lizcano, Melany
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad del Valle
- Repositorio:
- Repositorio Digital Univalle
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.univalle.edu.co:10893/24333
- Acceso en línea:
- https://hdl.handle.net/10893/24333
- Palabra clave:
- Covarianza general
Contaminación del aire
Mediciones
Cali (Valle del Cauca)
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Summary: | La hipótesis nula de la prueba Shapiro-Wilk Generalizada se define como H0 : Y1, ..., Yn ∈ Rp es una muestra que proviene de una Np(μ,Σ). Para el cálculo del estadístico W∗ de esta prueba se utilizan los estimadores de matriz de covarianzas S y la matriz de precisión S −1 Es bien conocido que la matriz de covarianzas muestral S, en situaciones donde el número de variables es mayor o incluso igual al número de observaciones disponibles, genera malas estimaciones de la matriz de covarianza Σ. Dado que S−1 hace parte del estadístico de la prueba Shapiro-Wilk Generalizada; es de esperarse que la potencia de la prueba se vea afectada. Un estudio de Monte Carlo fue desarrollado para evidenciar el efecto sobre la potencia de la prueba. Se identificó que esta presenta problemas cuando se emplea en datos que no siguen una distribución normal multivariada. Por el contrario, dicha afectación no se evidencia cuando se emplea en datos que provienen de una distribución normal multivariada. Seguidamente, como una propuesta metodológica para enfrentar la perdida de potencia de la prueba, se incorporó la estimación shrinkage S∗ en la prueba de Shapiro-Wilk Generalizada y se analizó su desempeño vía simulación versus el desempeño de la prueba tradicional. La evaluación se realizó bajo distintos escenarios del tamaño de muestra, niveles de significancia y estimaciones shrinkage. As ́ı, se concluye que la versión modificada de la prueba Shapiro-Wilk Generalizada tiene un mejor desempeño que la prueba tradicional, bajo n ∼= p. Finalmente, se presenta una aplicación con datos reales, que consisten en mediciones de calidad del aire en la Ciudad de Cali, Colombia. La verificación del supuesto de normalidad multivariada en estos datos, toma importancia puesto que abre la posibilidad de la aplicación de novedosas propuestas metodológicas para el manejo de datos faltantes, que resultan muy frecuentes en este contexto. |
---|