El problema multivariado de las dos muestras: una aproximación desde métodos no paramétricos basados en grafos.
La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado...
- Autores:
-
Hernández López, Andrés Felipe
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/59223
- Acceso en línea:
- http://hdl.handle.net/1992/59223
- Palabra clave:
- Métodos no paramétricos
Problema de las dos muestras
Grafo
Matemáticas
- Rights
- openAccess
- License
- Attribution-NoDerivatives 4.0 Internacional
Summary: | La estadística no paramétrica estudia los modelos necesarios para poder hacer inferencias de una o varias muestras de datos cuya distribución subyacente es desconocida ex-ante, y de esta manera no se ajusta a los usuales criterios y supuestos que permiten usar los modelos paramétricos. Por otro lado, el problema de las dos muestras evalúa si las distribuciones de dos muestras de datos distintas son semejantes en algún criterio, tal como la ubicación o la escala. En este proyecto de grado estudiaremos algunos métodos no perimétricos para el problema de las dos muestras que se basan en grafos. El primero de estos es la generalización del test usual de las corridas de Wald-Wolfowitz propuesta por Friedman y Rafsky en 1979; el segundo es la generalización planteada al test de Kolmogorov-Smirnov en ese mismo artículo.; la tercera es el test de los k-vecinos más cercanos propuesto por Schilling en 1986; y el último es el nuevo test propuesto por Chen y Friedman en el 2017. Finalmente se comparará las potencias de dichos métodos cambiando la cantidad de datos de la muestra, el número de dimensiones y la cantidad $k$ de vecinos más cercanos. Así se pondrá en evidencia las ventajas y debilidades de cada método en las distintas situaciones propuestas, con lo que se verá la versatilidad del método de Chen-Friedman frente a las alternativas de escala y ubicación. |
---|