Estadística no paramétrica: métodos basados en rangos

En términos generales, un procedimiento de inferencia estadística tiene que ver con la extracción de una muestra aleatoria X de una población con distribución F, que llamaremos distribución muestreada y suponemos que depende de uno o varios parámetros desconocidos, acerca de los cuales queremos: • V...

Full description

Autores:
Corso S., Jimmy A.
Tipo de recurso:
Book
Fecha de publicación:
2005
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/53385
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/53385
http://bdigital.unal.edu.co/47938/
Palabra clave:
5 Ciencias naturales y matemáticas / Science
51 Matemáticas / Mathematics
Estadística no paramétrica
Muestras
Modelos lineales
Escalas de medida
Nominal
Ordinal o de rango
Intervalo
Prueba de Kolmogorov-Smirnov
Hipótesis de aleatoriedad
Distribución asintótica
Rangos
Método de Hodges-Lehmann
Prueba de Kolmogorov-Smirnov
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:En términos generales, un procedimiento de inferencia estadística tiene que ver con la extracción de una muestra aleatoria X de una población con distribución F, que llamaremos distribución muestreada y suponemos que depende de uno o varios parámetros desconocidos, acerca de los cuales queremos: • Verificar (o rechazar) hipótesis sobre su valor (desconocido). Problema de prueba de hipótesis. • Estimar puntualmente o por intervalo su valor (desconocido). Problema de estimación. Los métodos utilizados para resolver cualquiera de estos problemas dependen estrechamente de los supuestos que se hagan acerca de F, la distribución de X. En el problema de prueba de hipótesis en los métodos paramétricos se necesitan supuestos sobre la forma funcional de F para obtener regiones críticas o de rechazo de la hipótesis nula, que sean óptimas en algún sentido (por ejemplo, las pruebas uniformemente más potentes obtenidas para distribuciones de la familia exponencial). En el problema de estimación, cuando se conoce la forma funcional de F, pueden obtenerse estimadores máximo verosímiles. En ambos casos, la obtención de los "resultados óptimos" requiere el conocimiento de la forma de la distribución muestreada. A los procedimientos que requieren muy pocos o muy débiles supuestos acerca de las distribuciones muestreadas, como continuidad o simetría de F, suele llamárseles métodos no paramétricos. Una distinción adicional puede hacerse para aquellos métodos que, con o sin el supuesto sobre la forma funcional de la distribución muestreada, para la estimación de parámetros o para las pruebas de hipótesis, utilizan estadísticas cuyas distribuciones no dependen de la distribución muestreada. Estos métodos se conocen como métodos de distribución libre. Como para muchos de los métodos de distribución libre se requieren muy pocos o muy débiles supuestos acerca de la distribución muestreada, estos se encuentran frecuentemente en la literatura como parte de los procedimientos no paramétricos. Debido a que entre los especialistas no hay acuerdo total con respecto a esta clasificación, en estas notas se hará referencia a los métodos no paramétricos en general, sin hacer esta última distinción. Los métodos no paramétricos son de especial utilidad y tienen ventajas sobre los métodos paramétricos clásicos cuando: los datos disponibles se encuentran en escala ordinal o nominal. En muchos de estos casos no existen pruebas paramétricas. La distribución muestreada no es exactamente la requerida por un método paramétrico óptimo para el mismo problema. Los datos tienen problemas con observaciones extremas, porque su efecto sobre los rangos es menor, es decir, los métodos no paramétricos son más robustos, en este sentido, que los métodos paramétricos. Los tamaños de las muestras son pequeños; si no se dispone de las tablas de la distribución de la estadística de prueba, la construcción de las regiones críticas es relativamente simple. se tienen muestras grandes, ya que la mayoría de las distribuciones asintóticas de las estadísticas utilizadas son normales. Sin embargo, los métodos no paramétricos presentan desventajas cuando: se satisfacen todos los supuestos requeridos para utilizar métodos paramétricos óptimos. se quiere un nivel de significancia dado (digamos del 0,05); en muchos casos no es posible obtenerlo exactamente en la inferencia no paramétrica, debido a que la mayoría de las estadísticas utilizadas son discretas. Es necesario calcular la potencia de las pruebas; en general esto es mucho más complicado para los procedimientos no paramétricos. las observaciones son multivariadas, porque existen muy pocas posibilidades de utilización de los métodos no paramétricos. El contenido del curso es lo que, a mi juicio, constituye los resultados teóricos más importantes de los métodos de inferencia estadística basados en