Clasificación jerárquica con variables binarias y nominales
Se analiza la utilización del algoritmo de clasificación de Ward en conjuntos de datos en los que la información está conformada únicamente por variables binarias o nominales. Se lleva el caso nominal al caso binario mediante una codificación disyuntiva completa y se establecen las matrices de dista...
- Autores:
-
Pardo T., Campo Elías
Bautista S., Leonardo
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 1993
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/24358
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/24358
http://bdigital.unal.edu.co/15395/
- Palabra clave:
- Estadística matemática
Variables binarias
Variables nominales
Algoritmos
Algoritmo de Ward
Distancia ponderada de Manhatan
Estadística matemática
Variables binarias
Variables nominales
Algoritmos
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | Se analiza la utilización del algoritmo de clasificación de Ward en conjuntos de datos en los que la información está conformada únicamente por variables binarias o nominales. Se lleva el caso nominal al caso binario mediante una codificación disyuntiva completa y se establecen las matrices de distancias a partir de la distancia ponderada de Manhatan calculada a través de las distancias promedio de Manhatan y de Bray-Curtis. Se estudian todos los casos de dos y tres variables binarias y de dos variables nominales con dos y tres modalidades. Se establece el efecto que sobre los árboles resultantes tiene la asignación apriori de ponderaciones para las variables. |
---|