Clasificación jerárquica con variables binarias y nominales

Se analiza la utilización del algoritmo de clasificación de Ward en conjuntos de datos en los que la información está conformada únicamente por variables binarias o nominales. Se lleva el caso nominal al caso binario mediante una codificación disyuntiva completa y se establecen las matrices de dista...

Full description

Autores:
Pardo T., Campo Elías
Bautista S., Leonardo
Tipo de recurso:
Article of journal
Fecha de publicación:
1993
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/24358
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/24358
http://bdigital.unal.edu.co/15395/
Palabra clave:
Estadística matemática
Variables binarias
Variables nominales
Algoritmos
Algoritmo de Ward
Distancia ponderada de Manhatan
Estadística matemática
Variables binarias
Variables nominales
Algoritmos
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:Se analiza la utilización del algoritmo de clasificación de Ward en conjuntos de datos en los que la información está conformada únicamente por variables binarias o nominales. Se lleva el caso nominal al caso binario mediante una codificación disyuntiva completa y se establecen las matrices de distancias a partir de la distancia ponderada de Manhatan calculada a través de las distancias promedio de Manhatan y de Bray-Curtis. Se estudian todos los casos de dos y tres variables binarias y de dos variables nominales con dos y tres modalidades. Se establece el efecto que sobre los árboles resultantes tiene la asignación apriori de ponderaciones para las variables.