Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo

Este estudio está enfocado en comparar diversos métodos de partición del análisis de conglomerados, usualmente conocidos como métodos no jerárquicos. En este trabajo, se realizan estudios de simulación para comparar los resultados obtenidos al implementar los algoritmos k-medias, k-medianas, PAM y C...

Full description

Autores:
Leiva-Valdebenito, Susana A.
Torres-Avilés, Francisco J.
Tipo de recurso:
Article of journal
Fecha de publicación:
2010
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/40783
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/40783
http://bdigital.unal.edu.co/30880/
Palabra clave:
algoritmos de conglomerados
medida de similaridad
simulación
Clustering algorithm
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_004db966be67035737cbbad60aa1e098
oai_identifier_str oai:repositorio.unal.edu.co:unal/40783
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Leiva-Valdebenito, Susana A.244e32b2-57f2-4ab9-90ad-ef0260cfb357300Torres-Avilés, Francisco J.9b230146-4e92-4909-a6e3-499dc00d01f53002019-06-28T09:40:43Z2019-06-28T09:40:43Z2010https://repositorio.unal.edu.co/handle/unal/40783http://bdigital.unal.edu.co/30880/Este estudio está enfocado en comparar diversos métodos de partición del análisis de conglomerados, usualmente conocidos como métodos no jerárquicos. En este trabajo, se realizan estudios de simulación para comparar los resultados obtenidos al implementar los algoritmos k-medias, k-medianas, PAM y Clara cuando los datos son multivariados y de tipo continuo. Adicionalmente, se efectúa un estudio de simulación con el fin de comparar algoritmos de partición para datos cualitativos, confrontando la eficiencia de los algoritmos PAM y k-modas. La eficiencia de los algoritmos se compara usando el índice de Rand ajustado y la tasa de correcta clasificación. Finalmente, se aplican los algoritmos a bases de datos reales, las cuales poseen clases predefinidas.This study is oriented to compare several partition methods in the context of cluster analysis, which are also called non hierarchical methods. In this work, a simulation study is performed to compare the results obtained from the implementation of the algorithms k-means, k-medians, PAM and CLARA when continuous multivariate information is available. Additionally, a study of simulation is presented to compare partition algorithms qualitative information, comparing the efficiency of the PAM and k-modes algorithms. The efficiency of the algorithms is compared using the Adjusted Rand Index and the correct classification rate. Finally, the algorithms are applied to real databases with predefined classes.application/pdfspaUniversidad Nacional de Colombiahttp://revistas.unal.edu.co/index.php/estad/article/view/29880Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de EstadísticaRevista Colombiana de EstadísticaRevista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 Revista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 0120-1751Leiva-Valdebenito, Susana A. and Torres-Avilés, Francisco J. (2010) Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo. Revista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 Revista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 0120-1751 .Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativoArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTalgoritmos de conglomeradosmedida de similaridadsimulaciónClustering algorithmORIGINAL29880-107488-1-PB.pdfapplication/pdf551189https://repositorio.unal.edu.co/bitstream/unal/40783/1/29880-107488-1-PB.pdf789da02191b5bed221fd5547f8227d3aMD5129880-142475-1-PB.htmltext/html8699https://repositorio.unal.edu.co/bitstream/unal/40783/2/29880-142475-1-PB.htmlfe34ae8e7c7b904aec97d644e935e79bMD52THUMBNAIL29880-107488-1-PB.pdf.jpg29880-107488-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg6450https://repositorio.unal.edu.co/bitstream/unal/40783/3/29880-107488-1-PB.pdf.jpg1361f8c7cd5a18c41d4710b7029c4b6bMD53unal/40783oai:repositorio.unal.edu.co:unal/407832024-01-27 23:06:09.425Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co
dc.title.spa.fl_str_mv Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
title Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
spellingShingle Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
algoritmos de conglomerados
medida de similaridad
simulación
Clustering algorithm
title_short Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
title_full Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
title_fullStr Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
title_full_unstemmed Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
title_sort Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo
dc.creator.fl_str_mv Leiva-Valdebenito, Susana A.
Torres-Avilés, Francisco J.
dc.contributor.author.spa.fl_str_mv Leiva-Valdebenito, Susana A.
Torres-Avilés, Francisco J.
dc.subject.proposal.spa.fl_str_mv algoritmos de conglomerados
medida de similaridad
simulación
Clustering algorithm
topic algoritmos de conglomerados
medida de similaridad
simulación
Clustering algorithm
description Este estudio está enfocado en comparar diversos métodos de partición del análisis de conglomerados, usualmente conocidos como métodos no jerárquicos. En este trabajo, se realizan estudios de simulación para comparar los resultados obtenidos al implementar los algoritmos k-medias, k-medianas, PAM y Clara cuando los datos son multivariados y de tipo continuo. Adicionalmente, se efectúa un estudio de simulación con el fin de comparar algoritmos de partición para datos cualitativos, confrontando la eficiencia de los algoritmos PAM y k-modas. La eficiencia de los algoritmos se compara usando el índice de Rand ajustado y la tasa de correcta clasificación. Finalmente, se aplican los algoritmos a bases de datos reales, las cuales poseen clases predefinidas.
publishDate 2010
dc.date.issued.spa.fl_str_mv 2010
dc.date.accessioned.spa.fl_str_mv 2019-06-28T09:40:43Z
dc.date.available.spa.fl_str_mv 2019-06-28T09:40:43Z
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/40783
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/30880/
url https://repositorio.unal.edu.co/handle/unal/40783
http://bdigital.unal.edu.co/30880/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://revistas.unal.edu.co/index.php/estad/article/view/29880
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de Estadística
Revista Colombiana de Estadística
dc.relation.ispartofseries.none.fl_str_mv Revista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 Revista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 0120-1751
dc.relation.references.spa.fl_str_mv Leiva-Valdebenito, Susana A. and Torres-Avilés, Francisco J. (2010) Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo. Revista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 Revista Colombiana de Estadística; Vol. 33, núm. 2 (2010); 321-339 0120-1751 .
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/40783/1/29880-107488-1-PB.pdf
https://repositorio.unal.edu.co/bitstream/unal/40783/2/29880-142475-1-PB.html
https://repositorio.unal.edu.co/bitstream/unal/40783/3/29880-107488-1-PB.pdf.jpg
bitstream.checksum.fl_str_mv 789da02191b5bed221fd5547f8227d3a
fe34ae8e7c7b904aec97d644e935e79b
1361f8c7cd5a18c41d4710b7029c4b6b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089682651185152