Análisis de algoritmos de clustering para datos categóricos

En el campo de la estadística, el análisis de clusters se puede definir como la tarea de encontrar grupos relevantes de una población a partir de una muestra, de modo que los miembros de cada grupo sean más similares entre si que con respecto a los miembros de otros grupos en algún sentido. Nuestro...

Full description

Autores:
Cerón Uribe, Juan Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2018
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/39125
Acceso en línea:
http://hdl.handle.net/1992/39125
Palabra clave:
Análisis cluster
Estadística matemática
Análisis estadístico multivariable
Algoritmos difusos
Matemáticas
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
id UNIANDES2_b838870e61f7182a811fa5514d8b3f06
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/39125
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Quiroz Salazar, Adolfo Josévirtual::1532-1Cerón Uribe, Juan Felipe13391324-155b-41ad-9fdd-8d9d01ea2bd8500Junca Peláez, Mauricio José2020-06-10T16:03:18Z2020-06-10T16:03:18Z2018http://hdl.handle.net/1992/39125u820979.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En el campo de la estadística, el análisis de clusters se puede definir como la tarea de encontrar grupos relevantes de una población a partir de una muestra, de modo que los miembros de cada grupo sean más similares entre si que con respecto a los miembros de otros grupos en algún sentido. Nuestro objetivo principal para este proyecto fue analizar algoritmos de clustering adaptados a datos con atributos categóricos. Con este fin, realizamos una lectura crítica del planteamiento del algoritmo ROCK, un algoritmo moderno basado en la atractiva idea de considerar la vecindad que rodea a cada uno de los datos. Finalmente, propusimos una modificación a este algoritmo y comparamos su desempeño con el original (y otros algoritmos clásicos de clustering) mediante conjuntos de datos simulados."Cluster analysis can be defined as the task of finding relevant groups in a population given a sample, in such a way that the members of each group are more similar (in some sense) to each other than to members of other groups. Our main objective for this project was to analyze clustering algorithms that are well adapted to data with categorical attributes. To this end, we did a critical reading of the paper that introduced the ROCK algorithm, a modern algorithm based on the attractive idea of considering the neighborhood surrounding each data point. Finally, we proposed a modification for this algorithm and compared its performance to the original one (as well as other classical algorithms) using simulated datasets."--Tomado del Formato de Documento de Grado.MatemáticoPregrado58 hojasapplication/pdfspaUniversidad de los AndesMatemáticasFacultad de CienciasDepartamento de Matemáticasinstname:Universidad de los Andesreponame:Repositorio Institucional SénecaAnálisis de algoritmos de clustering para datos categóricosTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPAnálisis clusterEstadística matemáticaAnálisis estadístico multivariableAlgoritmos difusosMatemáticasPublicationhttps://scholar.google.es/citations?user=qwMDh-4AAAAJvirtual::1532-10000-0003-4033-3400virtual::1532-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001497101virtual::1532-11be19e5b-39c2-4d92-b44f-b9b4a48991cavirtual::1532-11be19e5b-39c2-4d92-b44f-b9b4a48991cavirtual::1532-1ORIGINALu820979.pdfapplication/pdf479210https://repositorio.uniandes.edu.co/bitstreams/c9eb805a-9075-4219-8145-87a62c21acca/download3f2b303dafdb980612b1f1eb4aa9d288MD51THUMBNAILu820979.pdf.jpgu820979.pdf.jpgIM Thumbnailimage/jpeg7378https://repositorio.uniandes.edu.co/bitstreams/fb52c32d-b1ac-4ccf-9fd7-98b0ad49e9f1/download95735f87140664cf7e933ade4251981eMD55TEXTu820979.pdf.txtu820979.pdf.txtExtracted texttext/plain92013https://repositorio.uniandes.edu.co/bitstreams/4c2f4bab-ecd0-443f-8e9b-e164d9e9c24a/downloadddb0def2577a83d55904a07a98263377MD541992/39125oai:repositorio.uniandes.edu.co:1992/391252024-03-13 11:59:04.699http://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co
dc.title.es_CO.fl_str_mv Análisis de algoritmos de clustering para datos categóricos
title Análisis de algoritmos de clustering para datos categóricos
spellingShingle Análisis de algoritmos de clustering para datos categóricos
Análisis cluster
Estadística matemática
Análisis estadístico multivariable
Algoritmos difusos
Matemáticas
title_short Análisis de algoritmos de clustering para datos categóricos
title_full Análisis de algoritmos de clustering para datos categóricos
title_fullStr Análisis de algoritmos de clustering para datos categóricos
title_full_unstemmed Análisis de algoritmos de clustering para datos categóricos
title_sort Análisis de algoritmos de clustering para datos categóricos
dc.creator.fl_str_mv Cerón Uribe, Juan Felipe
dc.contributor.advisor.none.fl_str_mv Quiroz Salazar, Adolfo José
dc.contributor.author.none.fl_str_mv Cerón Uribe, Juan Felipe
dc.contributor.jury.none.fl_str_mv Junca Peláez, Mauricio José
dc.subject.keyword.es_CO.fl_str_mv Análisis cluster
Estadística matemática
Análisis estadístico multivariable
Algoritmos difusos
topic Análisis cluster
Estadística matemática
Análisis estadístico multivariable
Algoritmos difusos
Matemáticas
dc.subject.themes.none.fl_str_mv Matemáticas
description En el campo de la estadística, el análisis de clusters se puede definir como la tarea de encontrar grupos relevantes de una población a partir de una muestra, de modo que los miembros de cada grupo sean más similares entre si que con respecto a los miembros de otros grupos en algún sentido. Nuestro objetivo principal para este proyecto fue analizar algoritmos de clustering adaptados a datos con atributos categóricos. Con este fin, realizamos una lectura crítica del planteamiento del algoritmo ROCK, un algoritmo moderno basado en la atractiva idea de considerar la vecindad que rodea a cada uno de los datos. Finalmente, propusimos una modificación a este algoritmo y comparamos su desempeño con el original (y otros algoritmos clásicos de clustering) mediante conjuntos de datos simulados.
publishDate 2018
dc.date.issued.none.fl_str_mv 2018
dc.date.accessioned.none.fl_str_mv 2020-06-10T16:03:18Z
dc.date.available.none.fl_str_mv 2020-06-10T16:03:18Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/39125
dc.identifier.pdf.none.fl_str_mv u820979.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/39125
identifier_str_mv u820979.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.es_CO.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.es_CO.fl_str_mv 58 hojas
dc.format.mimetype.es_CO.fl_str_mv application/pdf
dc.publisher.es_CO.fl_str_mv Universidad de los Andes
dc.publisher.program.es_CO.fl_str_mv Matemáticas
dc.publisher.faculty.es_CO.fl_str_mv Facultad de Ciencias
dc.publisher.department.es_CO.fl_str_mv Departamento de Matemáticas
dc.source.es_CO.fl_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
instname_str Universidad de los Andes
institution Universidad de los Andes
reponame_str Repositorio Institucional Séneca
collection Repositorio Institucional Séneca
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/c9eb805a-9075-4219-8145-87a62c21acca/download
https://repositorio.uniandes.edu.co/bitstreams/fb52c32d-b1ac-4ccf-9fd7-98b0ad49e9f1/download
https://repositorio.uniandes.edu.co/bitstreams/4c2f4bab-ecd0-443f-8e9b-e164d9e9c24a/download
bitstream.checksum.fl_str_mv 3f2b303dafdb980612b1f1eb4aa9d288
95735f87140664cf7e933ade4251981e
ddb0def2577a83d55904a07a98263377
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812133816615043072