Algoritmo meta-heurístico para clustering particional de datos basado en Global-best Harmony Search, K-means y Restricted Growth Strings
En este trabajo se proponen tres algoritmos de clustering particional no supervisado basados en Global-best Harmoy Search (GBHS), K-Means y Restricted Growth Strings (RGS). GBHS es un algoritmo metaheurístico de optimización que hibrida la búsqueda armónica con el concepto de inteligencia de enjambr...
- Autores:
-
Jiménez Vargas, Arnold Jair
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2017
- Institución:
- Universidad del Cauca
- Repositorio:
- Repositorio Unicauca
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unicauca.edu.co:123456789/1733
- Acceso en línea:
- http://repositorio.unicauca.edu.co:8080/xmlui/handle/123456789/1733
- Palabra clave:
- Clustering
Global-Best Harmony Search
K-Means
RGS
Algoritmo metaheurístico
- Rights
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
Summary: | En este trabajo se proponen tres algoritmos de clustering particional no supervisado basados en Global-best Harmoy Search (GBHS), K-Means y Restricted Growth Strings (RGS). GBHS es un algoritmo metaheurístico de optimización que hibrida la búsqueda armónica con el concepto de inteligencia de enjambre propuesto en PSO. K-Means es un algoritmo de clustering bastante popular debido a su sencillez y facilidad de implementación y RGS es un esquema de representación de soluciones que permite explorar de manera más eficiente el espacio de búsqueda. Los algoritmos propuestos son de objetivo simple, buscan maximizar o minimizar el valor de los siguientes criterios de calidad: Akaike Information Criterion (AIC) y Calinski-Harabasz index (CHI). Para evaluar el desempeño de los algoritmos se utilizaron cinco datasets del repositorio de la UCI (iris, glass, sonar, wdbc y Wine) y sus valores fueron comparados con diferentes algoritmos tanto de clustering supervisado como de clustering automático. El proceso de afinación consistió en la ejecución de los algoritmos con los cinco datasets seleccionados, las dos funciones objetivo. y las funciones de distancia Manhattan y Euclidiana. Los resultados obtenidos muestran que los algoritmos propuestos son altamente competitivos tanto para el clustering supervisado como para el automático. |
---|