Visualización de clustering espacio-temporal, un entorno interactivo para el aprendizaje no supervisado de datos

El clustering es uno de los sub-campos principales y relativamente nuevos de la minería de datos espacio-temporales (E-T), es un proceso en el que se agrupan objetos basándose en la similitud de características espaciales y temporales. Como herramienta de minería de datos, el clustering espacio-temp...

Full description

Autores:
Buitrago Ramírez, Jessika Johana
Tipo de recurso:
Fecha de publicación:
2019
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/43955
Acceso en línea:
http://hdl.handle.net/1992/43955
Palabra clave:
Minería de datos - Investigaciones
Big data - Investigaciones
Clusters (Sistemas computacionales) - Investigaciones
Algoritmos (Computadores) - Investigaciones
Visualización de la información - Investigaciones
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:El clustering es uno de los sub-campos principales y relativamente nuevos de la minería de datos espacio-temporales (E-T), es un proceso en el que se agrupan objetos basándose en la similitud de características espaciales y temporales. Como herramienta de minería de datos, el clustering espacio-temporal puede ser usado para ganar insight sobre la distribución de los datos, observar las características de cada cluster y encontrar en cada uno de ellos un foco adecuado de análisis, particularmente en un ambiente interactivo de visualización que brinde libertad al usuario experto del contexto de datos en su proceso de descubrimiento de conocimiento. Dada la robustez y calidad de los resultados, se tomarán en consideración para implementación los métodos basados en densidades (los cuales emplean algoritmos como ST-DBSCAN, ST-OPTICS y STSNN). En este documento se introducirán los conceptos relacionados con clustering de densidades para datos E-T y se realizara una comparación de los algoritmos más importantes que existen actualmente. Adicionalmente, se brindara una evaluación de resultados de la herramienta interactiva web Clu-Tool para realizar clustering de datos E-T reales como casos de estudio. Por último se describira una futura investigación en el campo de clustering para datos E-T.