Visualización de clustering espacio-temporal, un entorno interactivo para el aprendizaje no supervisado de datos
El clustering es uno de los sub-campos principales y relativamente nuevos de la minería de datos espacio-temporales (E-T), es un proceso en el que se agrupan objetos basándose en la similitud de características espaciales y temporales. Como herramienta de minería de datos, el clustering espacio-temp...
- Autores:
-
Buitrago Ramírez, Jessika Johana
- Tipo de recurso:
- Fecha de publicación:
- 2019
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/43955
- Acceso en línea:
- http://hdl.handle.net/1992/43955
- Palabra clave:
- Minería de datos - Investigaciones
Big data - Investigaciones
Clusters (Sistemas computacionales) - Investigaciones
Algoritmos (Computadores) - Investigaciones
Visualización de la información - Investigaciones
Ingeniería
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
Summary: | El clustering es uno de los sub-campos principales y relativamente nuevos de la minería de datos espacio-temporales (E-T), es un proceso en el que se agrupan objetos basándose en la similitud de características espaciales y temporales. Como herramienta de minería de datos, el clustering espacio-temporal puede ser usado para ganar insight sobre la distribución de los datos, observar las características de cada cluster y encontrar en cada uno de ellos un foco adecuado de análisis, particularmente en un ambiente interactivo de visualización que brinde libertad al usuario experto del contexto de datos en su proceso de descubrimiento de conocimiento. Dada la robustez y calidad de los resultados, se tomarán en consideración para implementación los métodos basados en densidades (los cuales emplean algoritmos como ST-DBSCAN, ST-OPTICS y STSNN). En este documento se introducirán los conceptos relacionados con clustering de densidades para datos E-T y se realizara una comparación de los algoritmos más importantes que existen actualmente. Adicionalmente, se brindara una evaluación de resultados de la herramienta interactiva web Clu-Tool para realizar clustering de datos E-T reales como casos de estudio. Por último se describira una futura investigación en el campo de clustering para datos E-T. |
---|