Metodología de reducción de dimensión de tipo espectral con representación interactiva de datos

La reducción de dimensión (RD) es una metodología utilizada en muchos campos ligados al procesamiento de datos, y puede representar una etapa de preproceso o ser un elemento esencial para la representación y clasificación de datos. El objetivo principal de la RD es obtener una nueva representación d...

Full description

Autores:
Salazar Castro, José Alejandro
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/63860
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/63860
http://bdigital.unal.edu.co/64456/
Palabra clave:
0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
62 Ingeniería y operaciones afines / Engineering
Métodos espectrales de reducción de dimensión
Reducción de costo computacional
Representación interactiva de datos
Representación visual de información
Submatrices localmente lineales
Locally linear landmarks
Interactive dimensionality reduction
Reduction of computational cost
Spectral methods for dimensionality reduction
Visual representation of information
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:La reducción de dimensión (RD) es una metodología utilizada en muchos campos ligados al procesamiento de datos, y puede representar una etapa de preproceso o ser un elemento esencial para la representación y clasificación de datos. El objetivo principal de la RD es obtener una nueva representación de los datos originales en un espacio de menor dimensión, de forma que se produzca información más depurada, reduzca el tiempo del procesado subsecuente o genere representaciones visuales inteligibles para el ser humano. Los métodos recientes y más sofisticados de RD exploran la topología de los datos, entre estos se encuentran los enfoques de tipo espectral. Particularmente, los métodos espectrales son altamente versátiles y han comprobado ser una buena alternativa para diversas aplicaciones. Estos métodos no permiten manipular directamente sus parámetros, y, por tanto, el usuario final queda sometido a las representaciones visuales resultantes, que en muchos de los casos requieren de un experto para su análisis, puesto que no se ajustan a las necesidades y los requerimiento del usuario. En este sentido, se genera implícitamente un incremento en tiempo y trabajo en la inspección visual, realizada como el último paso del análisis de datos. Una de las formas de generar representaciones más adecuadas para el usuario y que permiten deducir un mejor conocimiento es integrar la inteligencia natural del ser humano con la inteligencia de la máquina. Para esto, es necesario integrar propiedades de la visualización de información (VI), como la interactividad y la controlabilidad, de forma que el usuario tenga la facultad de variar los parámetros de los métodos de RD hasta obtener una representación que se adapte a sus necesidades. Los métodos espectrales requieren realizar un proceso de descomposición en valores y vectores propios, el cual suele presentar un costo computacional elevado, y, por tanto, resulta difícil la tarea de obtener una integración usuario-máquina más dinámica e interactiva. Por lo anterior, para el diseño de un sistema interactivo de VI basado en métodos espectrales de RD es necesario plantear una estrategia para disminuir el coste computacional requerido en el cálculo de los vectores y valores propios. En este trabajo de grado de maestría se propone una metodología de RD espectral con bajo costo computacional para la representación interactiva de datos. Para este fin, se propone utilizar submatrices localmente lineales como aproximación de una matriz de afinidad. Además, se propone un modelo interactivo que permita al usuario obtener una representación visual dinámica de los datos mediante una mezcla ponderada. Esto permite integrar la inteligencia natural con la computacional para la representación de datos de forma interactiva, dinámica y a bajo costo computacional