A kernel-based embedding framework for high-dimensional data analysis

The world is essentially multidimensional, e.g., neurons, computer networks, Internet traffic, and financial markets. The challenge is to discover and extract information that lies hidden in these high-dimensional datasets to support classification, regression, clustering, and visualization tasks. A...

Full description

Autores:
García Vega, Sergio
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2019
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/76729
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/76729
http://bdigital.unal.edu.co/73452/
Palabra clave:
Dimensionality reduction
High-dimensional data
Kernel adaptive filtering
Embedding
Gradient descent
Online sequential learning
Sparsification
Reducción de dimensionalidad
Datos de alta dimensión
Filtrado adaptativo kernel
Incrustación
Gradiente descendente
Aprendizaje secuencial en línea
Esparsificación
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_b273a58bf719d1cdfdb49312b4668804
oai_identifier_str oai:repositorio.unal.edu.co:unal/76729
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv A kernel-based embedding framework for high-dimensional data analysis
title A kernel-based embedding framework for high-dimensional data analysis
spellingShingle A kernel-based embedding framework for high-dimensional data analysis
Dimensionality reduction
High-dimensional data
Kernel adaptive filtering
Embedding
Gradient descent
Online sequential learning
Sparsification
Reducción de dimensionalidad
Datos de alta dimensión
Filtrado adaptativo kernel
Incrustación
Gradiente descendente
Aprendizaje secuencial en línea
Esparsificación
title_short A kernel-based embedding framework for high-dimensional data analysis
title_full A kernel-based embedding framework for high-dimensional data analysis
title_fullStr A kernel-based embedding framework for high-dimensional data analysis
title_full_unstemmed A kernel-based embedding framework for high-dimensional data analysis
title_sort A kernel-based embedding framework for high-dimensional data analysis
dc.creator.fl_str_mv García Vega, Sergio
dc.contributor.author.spa.fl_str_mv García Vega, Sergio
dc.contributor.spa.fl_str_mv Castellanos Dominguez, César Germán
dc.subject.proposal.spa.fl_str_mv Dimensionality reduction
High-dimensional data
Kernel adaptive filtering
Embedding
Gradient descent
Online sequential learning
Sparsification
Reducción de dimensionalidad
Datos de alta dimensión
Filtrado adaptativo kernel
Incrustación
Gradiente descendente
Aprendizaje secuencial en línea
Esparsificación
topic Dimensionality reduction
High-dimensional data
Kernel adaptive filtering
Embedding
Gradient descent
Online sequential learning
Sparsification
Reducción de dimensionalidad
Datos de alta dimensión
Filtrado adaptativo kernel
Incrustación
Gradiente descendente
Aprendizaje secuencial en línea
Esparsificación
description The world is essentially multidimensional, e.g., neurons, computer networks, Internet traffic, and financial markets. The challenge is to discover and extract information that lies hidden in these high-dimensional datasets to support classification, regression, clustering, and visualization tasks. As a result, dimensionality reduction aims to provide a faithful representation of data in a low-dimensional space. This removes noise and redundant features, which is useful to understand and visualize the structure of complex datasets. The focus of this work is the analysis of high-dimensional data to support regression tasks and exploratory data analysis in real-world scenarios. Firstly, we propose an online framework to predict longterm future behavior of time-series. Secondly, we propose a new dimensionality reduction method to preserve the significant structure of high-dimensional data in a low-dimensional space. Lastly, we propose an sparsification strategy based on dimensionality reduction to avoid overfitting and reduce computational complexity in online applications
publishDate 2019
dc.date.issued.spa.fl_str_mv 2019-08-28
dc.date.accessioned.spa.fl_str_mv 2020-03-30T06:27:31Z
dc.date.available.spa.fl_str_mv 2020-03-30T06:27:31Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/76729
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/73452/
url https://repositorio.unal.edu.co/handle/unal/76729
http://bdigital.unal.edu.co/73452/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación Ingeniería Eléctrica
Ingeniería Eléctrica
dc.relation.haspart.spa.fl_str_mv 6 Tecnología (ciencias aplicadas) / Technology
62 Ingeniería y operaciones afines / Engineering
dc.relation.references.spa.fl_str_mv García Vega, Sergio (2019) A kernel-based embedding framework for high-dimensional data analysis. Doctorado thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/76729/1/1032428150.2019.pdf
https://repositorio.unal.edu.co/bitstream/unal/76729/2/1032428150.2019.pdf.jpg
bitstream.checksum.fl_str_mv bc530ee8dc0acc253173e4b130527c32
fb917218f9ee5ad72cf2e5e563b7c41c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089660242067456
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Castellanos Dominguez, César GermánGarcía Vega, Sergio555b3be4-fe8d-4334-8421-8b63f160ce233002020-03-30T06:27:31Z2020-03-30T06:27:31Z2019-08-28https://repositorio.unal.edu.co/handle/unal/76729http://bdigital.unal.edu.co/73452/The world is essentially multidimensional, e.g., neurons, computer networks, Internet traffic, and financial markets. The challenge is to discover and extract information that lies hidden in these high-dimensional datasets to support classification, regression, clustering, and visualization tasks. As a result, dimensionality reduction aims to provide a faithful representation of data in a low-dimensional space. This removes noise and redundant features, which is useful to understand and visualize the structure of complex datasets. The focus of this work is the analysis of high-dimensional data to support regression tasks and exploratory data analysis in real-world scenarios. Firstly, we propose an online framework to predict longterm future behavior of time-series. Secondly, we propose a new dimensionality reduction method to preserve the significant structure of high-dimensional data in a low-dimensional space. Lastly, we propose an sparsification strategy based on dimensionality reduction to avoid overfitting and reduce computational complexity in online applicationsEl mundo es esencialmente multidimensional, por ejemplo, neuronas, redes computacionales, tráfico de internet y los mercados financieros. El desafío es descubrir y extraer información que permanece oculta en estos conjuntos de datos de alta dimensión para apoyar tareas de clasificación, regresión, agrupamiento y visualización. Como resultado de ello, los métodos de reducción de dimensión pretenden suministrar una fiel representación de los datos en un espacio de baja dimensión. Esto permite eliminar ruido y características redundantes, lo que es útil para entender y visualizar la estructura de conjuntos de datos complejos. Este trabajo se enfoca en el análisis de datos de alta dimensión para apoyar tareas de regresión y el análisis exploratorio de datos en escenarios del mundo real. En primer lugar, proponemos un marco para la predicción del comportamiento a largo plazo de series de tiempo. En segundo lugar, se propone un nuevo método de reducción de dimensión para preservar la estructura significativa de datos de alta dimensión en un espacio de baja dimensión. Finalmente, proponemos una estrategia de esparsificacion que utiliza reducción de dimensional dad para evitar sobre ajuste y reducir la complejidad computacional de aplicaciones en líneaDoctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación Ingeniería EléctricaIngeniería Eléctrica6 Tecnología (ciencias aplicadas) / Technology62 Ingeniería y operaciones afines / EngineeringGarcía Vega, Sergio (2019) A kernel-based embedding framework for high-dimensional data analysis. Doctorado thesis, Universidad Nacional de Colombia - Sede Manizales.A kernel-based embedding framework for high-dimensional data analysisTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDDimensionality reductionHigh-dimensional dataKernel adaptive filteringEmbeddingGradient descentOnline sequential learningSparsificationReducción de dimensionalidadDatos de alta dimensiónFiltrado adaptativo kernelIncrustaciónGradiente descendenteAprendizaje secuencial en líneaEsparsificaciónORIGINAL1032428150.2019.pdfTesis de Doctorado en Ingeniería - Automáticaapplication/pdf6143923https://repositorio.unal.edu.co/bitstream/unal/76729/1/1032428150.2019.pdfbc530ee8dc0acc253173e4b130527c32MD51THUMBNAIL1032428150.2019.pdf.jpg1032428150.2019.pdf.jpgGenerated Thumbnailimage/jpeg4293https://repositorio.unal.edu.co/bitstream/unal/76729/2/1032428150.2019.pdf.jpgfb917218f9ee5ad72cf2e5e563b7c41cMD52unal/76729oai:repositorio.unal.edu.co:unal/767292024-09-16 11:52:10.186Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co