Nonlinear dimensionality reduction frameworks to support machine learning systems

En este trabajo se presentan algunos esquemas de reducción de dimensión no lineal (RDNL) basados en aprendizaje por variedades. En este sentido, se pretende identificar adecuadamente la información relevante del fenómeno en estudio a partir de datos de alta dimensión, con el fin de mejorar y facilit...

Full description

Autores:
Álvarez Meza, Andrés Marino
Tipo de recurso:
Fecha de publicación:
2011
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/8998
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/8998
http://bdigital.unal.edu.co/5740/
Palabra clave:
0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
Reducción de dimensión no lineal, Aprendizaje de máquina, Aprendizaje por variedades, Visualización de datos, Análisis discriminante, Síntesis de datos, Optimización de parámetros, Nonlinear dimensionality reduction, Machine learning, Manifold learning, Data visualization, Discriminant analysis, Data synthesis, Parameter optimization.
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_1bc19819efb31cab7a18eb4d0a115073
oai_identifier_str oai:repositorio.unal.edu.co:unal/8998
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Nonlinear dimensionality reduction frameworks to support machine learning systems
dc.title.translated.Spa.fl_str_mv Esquemas de reducción de dimensión no lineal para apoyar sistemas de aprendizaje de máquina
title Nonlinear dimensionality reduction frameworks to support machine learning systems
spellingShingle Nonlinear dimensionality reduction frameworks to support machine learning systems
0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
Reducción de dimensión no lineal, Aprendizaje de máquina, Aprendizaje por variedades, Visualización de datos, Análisis discriminante, Síntesis de datos, Optimización de parámetros, Nonlinear dimensionality reduction, Machine learning, Manifold learning, Data visualization, Discriminant analysis, Data synthesis, Parameter optimization.
title_short Nonlinear dimensionality reduction frameworks to support machine learning systems
title_full Nonlinear dimensionality reduction frameworks to support machine learning systems
title_fullStr Nonlinear dimensionality reduction frameworks to support machine learning systems
title_full_unstemmed Nonlinear dimensionality reduction frameworks to support machine learning systems
title_sort Nonlinear dimensionality reduction frameworks to support machine learning systems
dc.creator.fl_str_mv Álvarez Meza, Andrés Marino
dc.contributor.advisor.spa.fl_str_mv Acosta Medina, Carlos Daniel (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Álvarez Meza, Andrés Marino
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
topic 0 Generalidades / Computer science, information and general works
51 Matemáticas / Mathematics
Reducción de dimensión no lineal, Aprendizaje de máquina, Aprendizaje por variedades, Visualización de datos, Análisis discriminante, Síntesis de datos, Optimización de parámetros, Nonlinear dimensionality reduction, Machine learning, Manifold learning, Data visualization, Discriminant analysis, Data synthesis, Parameter optimization.
dc.subject.proposal.spa.fl_str_mv Reducción de dimensión no lineal, Aprendizaje de máquina, Aprendizaje por variedades, Visualización de datos, Análisis discriminante, Síntesis de datos, Optimización de parámetros, Nonlinear dimensionality reduction, Machine learning, Manifold learning, Data visualization, Discriminant analysis, Data synthesis, Parameter optimization.
description En este trabajo se presentan algunos esquemas de reducción de dimensión no lineal (RDNL) basados en aprendizaje por variedades. En este sentido, se pretende identificar adecuadamente la información relevante del fenómeno en estudio a partir de datos de alta dimensión, con el fin de mejorar y facilitar el desempeño de aplicaciones relacionadas con aprendizaje de máquina, tales como: visualización, regresión, clasificación y síntesis de datos. De este modo, se presenta una nueva metodología basada en RDNL para el modelado de estructuras subyacentes de datos. Para ello, las muestras de entrada son analizadas en espacios de baja dimensión calculados a partir de RDNL, con el fin de identificar las características relevantes que rigen el proceso de estudio. Posteriormente, la geometría intrínseca de los datos es aprendida por medio de un algoritmo de interpolación. El esquema propuesto permite inferir muestras desconocidas en problemas de síntesis de datos, garantizando un funcionamiento estable, incluso ante condiciones de alta variabilidad en las características del espacio deentrada. Asimismo, se propone un esquema de RDNL que permite incorporar conocimiento a priori sobre los datos, a fin de calcular inmersiones que desdoblen correctamente la estructura subyacente del fenómeno estudiado. El objetivo del esquema propuesto es utilizar representaciones de núcleo múltiple (RNM) en problemas de optimización de RDNL. En este sentido, dicho esquema es utilizado para identificar tanto las relaciones espaciales y temporales entre imágenes de videos. Así, es posible revelar la dinámica espacial y temporal de videos relacionados con movimientos cíclicos. Del mismo modo, se propone un método de RDNL supervisado utilizando RNM para incorporar la información de etiqueta de clase de las observaciones. Por lo tanto, el algoritmo de RDNL supervisado propuesto permite conservar la estructura local de los datos y maximiza el margen de separabilidad entre clases en problemas de clasificación. Además, se desarrollan algunas estrategias para seleccionar automáticamente los parámetros libres de los esquemas propuestos. En general, los métodos propuestos de RDNL son eficientes y competitivos para apoyar procedimientos de aprendizaje de máquina / Abstract: In this work, some nonlinear dimensionality reduction (NLDR) frameworks based on manifold learning are proposed. Our main goal is to properly reveal the most relevant information from high dimensional data for enhancing the performance of machine learning applications, such as: data visualization, regression, synthesis, and classification. In this regard, we present a new methodology for modeling the underlying data structure based on NLDR. We analyze the samples in a low dimensional space computed by means of NLDR to identify the most relevant features that govern the studied process, and we learn the intrinsic geometry of the data by means of an interpolation algorithm. Our approach allows to infer unknown samples in synthesis problems ensuring a stable performance, even against feature variability conditions of the original input space. Furthermore, we propose a NLDR framework that allows to incorporate prior knowledge about the data, in order to obtain low dimensional spaces that properly unfold the underlying structure of the manifold. We aim to take advantage of a Multiple Kernel Representation (MKR) scheme in a NLDR optimization problem. In this sense, we test our proposal for analyzing videos based on a MKR of the input data, improving a NLDR scheme to compute and learn both spatial and temporal relationships among frames. The presented approach is tested for revealing the spatial and temporal dynamics of real-world videos related to cyclic motions. Similarly, we propose a supervised NLDR method based on MKR to incorporate class label information of the inputs, while the local structure topology of the data is preserved during the embedding process. Hence, our approach aims to conserve both the local data structure and the margin of reparability among classes in classification problems. Furthermore, we present some strategies to fix automatically the free parameters of the proposed frameworks. Overall, proposed NLDR frameworks are efficient and competitive to support machine learning procedures.
publishDate 2011
dc.date.issued.spa.fl_str_mv 2011
dc.date.accessioned.spa.fl_str_mv 2019-06-24T17:48:38Z
dc.date.available.spa.fl_str_mv 2019-06-24T17:48:38Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/8998
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/5740/
url https://repositorio.unal.edu.co/handle/unal/8998
http://bdigital.unal.edu.co/5740/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y Computación
Departamento de Ingeniería Eléctrica, Electrónica y Computación
dc.relation.references.spa.fl_str_mv Álvarez Meza, Andrés Marino (2011) Nonlinear dimensionality reduction frameworks to support machine learning systems = esquemas de reducción de dimensión no lineal para apoyar sistemas de aprendizaje de máquina. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/8998/1/7110001-2011.pdf
https://repositorio.unal.edu.co/bitstream/unal/8998/2/7110001-2011.pdf.jpg
bitstream.checksum.fl_str_mv e5c0eca5ea971d4385013a8ab011d747
6ad56bbefa605c1ee08fac36b65419eb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089964891144192
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Acosta Medina, Carlos Daniel (Thesis advisor)794beb7e-0d16-4ef9-83ce-e43e6d1e038bÁlvarez Meza, Andrés Marino3bdb608d-4c13-42ce-8ac3-75224e8235ae3002019-06-24T17:48:38Z2019-06-24T17:48:38Z2011https://repositorio.unal.edu.co/handle/unal/8998http://bdigital.unal.edu.co/5740/En este trabajo se presentan algunos esquemas de reducción de dimensión no lineal (RDNL) basados en aprendizaje por variedades. En este sentido, se pretende identificar adecuadamente la información relevante del fenómeno en estudio a partir de datos de alta dimensión, con el fin de mejorar y facilitar el desempeño de aplicaciones relacionadas con aprendizaje de máquina, tales como: visualización, regresión, clasificación y síntesis de datos. De este modo, se presenta una nueva metodología basada en RDNL para el modelado de estructuras subyacentes de datos. Para ello, las muestras de entrada son analizadas en espacios de baja dimensión calculados a partir de RDNL, con el fin de identificar las características relevantes que rigen el proceso de estudio. Posteriormente, la geometría intrínseca de los datos es aprendida por medio de un algoritmo de interpolación. El esquema propuesto permite inferir muestras desconocidas en problemas de síntesis de datos, garantizando un funcionamiento estable, incluso ante condiciones de alta variabilidad en las características del espacio deentrada. Asimismo, se propone un esquema de RDNL que permite incorporar conocimiento a priori sobre los datos, a fin de calcular inmersiones que desdoblen correctamente la estructura subyacente del fenómeno estudiado. El objetivo del esquema propuesto es utilizar representaciones de núcleo múltiple (RNM) en problemas de optimización de RDNL. En este sentido, dicho esquema es utilizado para identificar tanto las relaciones espaciales y temporales entre imágenes de videos. Así, es posible revelar la dinámica espacial y temporal de videos relacionados con movimientos cíclicos. Del mismo modo, se propone un método de RDNL supervisado utilizando RNM para incorporar la información de etiqueta de clase de las observaciones. Por lo tanto, el algoritmo de RDNL supervisado propuesto permite conservar la estructura local de los datos y maximiza el margen de separabilidad entre clases en problemas de clasificación. Además, se desarrollan algunas estrategias para seleccionar automáticamente los parámetros libres de los esquemas propuestos. En general, los métodos propuestos de RDNL son eficientes y competitivos para apoyar procedimientos de aprendizaje de máquina / Abstract: In this work, some nonlinear dimensionality reduction (NLDR) frameworks based on manifold learning are proposed. Our main goal is to properly reveal the most relevant information from high dimensional data for enhancing the performance of machine learning applications, such as: data visualization, regression, synthesis, and classification. In this regard, we present a new methodology for modeling the underlying data structure based on NLDR. We analyze the samples in a low dimensional space computed by means of NLDR to identify the most relevant features that govern the studied process, and we learn the intrinsic geometry of the data by means of an interpolation algorithm. Our approach allows to infer unknown samples in synthesis problems ensuring a stable performance, even against feature variability conditions of the original input space. Furthermore, we propose a NLDR framework that allows to incorporate prior knowledge about the data, in order to obtain low dimensional spaces that properly unfold the underlying structure of the manifold. We aim to take advantage of a Multiple Kernel Representation (MKR) scheme in a NLDR optimization problem. In this sense, we test our proposal for analyzing videos based on a MKR of the input data, improving a NLDR scheme to compute and learn both spatial and temporal relationships among frames. The presented approach is tested for revealing the spatial and temporal dynamics of real-world videos related to cyclic motions. Similarly, we propose a supervised NLDR method based on MKR to incorporate class label information of the inputs, while the local structure topology of the data is preserved during the embedding process. Hence, our approach aims to conserve both the local data structure and the margin of reparability among classes in classification problems. Furthermore, we present some strategies to fix automatically the free parameters of the proposed frameworks. Overall, proposed NLDR frameworks are efficient and competitive to support machine learning procedures.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura Departamento de Ingeniería Eléctrica, Electrónica y ComputaciónDepartamento de Ingeniería Eléctrica, Electrónica y ComputaciónÁlvarez Meza, Andrés Marino (2011) Nonlinear dimensionality reduction frameworks to support machine learning systems = esquemas de reducción de dimensión no lineal para apoyar sistemas de aprendizaje de máquina. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.0 Generalidades / Computer science, information and general works51 Matemáticas / MathematicsReducción de dimensión no lineal, Aprendizaje de máquina, Aprendizaje por variedades, Visualización de datos, Análisis discriminante, Síntesis de datos, Optimización de parámetros, Nonlinear dimensionality reduction, Machine learning, Manifold learning, Data visualization, Discriminant analysis, Data synthesis, Parameter optimization.Nonlinear dimensionality reduction frameworks to support machine learning systemsEsquemas de reducción de dimensión no lineal para apoyar sistemas de aprendizaje de máquinaTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL7110001-2011.pdfapplication/pdf13972139https://repositorio.unal.edu.co/bitstream/unal/8998/1/7110001-2011.pdfe5c0eca5ea971d4385013a8ab011d747MD51THUMBNAIL7110001-2011.pdf.jpg7110001-2011.pdf.jpgGenerated Thumbnailimage/jpeg4561https://repositorio.unal.edu.co/bitstream/unal/8998/2/7110001-2011.pdf.jpg6ad56bbefa605c1ee08fac36b65419ebMD52unal/8998oai:repositorio.unal.edu.co:unal/89982022-09-14 23:05:50.262Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co