Robust unsupervised learning using kernels

This thesis aims to study deep connections between statistical robustness and machine learning techniques, in particular, the relationship between some particular kernel (the Gaussian kernel) and the robustness of kernel-based learning methods that use it. This thesis also presented that estimating...

Full description

Autores:
Gallego Mejia, Joseph Alejandro
Tipo de recurso:
Fecha de publicación:
2017
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/59937
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/59937
http://bdigital.unal.edu.co/57770/
Palabra clave:
62 Ingeniería y operaciones afines / Engineering
Machine Learning
Dimensionality Reduction
Unsupervised Learning
Kernel Learning Approach
Robust Statistics
Welsch Estimator
Aprendizaje de máquina
Reducción de la dimensionalidad
Aprendizaje con métodos de Kernel
Estadística robusta
Eestimadorde Welsch.
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_d99a89603617167a6eba5ba50ee962e5
oai_identifier_str oai:repositorio.unal.edu.co:unal/59937
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Robust unsupervised learning using kernels
title Robust unsupervised learning using kernels
spellingShingle Robust unsupervised learning using kernels
62 Ingeniería y operaciones afines / Engineering
Machine Learning
Dimensionality Reduction
Unsupervised Learning
Kernel Learning Approach
Robust Statistics
Welsch Estimator
Aprendizaje de máquina
Reducción de la dimensionalidad
Aprendizaje con métodos de Kernel
Estadística robusta
Eestimadorde Welsch.
title_short Robust unsupervised learning using kernels
title_full Robust unsupervised learning using kernels
title_fullStr Robust unsupervised learning using kernels
title_full_unstemmed Robust unsupervised learning using kernels
title_sort Robust unsupervised learning using kernels
dc.creator.fl_str_mv Gallego Mejia, Joseph Alejandro
dc.contributor.advisor.spa.fl_str_mv Gonzalez Osorio, Fabio Augusto (Thesis advisor)
Ovalle Carranza, Demetrio Arturo (Thesis advisor)
dc.contributor.author.spa.fl_str_mv Gallego Mejia, Joseph Alejandro
dc.subject.ddc.spa.fl_str_mv 62 Ingeniería y operaciones afines / Engineering
topic 62 Ingeniería y operaciones afines / Engineering
Machine Learning
Dimensionality Reduction
Unsupervised Learning
Kernel Learning Approach
Robust Statistics
Welsch Estimator
Aprendizaje de máquina
Reducción de la dimensionalidad
Aprendizaje con métodos de Kernel
Estadística robusta
Eestimadorde Welsch.
dc.subject.proposal.spa.fl_str_mv Machine Learning
Dimensionality Reduction
Unsupervised Learning
Kernel Learning Approach
Robust Statistics
Welsch Estimator
Aprendizaje de máquina
Reducción de la dimensionalidad
Aprendizaje con métodos de Kernel
Estadística robusta
Eestimadorde Welsch.
description This thesis aims to study deep connections between statistical robustness and machine learning techniques, in particular, the relationship between some particular kernel (the Gaussian kernel) and the robustness of kernel-based learning methods that use it. This thesis also presented that estimating the mean in the feature space with the RBF kernel, is like doing robust estimation of the mean in the data space with the Welsch M-estimator. Based on these ideas, new robust kernel to machine learning algorithms are designed and implemented in the current thesis: Tukey’s, Andrews’ and Huber’s robust kernels which each one corresponding to Tukey’s, Andrews’ and Huber’s M-robust estimator, respectively. On the one hand, kernel-based algorithms are an important tool which is widely applied to different machine learning and information retrieval problems including: clustering, latent topic analysis, recommender systems, image annotation, and contentbased image retrieval, amongst others. Robustness is the ability of a statistical estimation method or machine learning method to deal with noise and outliers. There is a strong theory of robustness in statistics; however, it receives little attention in machine learning. A systematic evaluation is performed in order to evaluate the robustness of kernel-based algorithms in clustering showing that some robust kernels including Tukey’s and Andrews’ robust kernels perform on par to state-of-the-art algorithms
publishDate 2017
dc.date.issued.spa.fl_str_mv 2017-07-04
dc.date.accessioned.spa.fl_str_mv 2019-07-02T17:09:29Z
dc.date.available.spa.fl_str_mv 2019-07-02T17:09:29Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/59937
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/57770/
url https://repositorio.unal.edu.co/handle/unal/59937
http://bdigital.unal.edu.co/57770/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemas Ingeniería de Sistemas e Informática
Ingeniería de Sistemas e Informática
dc.relation.references.spa.fl_str_mv Gallego Mejia, Joseph Alejandro (2017) Robust unsupervised learning using kernels. Maestría thesis, Universidad Nacional de Colombia -Sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/59937/1/1022369610.2017.pdf
https://repositorio.unal.edu.co/bitstream/unal/59937/2/1022369610.2017.pdf.jpg
bitstream.checksum.fl_str_mv e295e18494ef6684a116632db7589953
ee57fa077a0e7e94e65a29117261a52c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814090016532463616
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Gonzalez Osorio, Fabio Augusto (Thesis advisor)cdc14b69-bf63-4f8c-ab69-fd166d3c8142-1Ovalle Carranza, Demetrio Arturo (Thesis advisor)feffbb46-9f31-42f5-be3f-bc2199858650-1Gallego Mejia, Joseph Alejandro3d52cdd9-a83c-4454-a32b-e77db27f9a313002019-07-02T17:09:29Z2019-07-02T17:09:29Z2017-07-04https://repositorio.unal.edu.co/handle/unal/59937http://bdigital.unal.edu.co/57770/This thesis aims to study deep connections between statistical robustness and machine learning techniques, in particular, the relationship between some particular kernel (the Gaussian kernel) and the robustness of kernel-based learning methods that use it. This thesis also presented that estimating the mean in the feature space with the RBF kernel, is like doing robust estimation of the mean in the data space with the Welsch M-estimator. Based on these ideas, new robust kernel to machine learning algorithms are designed and implemented in the current thesis: Tukey’s, Andrews’ and Huber’s robust kernels which each one corresponding to Tukey’s, Andrews’ and Huber’s M-robust estimator, respectively. On the one hand, kernel-based algorithms are an important tool which is widely applied to different machine learning and information retrieval problems including: clustering, latent topic analysis, recommender systems, image annotation, and contentbased image retrieval, amongst others. Robustness is the ability of a statistical estimation method or machine learning method to deal with noise and outliers. There is a strong theory of robustness in statistics; however, it receives little attention in machine learning. A systematic evaluation is performed in order to evaluate the robustness of kernel-based algorithms in clustering showing that some robust kernels including Tukey’s and Andrews’ robust kernels perform on par to state-of-the-art algorithmsResumen: Esta tesis apunta a mostrar la profunda relación que existe entre robustez estadística y técnicas de aprendizaje de maquina, en particular, la relación entre algunos tipos de kernels (kernel Gausiano) y la robustez de los métodos basados en kernels. Esta tesis también presenta que la estimación de la media en el espacio de características con el kernel rbf, es como hacer estimación de la media en el espacio de los datos con el m-estimador de Welsch. Basado en las ideas anteriores, un conjunto de nuevos kernel robustos son propuestos y diseñdos: Tukey, Andrews, y Huber kernels robustos correspondientes a los m-estimadores de Tukey, Andrews y Huber respectivamente. Por un lado, los algoritmos basados en kernel es una importante herramienta aplicada en diferentes problemas de aprendizaje automático y recuperación de información, incluyendo: el agrupamiento, análisis de tema latente, sistemas de recomendación, anotación de imágenes, recuperación de informacion, entre otros. La robustez es la capacidad de un método o procedimiento de estimación aprendizaje estadístico automatico para lidiar con el ruido y los valores atípicos. Hay una fuerte teoría de robustez en estadística, sin embargo, han recibido poca atención en aprendizaje de máquina. Una evaluación sistemática se realiza con el fin de evaluar la robustez de los algoritmos basados en kernel en tareas de agrupación mostrando que algunos kernels robustos incluyendo los kernels de Tukey y de Andrews se desempeñan a la par de los algoritmos del estado del arte.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemas Ingeniería de Sistemas e InformáticaIngeniería de Sistemas e InformáticaGallego Mejia, Joseph Alejandro (2017) Robust unsupervised learning using kernels. Maestría thesis, Universidad Nacional de Colombia -Sede Medellín.62 Ingeniería y operaciones afines / EngineeringMachine LearningDimensionality ReductionUnsupervised LearningKernel Learning ApproachRobust StatisticsWelsch EstimatorAprendizaje de máquinaReducción de la dimensionalidadAprendizaje con métodos de KernelEstadística robustaEestimadorde Welsch.Robust unsupervised learning using kernelsTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1022369610.2017.pdfTesis de Maestría en Ingeniería - Ingeniería de Sistemasapplication/pdf3213606https://repositorio.unal.edu.co/bitstream/unal/59937/1/1022369610.2017.pdfe295e18494ef6684a116632db7589953MD51THUMBNAIL1022369610.2017.pdf.jpg1022369610.2017.pdf.jpgGenerated Thumbnailimage/jpeg3795https://repositorio.unal.edu.co/bitstream/unal/59937/2/1022369610.2017.pdf.jpgee57fa077a0e7e94e65a29117261a52cMD52unal/59937oai:repositorio.unal.edu.co:unal/599372023-10-13 09:41:01.692Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co