Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos

El análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden lleg...

Full description

Autores:
Canchila Rodríguez, Bryan Alejandro
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad El Bosque
Repositorio:
Repositorio U. El Bosque
Idioma:
spa
OAI Identifier:
oai:repositorio.unbosque.edu.co:20.500.12495/10820
Acceso en línea:
http://hdl.handle.net/20.500.12495/10820
Palabra clave:
Imputación k-NN
519.5
Imputation k-NN
Rights
closedAccess
License
Acceso cerrado
id UNBOSQUE2_8696c5190d527f1d3d86022c5f97cc39
oai_identifier_str oai:repositorio.unbosque.edu.co:20.500.12495/10820
network_acronym_str UNBOSQUE2
network_name_str Repositorio U. El Bosque
repository_id_str
dc.title.spa.fl_str_mv Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
dc.title.translated.spa.fl_str_mv KNN algorithm for the imputation of missing values type MCAR with different values of k near neighbors
title Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
spellingShingle Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
Imputación k-NN
519.5
Imputation k-NN
title_short Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
title_full Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
title_fullStr Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
title_full_unstemmed Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
title_sort Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
dc.creator.fl_str_mv Canchila Rodríguez, Bryan Alejandro
dc.contributor.advisor.none.fl_str_mv Rodriguez Arango, Emiliano
dc.contributor.author.none.fl_str_mv Canchila Rodríguez, Bryan Alejandro
dc.contributor.orcid.none.fl_str_mv Canchila Rodríguez, Bryan Alejandro [0000-0002-5553-5761]
dc.subject.spa.fl_str_mv Imputación k-NN
topic Imputación k-NN
519.5
Imputation k-NN
dc.subject.ddc.none.fl_str_mv 519.5
dc.subject.keywords.spa.fl_str_mv Imputation k-NN
description El análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden llegar afectar los análisis e interpretaciones del conjunto de datos y los métodos de imputación permiten solucionar estos problemas. El método k-NN es un método de imputación muy conocido por su simplicidad, pero presenta un gran desafío al momento de elegir un valor de k adecuado. Esta investigación propone un algoritmo k-NN de imputación que permite calcular un valor de k diferente para cada valor faltante partiendo del hecho de que es razonable pensar que cada valor faltante puede tener un numero distintos de vecinos cercanos. El algoritmo es comparado con los métodos tradicionales del k-NN para imputación en valores faltantes tipo MCAR obteniendo mejores resultados en el algoritmo propuesto.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-06-13T15:23:32Z
dc.date.available.none.fl_str_mv 2023-06-13T15:23:32Z
dc.date.issued.none.fl_str_mv 2023
dc.type.local.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12495/10820
dc.identifier.instname.spa.fl_str_mv instname:Universidad El Bosque
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad El Bosque
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.unbosque.edu.co
url http://hdl.handle.net/20.500.12495/10820
identifier_str_mv instname:Universidad El Bosque
reponame:Repositorio Institucional Universidad El Bosque
repourl:https://repositorio.unbosque.edu.co
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.local.spa.fl_str_mv Acceso cerrado
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/closedAccess
http://purl.org/coar/access_right/c_14cb
rights_invalid_str_mv Acceso cerrado
http://purl.org/coar/access_right/c_14cb
eu_rights_str_mv closedAccess
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.program.spa.fl_str_mv Estadística
dc.publisher.grantor.spa.fl_str_mv Universidad El Bosque
dc.publisher.faculty.spa.fl_str_mv Facultad de Ciencias
institution Universidad El Bosque
bitstream.url.fl_str_mv https://repositorio.unbosque.edu.co/bitstreams/b3981a39-709a-4146-a3c2-d41d4eb066c1/download
https://repositorio.unbosque.edu.co/bitstreams/62a30d52-3639-456f-b51c-4a255301fba0/download
https://repositorio.unbosque.edu.co/bitstreams/62f49ce8-9dc1-4cea-8ddd-0ae815f0ead2/download
https://repositorio.unbosque.edu.co/bitstreams/fb83c419-8a1b-4099-8583-6d3b11e8c213/download
https://repositorio.unbosque.edu.co/bitstreams/b6fbb85f-fa56-4cd7-a346-0896441f9346/download
https://repositorio.unbosque.edu.co/bitstreams/3d001d77-c256-48e5-8b2f-aa18f772d3b7/download
bitstream.checksum.fl_str_mv 51d1068d29e207ead54acde44682edfd
e5a21ff9676f82c4105b6f8108db4ff9
8d4dbe680fce108d90a5dba016889aac
17cc15b951e7cc6b3728a574117320f9
71c909689268bf0106f0801048a213d5
ad76a54c76009d30722d5df23726d630
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad El Bosque
repository.mail.fl_str_mv bibliotecas@biteca.com
_version_ 1814100830764138496
spelling Rodriguez Arango, EmilianoCanchila Rodríguez, Bryan AlejandroCanchila Rodríguez, Bryan Alejandro [0000-0002-5553-5761]2023-06-13T15:23:32Z2023-06-13T15:23:32Z2023http://hdl.handle.net/20.500.12495/10820instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coEl análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden llegar afectar los análisis e interpretaciones del conjunto de datos y los métodos de imputación permiten solucionar estos problemas. El método k-NN es un método de imputación muy conocido por su simplicidad, pero presenta un gran desafío al momento de elegir un valor de k adecuado. Esta investigación propone un algoritmo k-NN de imputación que permite calcular un valor de k diferente para cada valor faltante partiendo del hecho de que es razonable pensar que cada valor faltante puede tener un numero distintos de vecinos cercanos. El algoritmo es comparado con los métodos tradicionales del k-NN para imputación en valores faltantes tipo MCAR obteniendo mejores resultados en el algoritmo propuesto.EstadísticoPregradoData analysis is one of the most important topics nowadays and for companies it has become a crucial process in decision making or business strategies. One of the most common problems in data analysis is the presence of missing values that can affect the analysis and interpretation of the data set and imputation methods can solve these problems. The k-NN method is a well-known imputation method because of its simplicity, but it presents a great challenge when choosing a suitable k value. This research proposes a k-NN imputation algorithm that allows to compute a different value of k for each missing value based on the fact that it is reasonable to think that each missing value can have a different number of nearest neighbors. The algorithm is compared with the traditional k-NN methods for MCAR type missing value imputation obtaining better results in the proposed algorithm.application/pdfspaImputación k-NN519.5Imputation k-NNAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosKNN algorithm for the imputation of missing values type MCAR with different values of k near neighborsEstadísticaUniversidad El BosqueFacultad de CienciasTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisAcceso cerradoinfo:eu-repo/semantics/closedAccesshttp://purl.org/coar/access_right/c_14cbTHUMBNAILAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.pngAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.pngPortadaimage/png60573https://repositorio.unbosque.edu.co/bitstreams/b3981a39-709a-4146-a3c2-d41d4eb066c1/download51d1068d29e207ead54acde44682edfdMD54Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.jpgAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.jpgGenerated Thumbnailimage/jpeg3146https://repositorio.unbosque.edu.co/bitstreams/62a30d52-3639-456f-b51c-4a255301fba0/downloade5a21ff9676f82c4105b6f8108db4ff9MD57ORIGINALAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosapplication/pdf223218https://repositorio.unbosque.edu.co/bitstreams/62f49ce8-9dc1-4cea-8ddd-0ae815f0ead2/download8d4dbe680fce108d90a5dba016889aacMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82000https://repositorio.unbosque.edu.co/bitstreams/fb83c419-8a1b-4099-8583-6d3b11e8c213/download17cc15b951e7cc6b3728a574117320f9MD53Carta.pdfCarta.pdfCarta autorizaciónapplication/pdf1551498https://repositorio.unbosque.edu.co/bitstreams/b6fbb85f-fa56-4cd7-a346-0896441f9346/download71c909689268bf0106f0801048a213d5MD55TEXTAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.txtAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.txtExtracted texttext/plain45687https://repositorio.unbosque.edu.co/bitstreams/3d001d77-c256-48e5-8b2f-aa18f772d3b7/downloadad76a54c76009d30722d5df23726d630MD5620.500.12495/10820oai:repositorio.unbosque.edu.co:20.500.12495/108202024-02-07 11:16:03.958restrictedhttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTGljZW5jaWEgZGUgRGlzdHJpYnVjacOzbiBObyBFeGNsdXNpdmEKClBhcmEgcXVlIGVsIFJlcG9zaXRvcmlvIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBhIHB1ZWRhIHJlcHJvZHVjaXIgeSBjb211bmljYXIgcMO6YmxpY2FtZW50ZSBzdSBkb2N1bWVudG8gZXMgbmVjZXNhcmlvIGxhIGFjZXB0YWNpw7NuIGRlIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcy4gUG9yIGZhdm9yLCBsZWEgbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXMgZGUgbGljZW5jaWE6CgoxLiBBY2VwdGFuZG8gZXN0YSBsaWNlbmNpYSwgdXN0ZWQgKGVsIGF1dG9yL2VzIG8gZWwgcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGUgYXV0b3IpIGdhcmFudGl6YSBhIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBlbCBkZXJlY2hvIG5vIGV4Y2x1c2l2byBkZSBhcmNoaXZhciwgcmVwcm9kdWNpciwgY29udmVydGlyIChjb21vIHNlIGRlZmluZSBtw6FzIGFiYWpvKSwgY29tdW5pY2FyIHkvbyBkaXN0cmlidWlyIHN1IGRvY3VtZW50byBtdW5kaWFsbWVudGUgZW4gZm9ybWF0byBlbGVjdHLDs25pY28uCgoyLiBUYW1iacOpbiBlc3TDoSBkZSBhY3VlcmRvIGNvbiBxdWUgbGEgVW5pdmVyc2lkYWQgRWwgQm9zcXVlIHB1ZWRhIGNvbnNlcnZhciBtw6FzIGRlIHVuYSBjb3BpYSBkZSBlc3RlIGRvY3VtZW50byB5LCBzaW4gYWx0ZXJhciBzdSBjb250ZW5pZG8sIGNvbnZlcnRpcmxvIGEgY3VhbHF1aWVyIGZvcm1hdG8gZGUgZmljaGVybywgbWVkaW8gbyBzb3BvcnRlLCBwYXJhIHByb3DDs3NpdG9zIGRlIHNlZ3VyaWRhZCwgcHJlc2VydmFjacOzbiB5IGFjY2Vzby4KCjMuIERlY2xhcmEgcXVlIGVsIGRvY3VtZW50byBlcyB1biB0cmFiYWpvIG9yaWdpbmFsIHN1eW8geS9vIHF1ZSB0aWVuZSBlbCBkZXJlY2hvIHBhcmEgb3RvcmdhciBsb3MgZGVyZWNob3MgY29udGVuaWRvcyBlbiBlc3RhIGxpY2VuY2lhLiBUYW1iacOpbiBkZWNsYXJhIHF1ZSBzdSBkb2N1bWVudG8gbm8gaW5mcmluZ2UsIGVuIHRhbnRvIGVuIGN1YW50byBsZSBzZWEgcG9zaWJsZSBzYWJlciwgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGRlIG5pbmd1bmEgb3RyYSBwZXJzb25hIG8gZW50aWRhZC4KCjQuIFNpIGVsIGRvY3VtZW50byBjb250aWVuZSBtYXRlcmlhbGVzIGRlIGxvcyBjdWFsZXMgbm8gdGllbmUgbG9zIGRlcmVjaG9zIGRlIGF1dG9yLCBkZWNsYXJhIHF1ZSBoYSBvYnRlbmlkbyBlbCBwZXJtaXNvIHNpbiByZXN0cmljY2nDs24gZGVsIHByb3BpZXRhcmlvIGRlIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBwYXJhIG90b3JnYXIgYSBsYSBVbml2ZXJzaWRhZCBFbCBCb3NxdWUgbG9zIGRlcmVjaG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW5jaWEsIHkgcXVlIGVzZSBtYXRlcmlhbCBjdXlvcyBkZXJlY2hvcyBzb24gZGUgdGVyY2Vyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8geSByZWNvbm9jaWRvIGVuIGVsIHRleHRvIG8gY29udGVuaWRvIGRlbCBkb2N1bWVudG8gZW50cmVnYWRvLgoKNS4gU2kgZWwgZG9jdW1lbnRvIHNlIGJhc2EgZW4gdW5hIG9icmEgcXVlIGhhIHNpZG8gcGF0cm9jaW5hZGEgbyBhcG95YWRhIHBvciB1bmEgYWdlbmNpYSB1IG9yZ2FuaXphY2nDs24gZGlmZXJlbnRlIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSwgc2UgcHJlc3Vwb25lIHF1ZSBzZSBoYSBjdW1wbGlkbyBjb24gY3VhbHF1aWVyIGRlcmVjaG8gZGUgcmV2aXNpw7NuIHUgb3RyYXMgb2JsaWdhY2lvbmVzIHJlcXVlcmlkYXMgcG9yIGVzdGUgY29udHJhdG8gbyBhY3VlcmRvLgoKNi4gVW5pdmVyc2lkYWQgRWwgQm9zcXVlIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBzdS9zIG5vbWJyZS9zIGNvbW8gZWwvbG9zIGF1dG9yL2VzIG8gcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGVsIGRvY3VtZW50bywgeSBubyBoYXLDoSBuaW5ndW5hIGFsdGVyYWNpw7NuIGRlIHN1IGRvY3VtZW50byBkaWZlcmVudGUgYSBsYXMgcGVybWl0aWRhcyBlbiBlc3RhIGxpY2VuY2lhLgo=