Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
El análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden lleg...
- Autores:
-
Canchila Rodríguez, Bryan Alejandro
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Universidad El Bosque
- Repositorio:
- Repositorio U. El Bosque
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unbosque.edu.co:20.500.12495/10820
- Acceso en línea:
- http://hdl.handle.net/20.500.12495/10820
- Palabra clave:
- Imputación k-NN
519.5
Imputation k-NN
- Rights
- closedAccess
- License
- Acceso cerrado
id |
UNBOSQUE2_8696c5190d527f1d3d86022c5f97cc39 |
---|---|
oai_identifier_str |
oai:repositorio.unbosque.edu.co:20.500.12495/10820 |
network_acronym_str |
UNBOSQUE2 |
network_name_str |
Repositorio U. El Bosque |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos |
dc.title.translated.spa.fl_str_mv |
KNN algorithm for the imputation of missing values type MCAR with different values of k near neighbors |
title |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos |
spellingShingle |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos Imputación k-NN 519.5 Imputation k-NN |
title_short |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos |
title_full |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos |
title_fullStr |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos |
title_full_unstemmed |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos |
title_sort |
Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos |
dc.creator.fl_str_mv |
Canchila Rodríguez, Bryan Alejandro |
dc.contributor.advisor.none.fl_str_mv |
Rodriguez Arango, Emiliano |
dc.contributor.author.none.fl_str_mv |
Canchila Rodríguez, Bryan Alejandro |
dc.contributor.orcid.none.fl_str_mv |
Canchila Rodríguez, Bryan Alejandro [0000-0002-5553-5761] |
dc.subject.spa.fl_str_mv |
Imputación k-NN |
topic |
Imputación k-NN 519.5 Imputation k-NN |
dc.subject.ddc.none.fl_str_mv |
519.5 |
dc.subject.keywords.spa.fl_str_mv |
Imputation k-NN |
description |
El análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden llegar afectar los análisis e interpretaciones del conjunto de datos y los métodos de imputación permiten solucionar estos problemas. El método k-NN es un método de imputación muy conocido por su simplicidad, pero presenta un gran desafío al momento de elegir un valor de k adecuado. Esta investigación propone un algoritmo k-NN de imputación que permite calcular un valor de k diferente para cada valor faltante partiendo del hecho de que es razonable pensar que cada valor faltante puede tener un numero distintos de vecinos cercanos. El algoritmo es comparado con los métodos tradicionales del k-NN para imputación en valores faltantes tipo MCAR obteniendo mejores resultados en el algoritmo propuesto. |
publishDate |
2023 |
dc.date.accessioned.none.fl_str_mv |
2023-06-13T15:23:32Z |
dc.date.available.none.fl_str_mv |
2023-06-13T15:23:32Z |
dc.date.issued.none.fl_str_mv |
2023 |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.hasversion.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12495/10820 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad El Bosque |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Universidad El Bosque |
dc.identifier.repourl.none.fl_str_mv |
repourl:https://repositorio.unbosque.edu.co |
url |
http://hdl.handle.net/20.500.12495/10820 |
identifier_str_mv |
instname:Universidad El Bosque reponame:Repositorio Institucional Universidad El Bosque repourl:https://repositorio.unbosque.edu.co |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.local.spa.fl_str_mv |
Acceso cerrado |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/closedAccess http://purl.org/coar/access_right/c_14cb |
rights_invalid_str_mv |
Acceso cerrado http://purl.org/coar/access_right/c_14cb |
eu_rights_str_mv |
closedAccess |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.program.spa.fl_str_mv |
Estadística |
dc.publisher.grantor.spa.fl_str_mv |
Universidad El Bosque |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ciencias |
institution |
Universidad El Bosque |
bitstream.url.fl_str_mv |
https://repositorio.unbosque.edu.co/bitstreams/b3981a39-709a-4146-a3c2-d41d4eb066c1/download https://repositorio.unbosque.edu.co/bitstreams/62a30d52-3639-456f-b51c-4a255301fba0/download https://repositorio.unbosque.edu.co/bitstreams/62f49ce8-9dc1-4cea-8ddd-0ae815f0ead2/download https://repositorio.unbosque.edu.co/bitstreams/fb83c419-8a1b-4099-8583-6d3b11e8c213/download https://repositorio.unbosque.edu.co/bitstreams/b6fbb85f-fa56-4cd7-a346-0896441f9346/download https://repositorio.unbosque.edu.co/bitstreams/3d001d77-c256-48e5-8b2f-aa18f772d3b7/download |
bitstream.checksum.fl_str_mv |
51d1068d29e207ead54acde44682edfd e5a21ff9676f82c4105b6f8108db4ff9 8d4dbe680fce108d90a5dba016889aac 17cc15b951e7cc6b3728a574117320f9 71c909689268bf0106f0801048a213d5 ad76a54c76009d30722d5df23726d630 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad El Bosque |
repository.mail.fl_str_mv |
bibliotecas@biteca.com |
_version_ |
1814100830764138496 |
spelling |
Rodriguez Arango, EmilianoCanchila Rodríguez, Bryan AlejandroCanchila Rodríguez, Bryan Alejandro [0000-0002-5553-5761]2023-06-13T15:23:32Z2023-06-13T15:23:32Z2023http://hdl.handle.net/20.500.12495/10820instname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coEl análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden llegar afectar los análisis e interpretaciones del conjunto de datos y los métodos de imputación permiten solucionar estos problemas. El método k-NN es un método de imputación muy conocido por su simplicidad, pero presenta un gran desafío al momento de elegir un valor de k adecuado. Esta investigación propone un algoritmo k-NN de imputación que permite calcular un valor de k diferente para cada valor faltante partiendo del hecho de que es razonable pensar que cada valor faltante puede tener un numero distintos de vecinos cercanos. El algoritmo es comparado con los métodos tradicionales del k-NN para imputación en valores faltantes tipo MCAR obteniendo mejores resultados en el algoritmo propuesto.EstadísticoPregradoData analysis is one of the most important topics nowadays and for companies it has become a crucial process in decision making or business strategies. One of the most common problems in data analysis is the presence of missing values that can affect the analysis and interpretation of the data set and imputation methods can solve these problems. The k-NN method is a well-known imputation method because of its simplicity, but it presents a great challenge when choosing a suitable k value. This research proposes a k-NN imputation algorithm that allows to compute a different value of k for each missing value based on the fact that it is reasonable to think that each missing value can have a different number of nearest neighbors. The algorithm is compared with the traditional k-NN methods for MCAR type missing value imputation obtaining better results in the proposed algorithm.application/pdfspaImputación k-NN519.5Imputation k-NNAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosKNN algorithm for the imputation of missing values type MCAR with different values of k near neighborsEstadísticaUniversidad El BosqueFacultad de CienciasTesis/Trabajo de grado - Monografía - Pregradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisAcceso cerradoinfo:eu-repo/semantics/closedAccesshttp://purl.org/coar/access_right/c_14cbTHUMBNAILAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.pngAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.pngPortadaimage/png60573https://repositorio.unbosque.edu.co/bitstreams/b3981a39-709a-4146-a3c2-d41d4eb066c1/download51d1068d29e207ead54acde44682edfdMD54Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.jpgAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.jpgGenerated Thumbnailimage/jpeg3146https://repositorio.unbosque.edu.co/bitstreams/62a30d52-3639-456f-b51c-4a255301fba0/downloade5a21ff9676f82c4105b6f8108db4ff9MD57ORIGINALAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanosapplication/pdf223218https://repositorio.unbosque.edu.co/bitstreams/62f49ce8-9dc1-4cea-8ddd-0ae815f0ead2/download8d4dbe680fce108d90a5dba016889aacMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82000https://repositorio.unbosque.edu.co/bitstreams/fb83c419-8a1b-4099-8583-6d3b11e8c213/download17cc15b951e7cc6b3728a574117320f9MD53Carta.pdfCarta.pdfCarta autorizaciónapplication/pdf1551498https://repositorio.unbosque.edu.co/bitstreams/b6fbb85f-fa56-4cd7-a346-0896441f9346/download71c909689268bf0106f0801048a213d5MD55TEXTAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.txtAlgoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos.txtExtracted texttext/plain45687https://repositorio.unbosque.edu.co/bitstreams/3d001d77-c256-48e5-8b2f-aa18f772d3b7/downloadad76a54c76009d30722d5df23726d630MD5620.500.12495/10820oai:repositorio.unbosque.edu.co:20.500.12495/108202024-02-07 11:16:03.958restrictedhttps://repositorio.unbosque.edu.coRepositorio Institucional Universidad El Bosquebibliotecas@biteca.comTGljZW5jaWEgZGUgRGlzdHJpYnVjacOzbiBObyBFeGNsdXNpdmEKClBhcmEgcXVlIGVsIFJlcG9zaXRvcmlvIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBhIHB1ZWRhIHJlcHJvZHVjaXIgeSBjb211bmljYXIgcMO6YmxpY2FtZW50ZSBzdSBkb2N1bWVudG8gZXMgbmVjZXNhcmlvIGxhIGFjZXB0YWNpw7NuIGRlIGxvcyBzaWd1aWVudGVzIHTDqXJtaW5vcy4gUG9yIGZhdm9yLCBsZWEgbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXMgZGUgbGljZW5jaWE6CgoxLiBBY2VwdGFuZG8gZXN0YSBsaWNlbmNpYSwgdXN0ZWQgKGVsIGF1dG9yL2VzIG8gZWwgcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGUgYXV0b3IpIGdhcmFudGl6YSBhIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSBlbCBkZXJlY2hvIG5vIGV4Y2x1c2l2byBkZSBhcmNoaXZhciwgcmVwcm9kdWNpciwgY29udmVydGlyIChjb21vIHNlIGRlZmluZSBtw6FzIGFiYWpvKSwgY29tdW5pY2FyIHkvbyBkaXN0cmlidWlyIHN1IGRvY3VtZW50byBtdW5kaWFsbWVudGUgZW4gZm9ybWF0byBlbGVjdHLDs25pY28uCgoyLiBUYW1iacOpbiBlc3TDoSBkZSBhY3VlcmRvIGNvbiBxdWUgbGEgVW5pdmVyc2lkYWQgRWwgQm9zcXVlIHB1ZWRhIGNvbnNlcnZhciBtw6FzIGRlIHVuYSBjb3BpYSBkZSBlc3RlIGRvY3VtZW50byB5LCBzaW4gYWx0ZXJhciBzdSBjb250ZW5pZG8sIGNvbnZlcnRpcmxvIGEgY3VhbHF1aWVyIGZvcm1hdG8gZGUgZmljaGVybywgbWVkaW8gbyBzb3BvcnRlLCBwYXJhIHByb3DDs3NpdG9zIGRlIHNlZ3VyaWRhZCwgcHJlc2VydmFjacOzbiB5IGFjY2Vzby4KCjMuIERlY2xhcmEgcXVlIGVsIGRvY3VtZW50byBlcyB1biB0cmFiYWpvIG9yaWdpbmFsIHN1eW8geS9vIHF1ZSB0aWVuZSBlbCBkZXJlY2hvIHBhcmEgb3RvcmdhciBsb3MgZGVyZWNob3MgY29udGVuaWRvcyBlbiBlc3RhIGxpY2VuY2lhLiBUYW1iacOpbiBkZWNsYXJhIHF1ZSBzdSBkb2N1bWVudG8gbm8gaW5mcmluZ2UsIGVuIHRhbnRvIGVuIGN1YW50byBsZSBzZWEgcG9zaWJsZSBzYWJlciwgbG9zIGRlcmVjaG9zIGRlIGF1dG9yIGRlIG5pbmd1bmEgb3RyYSBwZXJzb25hIG8gZW50aWRhZC4KCjQuIFNpIGVsIGRvY3VtZW50byBjb250aWVuZSBtYXRlcmlhbGVzIGRlIGxvcyBjdWFsZXMgbm8gdGllbmUgbG9zIGRlcmVjaG9zIGRlIGF1dG9yLCBkZWNsYXJhIHF1ZSBoYSBvYnRlbmlkbyBlbCBwZXJtaXNvIHNpbiByZXN0cmljY2nDs24gZGVsIHByb3BpZXRhcmlvIGRlIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBwYXJhIG90b3JnYXIgYSBsYSBVbml2ZXJzaWRhZCBFbCBCb3NxdWUgbG9zIGRlcmVjaG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW5jaWEsIHkgcXVlIGVzZSBtYXRlcmlhbCBjdXlvcyBkZXJlY2hvcyBzb24gZGUgdGVyY2Vyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8geSByZWNvbm9jaWRvIGVuIGVsIHRleHRvIG8gY29udGVuaWRvIGRlbCBkb2N1bWVudG8gZW50cmVnYWRvLgoKNS4gU2kgZWwgZG9jdW1lbnRvIHNlIGJhc2EgZW4gdW5hIG9icmEgcXVlIGhhIHNpZG8gcGF0cm9jaW5hZGEgbyBhcG95YWRhIHBvciB1bmEgYWdlbmNpYSB1IG9yZ2FuaXphY2nDs24gZGlmZXJlbnRlIGRlIGxhIFVuaXZlcnNpZGFkIEVsIEJvc3F1ZSwgc2UgcHJlc3Vwb25lIHF1ZSBzZSBoYSBjdW1wbGlkbyBjb24gY3VhbHF1aWVyIGRlcmVjaG8gZGUgcmV2aXNpw7NuIHUgb3RyYXMgb2JsaWdhY2lvbmVzIHJlcXVlcmlkYXMgcG9yIGVzdGUgY29udHJhdG8gbyBhY3VlcmRvLgoKNi4gVW5pdmVyc2lkYWQgRWwgQm9zcXVlIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBzdS9zIG5vbWJyZS9zIGNvbW8gZWwvbG9zIGF1dG9yL2VzIG8gcHJvcGlldGFyaW8vcyBkZSBsb3MgZGVyZWNob3MgZGVsIGRvY3VtZW50bywgeSBubyBoYXLDoSBuaW5ndW5hIGFsdGVyYWNpw7NuIGRlIHN1IGRvY3VtZW50byBkaWZlcmVudGUgYSBsYXMgcGVybWl0aWRhcyBlbiBlc3RhIGxpY2VuY2lhLgo= |