Algoritmo k-NN para la imputación de valores faltantes tipo MCAR con distintos valores de k vecinos cercanos
El análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden lleg...
- Autores:
-
Canchila Rodríguez, Bryan Alejandro
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Universidad El Bosque
- Repositorio:
- Repositorio U. El Bosque
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unbosque.edu.co:20.500.12495/10820
- Acceso en línea:
- http://hdl.handle.net/20.500.12495/10820
- Palabra clave:
- Imputación k-NN
519.5
Imputation k-NN
- Rights
- closedAccess
- License
- Acceso cerrado
Summary: | El análisis de datos es uno de los temas más importantes hoy en día y para las empresas se ha convertido en un proceso crucial en la toma de decisiones o estrategias de negocios. Uno de los problemas mas habituales en el análisis de datos es la presencia de valores faltantes ya que estos pueden llegar afectar los análisis e interpretaciones del conjunto de datos y los métodos de imputación permiten solucionar estos problemas. El método k-NN es un método de imputación muy conocido por su simplicidad, pero presenta un gran desafío al momento de elegir un valor de k adecuado. Esta investigación propone un algoritmo k-NN de imputación que permite calcular un valor de k diferente para cada valor faltante partiendo del hecho de que es razonable pensar que cada valor faltante puede tener un numero distintos de vecinos cercanos. El algoritmo es comparado con los métodos tradicionales del k-NN para imputación en valores faltantes tipo MCAR obteniendo mejores resultados en el algoritmo propuesto. |
---|