Extensión del algoritmo ClustImpute para variables cualitativas y mixtas: una aplicación al capítulo de cultivos de Bogotá D.C del III Censo Nacional Agropecuario

En el actual contexto colombiano, caracterizado por cambios demográficos, económicos y ambientales, así como la importancia del sector agropecuario en la economía, la realización del III Censo Nacional Agropecuario en 2014 se presenta como una herramienta fundamental para comprender las complejas va...

Full description

Autores:
Rojas Pulido, William Camilo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/53694
Acceso en línea:
http://hdl.handle.net/11634/53694
Palabra clave:
k-prototypes
k-means
Clustimpute
Agriculture
Variables
Mixed
Mixed
missing values
Imputation
Algorithm
Clustering
Qualitative
Estadística
Datos Estadísticos
Investigación
Algoritmo
Agrupamiento
Imputacion
Valores Faltantes
Cualitativas
Mixtas
Variables
Agropecuario
Clustimpute
k-means
k-prototipos
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Description
Summary:En el actual contexto colombiano, caracterizado por cambios demográficos, económicos y ambientales, así como la importancia del sector agropecuario en la economía, la realización del III Censo Nacional Agropecuario en 2014 se presenta como una herramienta fundamental para comprender las complejas variables que impactan este sector. Con una cobertura operativa del 98.9%, este censo proporcionó información detallada y actualizada sobre el sector agropecuario en todo el país, incluyendo municipios, territorios indígenas, tierras de comunidades negras y parques nacionales. Sin embargo, el análisis de datos presenta desafíos, como el 4% de registros con datos faltantes, los cuales se abordan mediante enfoques estadísticos como la imputación de valores faltantes. En este contexto, el trabajo se enfoca en el capítulo de Cultivos en Bogotá, proponiendo la aplicación de una extensión del algoritmo ClustImpute. Este algoritmo, combinando técnicas de imputación con el método de k-medias, busca abordar tanto variables cuantitativas como cualitativas presentes en el censo, ofreciendo una alternativa innovadora a los métodos convencionales de imputación. El objetivo final es proporcionar un análisis de datos más completo y fiable para contribuir a la comprensión y mejora de las políticas y esfuerzos destinados al desarrollo rural y la calidad de vida en áreas rurales en Bogotá y, por extensión, en el conjunto del país.