Estimación de áreas a cultivar en Colombia
RESUMEN : En esta monografía, se centra en el escenario de diferentes cultivos entre el año 2007 y 2018 que está organizado en una base de datos del Ministerio de Agricultura y Desarrollo Rural, el cual son datos abiertos del Gobierno Colombiano. El principal problema que se enfoca en resolver la mo...
- Autores:
-
Gomez Osorno, Jesús David
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2022
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/29068
- Acceso en línea:
- http://hdl.handle.net/10495/29068
- Palabra clave:
- Aprendizaje automático (inteligencia artificial)
Machine learning
Técnicas de predicción
Forecasting
Análisis de datos
Data analysis
Agricultura
Agriculture
Cosecha
Harvesting
http://aims.fao.org/aos/agrovoc/c_3041
http://aims.fao.org/aos/agrovoc/c_15962
http://aims.fao.org/aos/agrovoc/c_203
http://aims.fao.org/aos/agrovoc/c_3500
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Summary: | RESUMEN : En esta monografía, se centra en el escenario de diferentes cultivos entre el año 2007 y 2018 que está organizado en una base de datos del Ministerio de Agricultura y Desarrollo Rural, el cual son datos abiertos del Gobierno Colombiano. El principal problema que se enfoca en resolver la monografía es encontrar un modelo predictivo capaz de estimar la cantidad de área necesaria en un cultivo específico para lograr una cosecha objetivo. Debido a la alta dimensionalidad de los datos, se propone una estrategia para dividir los datos de acuerdo con una recomendación de Asobancaria, el cual menciona: “Respecto al tamaño de la tierra para la Food and Agriculture Organization - FAO (2012), la clasificación varía a lo largo de zonas geográficas y de producción - los pequeños productores son aquellos con -- menos de 1 hectárea productiva, los medianos rondan de 1 a 10 hectáreas y los grandes poseen más de 10 hectáreas”. Por consiguiente, al considerar que las hectáreas en la base de datos se manejan como un dato entero, no es posible trabajar con los pequeños agricultores. Lo anterior permitió generar dos bases de datos nuevos que representan los medianos (1/4 de los datos originales) y grandes productores (3/4 de los datos originales). A partir de la división de los datos, se realizó una exploración de datos para generar la mejor representación de las bases de datos antes de crear los modelos de regresión. Aplicando la estrategia de división de datos, se generaron mejores resultados, para la base de datos de medianos agricultores se logró un MAE de 0.001335 con un modelo de regresión de Huber, y para los grandes agricultores se logró un MAE de 0.001003 con el modelo de regresión de bosques aleatorios o random forest. |
---|