Aplicación de ciencia de datos para determinar la eficiencia de los métodos de muestreo para el orden hemíptera (insecta) por medio de la metodología CRISP-DM

La ciencia de datos es un campo interdisciplinario que emplea métodos estadísticos, algoritmos y tecnologías para transformar grandes volúmenes de datos en información valiosa y accionable, mejorando la toma de decisiones y creando nuevas oportunidades en prácticamente todas las áreas y disciplinas,...

Full description

Autores:
Grady, Aaron Ryan
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Corporación Universitaria Remington
Repositorio:
Repositorio institucional Uniremington
Idioma:
spa
OAI Identifier:
oai:repositorio.uniremington.edu.co:123456789/3659
Acceso en línea:
https://repositorio.uniremington.edu.co/handle/123456789/3659
Palabra clave:
Ciencia de datos
Big data
Metodología CRISP-DM
Recolección de hemípteros
Eficiencia de muestreo
Toma de decisiones
Análisis de datos
Algoritmos
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Description
Summary:La ciencia de datos es un campo interdisciplinario que emplea métodos estadísticos, algoritmos y tecnologías para transformar grandes volúmenes de datos en información valiosa y accionable, mejorando la toma de decisiones y creando nuevas oportunidades en prácticamente todas las áreas y disciplinas, convirtiéndose así en una herramienta fundamental y poderosa dentro de cualquier organización. Los proyectos basados en la ciencia de datos pueden beneficiarse a partir de las metodologías de procesos empleadas, ya que éstas determinan el éxito de la investigación. Modelos de procesos como CRISP-DM pueden ser útiles y mejorados con enfoques ágiles, por lo cual es una metodología popular en la práctica debido a que es fácil de comprender, estructurada, confiable, de uso común e independiente de la industria. Teniendo en cuenta lo anterior, se propuso implementar el método CRISP-DM para analizar una base de datos de libre acceso, con el propósito de extraer información relevante a partir de un set de datos grande y complejo y contestar a una pregunta de investigación relacionada con dicho set. El presente trabajo se realizó a partir de la revisión de una base de datos del SIB Colombia y del GBIF, sobre la diversidad del orden Hemíptera (insectos) presentes en la Ecoreserva ASA La Guarupaya de Acacías, Meta. El análisis de los datos se enfocó en determinar cuál de los métodos de muestreo empleados en el estudio fue el más eficiente para la recolección, con respecto a las cantidades encontradas para cada hemíptero y el tiempo empleado por cada método. Se encontró que la eficiencia de la red de golpeteo fue mucho mejor que la de la trampa Malaise, con unos valores de 213.85 hemípteros por hora y de 0.52 hemípteros por hora respectivamente.