OpenRefine - Guía de validación y limpieza de datos sobre biodiversidad

Los datos primarios sobre biodiversidad son la materia prima para la toma de decisiones sobre el manejo de los recursos biológicos. Sin embargo, muchas veces no cuentan con la calidad necesaria para ser utilizados. Para lograr que estos datos sean un insumo confiable de uso en investigación, educaci...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2019
Institución:
Instituto de Investigación de Recursos Biológicos Alexander von Humboldt
Repositorio:
Repositorio Institucional de Documentación Científica
Idioma:
OAI Identifier:
oai:repository.humboldt.org.co:20.500.11761/35350
Acceso en línea:
http://hdl.handle.net/20.500.11761/35350
Palabra clave:
Calidad de datos
GBIF
SiB Colombia
OpenRefine
Rights
License
Attribution 4.0 International
Description
Summary:Los datos primarios sobre biodiversidad son la materia prima para la toma de decisiones sobre el manejo de los recursos biológicos. Sin embargo, muchas veces no cuentan con la calidad necesaria para ser utilizados. Para lograr que estos datos sean un insumo confiable de uso en investigación, educación y toma de decisiones, el SiB Colombia ha generado rutinas de calidad de datos implementando herramientas informáticas libres, gratuitas y fáciles de utilizar. Las rutinas están desarrolladas en el lenguaje de programación GREL (General Refine Expression Language) en el entorno del software de código abierto OpenRefine, y funcionan como módulos independientes que permiten crear flujos de trabajo específicos para cada conjunto de datos (Registros, Listas, Eventos), integrando otras herramientas de la red de GBIF, Canadensys y GeoNames, principalmente a través del uso de los servicios web que disponen.