Apoyo en el proceso de limpieza retrospectiva de datos publicados a través del SiB Colombia para mejorar su visibilidad, consulta y uso

El Sistema Nacional Ambiental (SINA) se estableció a partir de la Ley 99 de 1993, durante su proceso de creación se dio origen al Sistema de Información sobre Biodiversidad de Colombia (SiB Colombia) a partir del Decreto 1603 de 1994. El SiB Colombia brinda acceso abierto a datos e información sobre...

Full description

Autores:
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/30298
Acceso en línea:
http://hdl.handle.net/11349/30298
Palabra clave:
SiB Colombia
Calidad de datos
Conjuntos de datos
Metadatos
Institutos SINA
Licenciatura en Biología - Tesis y disertaciones académicas
Sistemas de información - Recursos naturales - Colombia
Gestión de información - Recursos naturales - Colombia
Conservación de la diversidad biológica - Sistemas de información - Colombia
Recursos biológicos - Sistemas de información - Colombia
Metadatos - Automatización - Colombia
SiB Colombia
Metadata
Data quality
Data sets
SINA Institutes
Rights
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Description
Summary:El Sistema Nacional Ambiental (SINA) se estableció a partir de la Ley 99 de 1993, durante su proceso de creación se dio origen al Sistema de Información sobre Biodiversidad de Colombia (SiB Colombia) a partir del Decreto 1603 de 1994. El SiB Colombia brinda acceso abierto a datos e información sobre la diversidad biológica del territorio nacional con el apoyo de múltiples organizaciones de la academia, el sector privado, ONG 's, los propios institutos SINA, entre otros. A través del uso de estándares internacionales para la publicación de datos, como el Darwin Core (DwC) es posible compartir distintos tipos de datos a través del SiB Colombia como registros biológicos, listas de especies y eventos de muestreo. El estándar DwC se encuentra fuertemente consolidado a nivel global y está soportado por la comunidad de TDWG (Taxonomic Databases Working Group) quienes están en constante trabajo de revisión y actualización de este. La publicación de datos primarios a través del SiB Colombia facilita la consolidación de información confiable y oportuna que apoya la toma de decisiones a nivel nacional e internacional sobre el manejo de recursos biológicos, investigación y educación. Sin embargo, para que el uso de los datos sea relevante es necesario mejorar la calidad de estos por medio de distintos procesos de validación y limpieza sobre las tres dimensiones de los datos sobre biodiversidad: taxonomía, geografía y temporalidad. Teniendo en cuenta lo anterior, en la presente pasantía se realizó un proceso de limpieza retrospectiva de datos publicados en el IPT (Integrated Publishing Toolkit) del SiB Colombia, priorizando los conjuntos de datos publicados por el Instituto de Investigación de Recursos Biológicos Alexander von Humboldt (IAvH), con el fin de mejorar su calidad a partir de unos elementos priorizados del estándar DwC y la correcta documentación de los metadatos de forma que se garantice su correcta visibilidad, consulta y uso, posteriormente se realizó una revisión geográfica a los conjuntos de datos publicados en los IPT de los institutos de investigación SINA (IAvH, IIAP, Invemar, Sinchi y PNN) para verificar la coherencia de la ubicación de las coordenadas reportadas con respecto a la geografía superior de los datos, con esta revisión se generó un reporte de calidad y geográfico para cada instituto y finalmente se desarrolló un script en python para la generación de diagnósticos de calidad que pueda ser replicable para futuros procesos.