Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas

Un data lake es un repositorio de almacenamiento que contiene una gran cantidad de datos en bruto, donde todavía no tienen una finalidad definida, a diferencia de un data warehouse que es un depósito de datos donde sus datos ya se encuentran estructurados, filtrados y procesados para un propósito co...

Full description

Autores:
Castro, G.
Verdooren, J.
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad Simón Bolívar
Repositorio:
Repositorio Digital USB
Idioma:
spa
OAI Identifier:
oai:bonga.unisimon.edu.co:20.500.12442/10263
Acceso en línea:
https://hdl.handle.net/20.500.12442/10263
Palabra clave:
Data Lake
Data Warehouse
Big Data
Plataformas en la nube
Herramientas para Data Lake
Data Lake
Data Warehouse
Big Data
Cloud platforms
Tools for Data Lake
Rights
restrictedAccess
License
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Description
Summary:Un data lake es un repositorio de almacenamiento que contiene una gran cantidad de datos en bruto, donde todavía no tienen una finalidad definida, a diferencia de un data warehouse que es un depósito de datos donde sus datos ya se encuentran estructurados, filtrados y procesados para un propósito concreto. El objetivo de este trabajo de investigación es proponer una guía de herramientas tecnológicas adecuadas para la implementación de un data lake, dirigido a las empresas con la finalidad de que aprovechen las ventajas que ofrecen los distintos proveedores como IBM, AWS, Microsoft Azure, Google Cloud en las distintas fases de implementación de un data lake y puedan solventar los problemas de acceso a información pertinente para poder mantenerse relevante en el mercado a través de la explotación de sus datos.