Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas

Un data lake es un repositorio de almacenamiento que contiene una gran cantidad de datos en bruto, donde todavía no tienen una finalidad definida, a diferencia de un data warehouse que es un depósito de datos donde sus datos ya se encuentran estructurados, filtrados y procesados para un propósito co...

Full description

Autores:
Castro, G.
Verdooren, J.
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad Simón Bolívar
Repositorio:
Repositorio Digital USB
Idioma:
spa
OAI Identifier:
oai:bonga.unisimon.edu.co:20.500.12442/10263
Acceso en línea:
https://hdl.handle.net/20.500.12442/10263
Palabra clave:
Data Lake
Data Warehouse
Big Data
Plataformas en la nube
Herramientas para Data Lake
Data Lake
Data Warehouse
Big Data
Cloud platforms
Tools for Data Lake
Rights
restrictedAccess
License
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
id USIMONBOL2_7da6fc602966cdff556811f84acf4457
oai_identifier_str oai:bonga.unisimon.edu.co:20.500.12442/10263
network_acronym_str USIMONBOL2
network_name_str Repositorio Digital USB
repository_id_str
dc.title.spa.fl_str_mv Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
dc.title.translated.eng.fl_str_mv Proposal of a guide of practical tools for the implementation of a data lake in companies
title Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
spellingShingle Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
Data Lake
Data Warehouse
Big Data
Plataformas en la nube
Herramientas para Data Lake
Data Lake
Data Warehouse
Big Data
Cloud platforms
Tools for Data Lake
title_short Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
title_full Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
title_fullStr Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
title_full_unstemmed Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
title_sort Propuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresas
dc.creator.fl_str_mv Castro, G.
Verdooren, J.
dc.contributor.advisor.none.fl_str_mv Heredia, D.
dc.contributor.author.none.fl_str_mv Castro, G.
Verdooren, J.
dc.subject.spa.fl_str_mv Data Lake
Data Warehouse
Big Data
Plataformas en la nube
Herramientas para Data Lake
topic Data Lake
Data Warehouse
Big Data
Plataformas en la nube
Herramientas para Data Lake
Data Lake
Data Warehouse
Big Data
Cloud platforms
Tools for Data Lake
dc.subject.eng.fl_str_mv Data Lake
Data Warehouse
Big Data
Cloud platforms
Tools for Data Lake
description Un data lake es un repositorio de almacenamiento que contiene una gran cantidad de datos en bruto, donde todavía no tienen una finalidad definida, a diferencia de un data warehouse que es un depósito de datos donde sus datos ya se encuentran estructurados, filtrados y procesados para un propósito concreto. El objetivo de este trabajo de investigación es proponer una guía de herramientas tecnológicas adecuadas para la implementación de un data lake, dirigido a las empresas con la finalidad de que aprovechen las ventajas que ofrecen los distintos proveedores como IBM, AWS, Microsoft Azure, Google Cloud en las distintas fases de implementación de un data lake y puedan solventar los problemas de acceso a información pertinente para poder mantenerse relevante en el mercado a través de la explotación de sus datos.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-07-15T15:59:46Z
dc.date.available.none.fl_str_mv 2022-07-15T15:59:46Z
dc.date.issued.none.fl_str_mv 2022
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.eng.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.spa.spa.fl_str_mv Trabajo de grado - pregrado
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12442/10263
url https://hdl.handle.net/20.500.12442/10263
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 Internacional
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_16ec
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/restrictedAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_16ec
eu_rights_str_mv restrictedAccess
dc.format.mimetype.spa.fl_str_mv pdf
dc.publisher.spa.fl_str_mv Ediciones Universidad Simón Bolívar
Facultad de Ingenierías
institution Universidad Simón Bolívar
bitstream.url.fl_str_mv https://bonga.unisimon.edu.co/bitstreams/39a5fc85-aad7-40f0-9db1-e48195d87c29/download
https://bonga.unisimon.edu.co/bitstreams/f236238f-580a-4a55-aa2e-ae4e4e6c3ef4/download
https://bonga.unisimon.edu.co/bitstreams/9b5f2a32-3064-4d36-b013-df8ded3dfc58/download
https://bonga.unisimon.edu.co/bitstreams/e0e50fa5-92ee-4f49-a3c9-f23a41242915/download
https://bonga.unisimon.edu.co/bitstreams/6306e24a-3291-4e32-920b-81be007e3cfb/download
https://bonga.unisimon.edu.co/bitstreams/cc2f4c1a-29cc-4789-a83c-13f899967ed6/download
https://bonga.unisimon.edu.co/bitstreams/b39f6593-7df1-4c05-b2d3-8859beef99bd/download
https://bonga.unisimon.edu.co/bitstreams/00ac62ec-48ad-450a-90cf-242501f794de/download
https://bonga.unisimon.edu.co/bitstreams/33df56b9-0ef9-469d-bd1f-d20a2420a76a/download
bitstream.checksum.fl_str_mv 4460e5956bc1d1639be9ae6146a50347
2a1661e5960a7bab4fd8dda692fb677c
8c15d872ea70960bb0ed260ddb147545
69698a61d42fe412c4c2f81efdfe2a24
69698a61d42fe412c4c2f81efdfe2a24
69698a61d42fe412c4c2f81efdfe2a24
b892ad17f3ac1d2db3a3008a661609e7
b892ad17f3ac1d2db3a3008a661609e7
b892ad17f3ac1d2db3a3008a661609e7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital Universidad Simón Bolívar
repository.mail.fl_str_mv repositorio.digital@unisimon.edu.co
_version_ 1814076111372419072
spelling Heredia, D.Castro, G.2bd62037-8d82-4eac-9236-4365fd6ef8c8Verdooren, J.6070a165-0797-4685-a6cd-aa781ade67a02022-07-15T15:59:46Z2022-07-15T15:59:46Z2022https://hdl.handle.net/20.500.12442/10263Un data lake es un repositorio de almacenamiento que contiene una gran cantidad de datos en bruto, donde todavía no tienen una finalidad definida, a diferencia de un data warehouse que es un depósito de datos donde sus datos ya se encuentran estructurados, filtrados y procesados para un propósito concreto. El objetivo de este trabajo de investigación es proponer una guía de herramientas tecnológicas adecuadas para la implementación de un data lake, dirigido a las empresas con la finalidad de que aprovechen las ventajas que ofrecen los distintos proveedores como IBM, AWS, Microsoft Azure, Google Cloud en las distintas fases de implementación de un data lake y puedan solventar los problemas de acceso a información pertinente para poder mantenerse relevante en el mercado a través de la explotación de sus datos.A data lake is a storage repository that contains a large amount of raw data, where it does not yet have a defined purpose, unlike a data warehouse, which is a data warehouse where its data is already structured, filtered, and processed for a concrete purpose. The objective of this research work is to propose a guide of appropriate technological tools for the implementation of a data lake, aimed at companies in order to take advantage of the advantages offered by different providers such as IBM, AWS, Microsoft Azure, Google Cloud in the different phases of implementation of a data lake and can solve the problems of access to relevant information in order to stay relevant in the market through the exploitation of their data.pdfspaEdiciones Universidad Simón BolívarFacultad de IngenieríasAttribution-NonCommercial-NoDerivatives 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/restrictedAccesshttp://purl.org/coar/access_right/c_16ecData LakeData WarehouseBig DataPlataformas en la nubeHerramientas para Data LakeData LakeData WarehouseBig DataCloud platformsTools for Data LakePropuesta de una guía de herramientas prácticas para la implementación de un data lake en las empresasProposal of a guide of practical tools for the implementation of a data lake in companiesinfo:eu-repo/semantics/bachelorThesisTrabajo de grado - pregradohttp://purl.org/coar/resource_type/c_7a1fA. Cravero, I. Lefiguala, R. Tralma y S. Gonzalez, «Data Lake para la Dirección de Análisis Universitaria: Arquitectura y Metadata.,» Revista Ibérica de Sistemas e Tecnologias de Informação, pp. 560-569, 2021.Á. Toledo de Diego, «Cuadro de mando para el análisis de los datos del Covid-19.,» Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S de Ingenieros Informáticos(UPM), Madrid, España., 2021.S. A. Lopez Mora, «Diseño de un Data Lake para empresarios del sector de servicios ecoturísticos.,» 2020. [En línea]. Available: http://hdl.handle.net/11349/25080. [Último acceso: 2022].Microsofters, «Un repositorio de datos sin limites,» Microsofters, 2021. [En línea]. Available: https://microsofters.com/167330/grupo-iberostar-es-el-nuevo-caso-de-exito-de-la-nube-de-microsoft/. [Último acceso: Abril 2022].M. MARTINEZ, «GESTIOPOLIS,» [En línea]. Available: https://www.gestiopolis.com/teoria-de-colas/.H. Rozestraten y F. Dos Santos, «Cómo extraer valor de sus datos con Data Lakes y Analítica en AWS,» AWS Editorial team, 2020.Morris & Opazo, «Morris & Opazo business solutions,» Morris & Opazo y SIM partners, [En línea]. Available: https://www.morrisopazo.com/es/recursos/casos-de-exito/caso-de-exito-big-data-analytics-insights-de-redes-sociales/. [Último acceso: Marzo 2022].Amazon Web Services, «BICE VIDA crea data lake basado en AWS para optimizar eficiencia del negocio,» Amazon Web Services, 2020. [En línea]. Available: https://aws.amazon.com/es/solutions/case-studies/bicevidadatalake/. [Último acceso: Abril 2022].E. León, «Baoss Analytics Everywhere,» 2021. [En línea]. Available: https://www.baoss.es/data-lake-vs-data-warehouse/. [Último acceso: Abril 2022].Google Corporation, «Data Lake de Google Cloud: 4 fases del ciclo de vida de un Data Lake,» Google Cloud, Abril 2021. [En línea]. Available: https://cloud.netapp.com/blog/gcp-cvo-blg-google-cloud-data-lake-4-phases-of-the-data-lake-lifecycle. [Último acceso: Abril 2022].K. Dolores, «Azure Data Lake,» Kaits Consulting, 2020.IBM corporation, «IBM data lake,» [En línea]. Available: https://www.ibm.com/co-es/analytics/data-lake. [Último acceso: Abril 2022].Sede BarranquillaIngeniería de SistemasCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://bonga.unisimon.edu.co/bitstreams/39a5fc85-aad7-40f0-9db1-e48195d87c29/download4460e5956bc1d1639be9ae6146a50347MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-83000https://bonga.unisimon.edu.co/bitstreams/f236238f-580a-4a55-aa2e-ae4e4e6c3ef4/download2a1661e5960a7bab4fd8dda692fb677cMD54ORIGINALPDF.pdfPDF.pdfapplication/pdf428386https://bonga.unisimon.edu.co/bitstreams/9b5f2a32-3064-4d36-b013-df8ded3dfc58/download8c15d872ea70960bb0ed260ddb147545MD51TEXTPropuesta_Guía_Herramientas_Prácticas_Implementación_Data_Lake_Empresas_Artículo.pdf.txtPropuesta_Guía_Herramientas_Prácticas_Implementación_Data_Lake_Empresas_Artículo.pdf.txtExtracted texttext/plain49391https://bonga.unisimon.edu.co/bitstreams/e0e50fa5-92ee-4f49-a3c9-f23a41242915/download69698a61d42fe412c4c2f81efdfe2a24MD55PDF.txtPDF.txtExtracted texttext/plain49391https://bonga.unisimon.edu.co/bitstreams/6306e24a-3291-4e32-920b-81be007e3cfb/download69698a61d42fe412c4c2f81efdfe2a24MD57PDF.pdf.txtPDF.pdf.txtExtracted texttext/plain49391https://bonga.unisimon.edu.co/bitstreams/cc2f4c1a-29cc-4789-a83c-13f899967ed6/download69698a61d42fe412c4c2f81efdfe2a24MD59THUMBNAILPropuesta_Guía_Herramientas_Prácticas_Implementación_Data_Lake_Empresas_Artículo.pdf.jpgPropuesta_Guía_Herramientas_Prácticas_Implementación_Data_Lake_Empresas_Artículo.pdf.jpgGenerated Thumbnailimage/jpeg6395https://bonga.unisimon.edu.co/bitstreams/b39f6593-7df1-4c05-b2d3-8859beef99bd/downloadb892ad17f3ac1d2db3a3008a661609e7MD56PDF.jpgPDF.jpgGenerated Thumbnailimage/jpeg6395https://bonga.unisimon.edu.co/bitstreams/00ac62ec-48ad-450a-90cf-242501f794de/downloadb892ad17f3ac1d2db3a3008a661609e7MD58PDF.pdf.jpgPDF.pdf.jpgGenerated Thumbnailimage/jpeg6395https://bonga.unisimon.edu.co/bitstreams/33df56b9-0ef9-469d-bd1f-d20a2420a76a/downloadb892ad17f3ac1d2db3a3008a661609e7MD51020.500.12442/10263oai:bonga.unisimon.edu.co:20.500.12442/102632024-08-14 21:52:37.234http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internacionalrestrictedhttps://bonga.unisimon.edu.coRepositorio Digital Universidad Simón Bolívarrepositorio.digital@unisimon.edu.co