Comparación de herramientas ETL de código abierto
El objetivo principal del presente trabajo final es la comparación de Pentaho Data Integration, Talend Data Integration y OpenRefine, tres herramientas de ETL (Extraction, Transformation and Load) de código abierto, con el propósito de promover la importancia que tiene en la actualidad el proceso ET...
- Autores:
-
Ruíz Borja, Jhoan Esteban
- Tipo de recurso:
- Fecha de publicación:
- 2019
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/69685
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/69685
http://bdigital.unal.edu.co/71803/
- Palabra clave:
- 0 Generalidades / Computer science, information and general works
Pentaho Data Integration (PDI)
Talend Data Integration (TDI)
OpenRefine (OR)
Código abierto
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_59a70669de6123d69543324e71f00345 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/69685 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Comparación de herramientas ETL de código abierto |
title |
Comparación de herramientas ETL de código abierto |
spellingShingle |
Comparación de herramientas ETL de código abierto 0 Generalidades / Computer science, information and general works Pentaho Data Integration (PDI) Talend Data Integration (TDI) OpenRefine (OR) Código abierto |
title_short |
Comparación de herramientas ETL de código abierto |
title_full |
Comparación de herramientas ETL de código abierto |
title_fullStr |
Comparación de herramientas ETL de código abierto |
title_full_unstemmed |
Comparación de herramientas ETL de código abierto |
title_sort |
Comparación de herramientas ETL de código abierto |
dc.creator.fl_str_mv |
Ruíz Borja, Jhoan Esteban |
dc.contributor.advisor.spa.fl_str_mv |
Velázquez Henao, Juan David (Thesis advisor) |
dc.contributor.author.spa.fl_str_mv |
Ruíz Borja, Jhoan Esteban |
dc.contributor.spa.fl_str_mv |
Jiménez Ramírez, Claudia |
dc.subject.ddc.spa.fl_str_mv |
0 Generalidades / Computer science, information and general works |
topic |
0 Generalidades / Computer science, information and general works Pentaho Data Integration (PDI) Talend Data Integration (TDI) OpenRefine (OR) Código abierto |
dc.subject.proposal.spa.fl_str_mv |
Pentaho Data Integration (PDI) Talend Data Integration (TDI) OpenRefine (OR) Código abierto |
description |
El objetivo principal del presente trabajo final es la comparación de Pentaho Data Integration, Talend Data Integration y OpenRefine, tres herramientas de ETL (Extraction, Transformation and Load) de código abierto, con el propósito de promover la importancia que tiene en la actualidad el proceso ETL, y de facilitar no solo a los usuarios, sino también a empresas, que deseen aplicar algún proceso ya sea de extracción, transformación o carga de datos, mejorando el enfoque de inteligencia del negocio con estas herramientas adecuadas para el tratamiento de datos. Se propuso describir varias herramientas de la actualidad, donde luego se describen los motivos de selección de las tres herramientas, prosiguiendo a la descripción detallada de las elegidas, para saber que capacidades poseen a la hora de realizar el proceso ETL, adicionalmente se dan los criterios de comparación, donde luego se presenta un ejemplo práctico, que permite comparar, para luego sugerir en qué casos puede ser más útil una herramienta con respecto a otra según sus características. Por último, se presentan cuadros comparativos, donde se podrá resaltar las ventajas y desventajas de cada herramienta, junto con unas sugerencias que plantea qué herramienta utilizar para un caso dado, según la necesidad del usuario o empresa. |
publishDate |
2019 |
dc.date.accessioned.spa.fl_str_mv |
2019-07-03T10:33:23Z |
dc.date.available.spa.fl_str_mv |
2019-07-03T10:33:23Z |
dc.date.issued.spa.fl_str_mv |
2019 |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/69685 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/71803/ |
url |
https://repositorio.unal.edu.co/handle/unal/69685 http://bdigital.unal.edu.co/71803/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemas Escuela de Sistemas |
dc.relation.references.spa.fl_str_mv |
Ruíz Borja, Jhoan Esteban (2019) Comparación de herramientas ETL de código abierto. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/69685/1/1128440307.2018.pdf https://repositorio.unal.edu.co/bitstream/unal/69685/2/1128440307.2018.pdf.jpg |
bitstream.checksum.fl_str_mv |
b9f6232ad1ec948dd74d5fd278c76082 ac10dd0fa54b4503304dcab54b38f440 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814090165697642496 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Jiménez Ramírez, ClaudiaVelázquez Henao, Juan David (Thesis advisor)69c9e989-84c2-4332-b407-0c3a3ca6f014-1Ruíz Borja, Jhoan Esteban79639feb-dd2d-42b3-a9e9-88ab838f98833002019-07-03T10:33:23Z2019-07-03T10:33:23Z2019https://repositorio.unal.edu.co/handle/unal/69685http://bdigital.unal.edu.co/71803/El objetivo principal del presente trabajo final es la comparación de Pentaho Data Integration, Talend Data Integration y OpenRefine, tres herramientas de ETL (Extraction, Transformation and Load) de código abierto, con el propósito de promover la importancia que tiene en la actualidad el proceso ETL, y de facilitar no solo a los usuarios, sino también a empresas, que deseen aplicar algún proceso ya sea de extracción, transformación o carga de datos, mejorando el enfoque de inteligencia del negocio con estas herramientas adecuadas para el tratamiento de datos. Se propuso describir varias herramientas de la actualidad, donde luego se describen los motivos de selección de las tres herramientas, prosiguiendo a la descripción detallada de las elegidas, para saber que capacidades poseen a la hora de realizar el proceso ETL, adicionalmente se dan los criterios de comparación, donde luego se presenta un ejemplo práctico, que permite comparar, para luego sugerir en qué casos puede ser más útil una herramienta con respecto a otra según sus características. Por último, se presentan cuadros comparativos, donde se podrá resaltar las ventajas y desventajas de cada herramienta, junto con unas sugerencias que plantea qué herramienta utilizar para un caso dado, según la necesidad del usuario o empresa.Abstract: The main objective of the present final work is the comparison of Pentaho Data Integration, Talend Data Integration and OpenRefine, three open source tools of ETL (Extraction, Transformation and Load), with the purpose of promoting the importance that the ETL process currently has, and to facilitate not only to the users, but also the companies, who wish to apply some process, involving Extraction, Transformation or Loading of data, to improve the Business Intelligence approach with these appropriate tools for data processing. It was proposed to describe several current tools, then we describe the reasons for selecting the tools to be compared, continuing with the detailed description of the three tools chosen, to explore what capabilities they possess when carrying out the ETL process, additionally the comparison criteria are given, and then a practical example is presented, which allows comparing, and then suggesting in which cases a tool can be more useful with respect to another according to its characteristics. Finally, comparative tables are presented, where the advantages and disadvantages of each tool can be highlighted, along with a brief guide that suggests which tool should be used for a specific case, according to the user's or company's needMaestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de SistemasEscuela de SistemasRuíz Borja, Jhoan Esteban (2019) Comparación de herramientas ETL de código abierto. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín.0 Generalidades / Computer science, information and general worksPentaho Data Integration (PDI)Talend Data Integration (TDI)OpenRefine (OR)Código abiertoComparación de herramientas ETL de código abiertoTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1128440307.2018.pdfTesis de Maestría en Ingeniería - Ingeniería de Sistemasapplication/pdf4567206https://repositorio.unal.edu.co/bitstream/unal/69685/1/1128440307.2018.pdfb9f6232ad1ec948dd74d5fd278c76082MD51THUMBNAIL1128440307.2018.pdf.jpg1128440307.2018.pdf.jpgGenerated Thumbnailimage/jpeg4026https://repositorio.unal.edu.co/bitstream/unal/69685/2/1128440307.2018.pdf.jpgac10dd0fa54b4503304dcab54b38f440MD52unal/69685oai:repositorio.unal.edu.co:unal/696852024-06-02 23:12:06.698Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |