Comparación de herramientas ETL de código abierto

El objetivo principal del presente trabajo final es la comparación de Pentaho Data Integration, Talend Data Integration y OpenRefine, tres herramientas de ETL (Extraction, Transformation and Load) de código abierto, con el propósito de promover la importancia que tiene en la actualidad el proceso ET...

Full description

Autores:
Ruíz Borja, Jhoan Esteban
Tipo de recurso:
Fecha de publicación:
2019
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/69685
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/69685
http://bdigital.unal.edu.co/71803/
Palabra clave:
0 Generalidades / Computer science, information and general works
Pentaho Data Integration (PDI)
Talend Data Integration (TDI)
OpenRefine (OR)
Código abierto
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:El objetivo principal del presente trabajo final es la comparación de Pentaho Data Integration, Talend Data Integration y OpenRefine, tres herramientas de ETL (Extraction, Transformation and Load) de código abierto, con el propósito de promover la importancia que tiene en la actualidad el proceso ETL, y de facilitar no solo a los usuarios, sino también a empresas, que deseen aplicar algún proceso ya sea de extracción, transformación o carga de datos, mejorando el enfoque de inteligencia del negocio con estas herramientas adecuadas para el tratamiento de datos. Se propuso describir varias herramientas de la actualidad, donde luego se describen los motivos de selección de las tres herramientas, prosiguiendo a la descripción detallada de las elegidas, para saber que capacidades poseen a la hora de realizar el proceso ETL, adicionalmente se dan los criterios de comparación, donde luego se presenta un ejemplo práctico, que permite comparar, para luego sugerir en qué casos puede ser más útil una herramienta con respecto a otra según sus características. Por último, se presentan cuadros comparativos, donde se podrá resaltar las ventajas y desventajas de cada herramienta, junto con unas sugerencias que plantea qué herramienta utilizar para un caso dado, según la necesidad del usuario o empresa.