Análisis del proceso de calidad de datos y estudios comparativos de herramientas Open Source sobre perfilado de datos, enfocado a la mediana y pequeña empresa

Desde la Inteligencia de negocios se analiza la calidad de los datos, es así como en los diferentes procesos que se llevan a cabo en las medianas o pequeñas empresas se utiliza información, desde el mismo momento de su recolección, el procesamiento y el almacenamiento se debe contemplar la calidad e...

Full description

Autores:
Jaramillo, Natalia Andrea
Orrego Porras, Mile Yurley
Ossa Quintero, Carlos Eduardo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2017
Institución:
Instituto Tecnológico Metropolitano
Repositorio:
Repositorio ITM
Idioma:
spa
OAI Identifier:
oai:repositorio.itm.edu.co:20.500.12622/1720
Acceso en línea:
http://hdl.handle.net/20.500.12622/1720
Palabra clave:
Software de código abierto
Pensamiento estratégico
Gestión de la información
Quality control
Small business
Information storage
Information systems administration
Control de calidad
Microempresas
Almacenamiento de información
Administración de sistemas de información
Rights
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:Desde la Inteligencia de negocios se analiza la calidad de los datos, es así como en los diferentes procesos que se llevan a cabo en las medianas o pequeñas empresas se utiliza información, desde el mismo momento de su recolección, el procesamiento y el almacenamiento se debe contemplar la calidad e integridad de la misma. El objetivo del presente estado del arte es realizar una traza de cinco aspectos significativos a tener en cuenta en el momento de realizar el proceso de la calidad del dato, como son: gestión, dimensión, perfilamiento, enriquecimiento y transformación. Se tiene en cuenta también, la perspectiva de la gestión de la información en los datos capturados, procesados, almacenados y entregados al usuario; el cual debe ser un fiel reflejo de la realidad que se desea tratar con los sistemas informáticos, generalmente de administración como son los SGBD. La metodología aplicada está enmarcada en el análisis de tres herramientas que utilizan la calidad de datos como son: SQL Power DQguru, Talend Open Profiler y Google Refine a partir de una o varias bases de datos que están normalizadas.