Modelo basado en agentes para las etapas de recopilación e integración de datos en el proceso de KDD

La transformación de grandes cantidades de datos en información útil y conocimiento es una inminente necesidad para la industria y la sociedad en general. Buscando cubrir esta necesidad surge el proceso de descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases, KDD), el c...

Full description

Autores:
Betancur Calderón, Daniel
Tipo de recurso:
Fecha de publicación:
2010
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/69916
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/69916
http://bdigital.unal.edu.co/2034/
Palabra clave:
0 Generalidades / Computer science, information and general works
Bases de datos
Datos
Minería de datos
Sistemas multiagentes
Automatización
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:La transformación de grandes cantidades de datos en información útil y conocimiento es una inminente necesidad para la industria y la sociedad en general. Buscando cubrir esta necesidad surge el proceso de descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases, KDD), el cual está compuesto por varias etapas. Un conjunto de estas etapas es conocido como preparación de datos y en la actualidad representa la mayor parte del esfuerzo destinado en las organizaciones al proceso de KDD. En este trabajo se presenta un análisis para dos etapas de la preparación de datos (Recopilación e Integración de Datos), y se define un modelo sobre una arquitectura distribuida, escalable, basada en Sistemas Multi-Agentes que soporta el lanzamiento de agentes que logran llevar a cabo las actividades de estas etapas en bases de datos distribuidas. Este modelo finalmente se implemento sobre un caso de estudio práctico con datos reales y simulados logrando resultados que demuestran la pertinencia del mismo. / Abstract. The transformation of large amounts of data into useful information and knowledge is an imminent need for industry and society in general. Looking to fulfill this need, the process of Knowledge Discovery in databases (KDD) arises, which consists of several stages. A set of these stages is known as data preparation and currently represents the bulk of effort in organizations during the KDD process. This document presents an analysis for two stages of Data Preparation (Data Collection and Integration), and defines a model with a distributed architecture, scalable, based on Multi-Agent Systems that supports the release of agents that fail to bring out the activities of these stages in distributed databases. This model was finally implemented on a case study with real and simulated data achieving results that demonstrate its relevance.