Caracterización de algunas técnicas algoritmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico

En el presente trabajo se propone un modelo conceptual, para describir las características más relevantes de las técnicas de minería de datos, Apriori y Regresión logística. El modelo le muestra las propiedades fundamentales de cada técnica y funcionalidad al minero de datos, cuando de descubrir pat...

Full description

Autores:
Giraldo Mejía, Juan Camilo
Tipo de recurso:
Fecha de publicación:
2009
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/70112
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/70112
http://bdigital.unal.edu.co/2272/
Palabra clave:
0 Generalidades / Computer science, information and general works
Minería de datos
Análisis de regresión logística
Algoritmos (Computadores)
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:En el presente trabajo se propone un modelo conceptual, para describir las características más relevantes de las técnicas de minería de datos, Apriori y Regresión logística. El modelo le muestra las propiedades fundamentales de cada técnica y funcionalidad al minero de datos, cuando de descubrir patrones frecuentes e interesantes o relación de variables se trate. El modelo se obtuvo a partir de la caracterización de las dos técnicas en mención Apriori y Regresión logística, estableciendo sus atributos o características fundamentales, y el flujo de información a partir de los métodos de cada caso. El modelo se hizo utilizando el lenguaje para modelado unificado (UML). La aplicación y validación del modelo conceptual propuesto se hizo utilizando algunas variables y datos, obtenidos de la encuesta anual manufacturera, el cual versa que la innovación y el desarrollo tecnológico son pilares reconocidos de competitividad y factores clave para transformar el conocimiento en riqueza económica, bienestar social y desarrollo humano. Al respecto se evidencia cierto consenso entre los analistas en cuanto que nuestro país tiene serios problemas a nivel de innovación y tecnología, que perjudican sensiblemente su capacidad de competir en mercados globales y de construir una sociedad con un mayor nivel de vida. Se utilizaron las herramientas SQL Server 2005, como repositorio de información, y SQL Server Business Intelligence Development Studio, para crear los orígenes y vistas de datos. Se utilizó la tecnología Microsoft para generar reglas de asociación, y una red de dependencias con el algoritmo de asociación. Este algoritmo es una implementación de la técnica Apriori. Igualmente se aplicó el algoritmo de Regresión logística, el cual generó gráficos de elevación, y visor de redes probabilísticas. / Abstract: In the present work a conceptual model sets out, to describe the most excellent characteristics of the techniques of mining of data, Apriori and logistic Regression. The model shows to the fundamental properties of each technique and functionality to him the miner of data, when to discover frequent landlords and interesting or relation of variables treats. The model obtained from the characterization of the two techniques in Apriori mention and logistic Regression, establishing its fundamental attributes or characteristics, and the flow of information from the methods of each case. The model was done using the unified modeled language for (UML). The application and validation of the proposed conceptual model were done using some variables and data, collected of the manufacturing annual survey, which turns that the innovation and the technological development are recognized pillars of competitiveness and key factors to transform the knowledge into economic wealth, social welfare and human development. On the matter certain consensus between the analysts is demonstrated when our country has serious problems concerning innovation and technology, that noticeably harm their capacity to compete in global markets and to construct a society with a greater standard of life. Tools SQL Server 2005 were used, like repositorio of information, and SQL Server Business Intelligence Development Studio, to create the origins and views of data. The Microsoft technology was used to generate association rules, and a network of dependencies with the association algorithm. This algorithm is an implementation of the technique Apriori. Also the algorithm of logistic Regression was applied, which generated elevation graphs, and viewfinder of probabilistic Networks.