Algoritmos de reglas de asociación con generación de itemsets candidatos

Con las grandes cantidades de datos continuamente recolectadas y almacenadas en las bases de datos, el problema de derivar asociaciones ha sido recientemente el centro de atención e importancia. Este articulo estudia la canasta de mercado (market-basket), la cual es un conjunto de items y de colecci...

Full description

Autores:
Timarán Pereira, Ricardo
Tipo de recurso:
Article of journal
Fecha de publicación:
2008
Institución:
Universidad Cooperativa de Colombia
Repositorio:
Repositorio UCC
Idioma:
spa
OAI Identifier:
oai:repository.ucc.edu.co:20.500.12494/55729
Acceso en línea:
https://hdl.handle.net/20.500.12494/55729
Palabra clave:
Descubrimiento de conocimiento en bases de datosDescubrimiento de conocimiento en bases de datos
Mineria de datos
Reglas de asociación
Canastas de mercado
Knowledge Discovery in Databases
Data Mining
Association Rules
Market-baskets
Rights
openAccess
License
http://purl.org/coar/access_right/c_abf2
Description
Summary:Con las grandes cantidades de datos continuamente recolectadas y almacenadas en las bases de datos, el problema de derivar asociaciones ha sido recientemente el centro de atención e importancia. Este articulo estudia la canasta de mercado (market-basket), la cual es un conjunto de items y de colección de transacciones que son subconjuntos (canastas) de estos items. La tarea es encontrar relaciones entre la presencia de varios items con esas canastas. La formalización de este problema es encontrar reglas de asociación que cumplan unas especificacio- nes minimas dadas por el usuario, expresadas en forma de soporte y confianza. Un itemset (un conjunto de items) se denomina "frecuente" si su soporte excede un umbral dado. Todo el rendimiento de generar reglas de asociación es determinado por el cálculo de los itemsets frecuentes. Para encontrar los itemsets frecuentes, los algoritmos como A priori, DHP y oic se basan en la generación de itemsets candidatos. En el presente articulo se describe el método para generar itemsets candidatos y cómo se implementa en estos algoritmos.