Algoritmos de reglas de asociación con generación de itemsets candidatos
Con las grandes cantidades de datos continuamente recolectadas y almacenadas en las bases de datos, el problema de derivar asociaciones ha sido recientemente el centro de atención e importancia. Este articulo estudia la canasta de mercado (market-basket), la cual es un conjunto de items y de colecci...
- Autores:
-
Timarán Pereira, Ricardo
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2008
- Institución:
- Universidad Cooperativa de Colombia
- Repositorio:
- Repositorio UCC
- Idioma:
- spa
- OAI Identifier:
- oai:repository.ucc.edu.co:20.500.12494/55729
- Acceso en línea:
- https://hdl.handle.net/20.500.12494/55729
- Palabra clave:
- Descubrimiento de conocimiento en bases de datosDescubrimiento de conocimiento en bases de datos
Mineria de datos
Reglas de asociación
Canastas de mercado
Knowledge Discovery in Databases
Data Mining
Association Rules
Market-baskets
- Rights
- openAccess
- License
- http://purl.org/coar/access_right/c_abf2
Summary: | Con las grandes cantidades de datos continuamente recolectadas y almacenadas en las bases de datos, el problema de derivar asociaciones ha sido recientemente el centro de atención e importancia. Este articulo estudia la canasta de mercado (market-basket), la cual es un conjunto de items y de colección de transacciones que son subconjuntos (canastas) de estos items. La tarea es encontrar relaciones entre la presencia de varios items con esas canastas. La formalización de este problema es encontrar reglas de asociación que cumplan unas especificacio- nes minimas dadas por el usuario, expresadas en forma de soporte y confianza. Un itemset (un conjunto de items) se denomina "frecuente" si su soporte excede un umbral dado. Todo el rendimiento de generar reglas de asociación es determinado por el cálculo de los itemsets frecuentes. Para encontrar los itemsets frecuentes, los algoritmos como A priori, DHP y oic se basan en la generación de itemsets candidatos. En el presente articulo se describe el método para generar itemsets candidatos y cómo se implementa en estos algoritmos. |
---|