Propuesta de Apache Spark para consultas de grandes cantidades de datos

El siguiente documento consta de una problemática con referencia a la evolución del software de la app y de los programas web que tiene un amplio flujo de datos estos estaban presentando retrasos a la hora de lectura perdida de información entre otras y es donde nace Apache Spark, siendo una de las...

Full description

Autores:
Balza Guerrero, Holman
Florez Amaris, Kevin
Mercado Lopez, Leonardo
Mendoza Mendoza, Rony
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad Simón Bolívar
Repositorio:
Repositorio Digital USB
Idioma:
spa
OAI Identifier:
oai:bonga.unisimon.edu.co:20.500.12442/10260
Acceso en línea:
https://hdl.handle.net/20.500.12442/10260
Palabra clave:
Apache Spark
Big Data
Analítica de datos
MapReduce
Hadoop
Clúster
Apache Spark
Big Data
Data Analytics
MapReduce
Hadoop
Cluster
Rights
restrictedAccess
License
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Description
Summary:El siguiente documento consta de una problemática con referencia a la evolución del software de la app y de los programas web que tiene un amplio flujo de datos estos estaban presentando retrasos a la hora de lectura perdida de información entre otras y es donde nace Apache Spark, siendo una de las herramientas BigData con mayor crecimiento y adopción en la actualidad, esta representa una gran oportunidad para las organizaciones de obtener los beneficios del análisis de datos a gran escala. Apache Spark ha emergido recientemente para integrarse y quedarse en el dominio del análisis de datos a gran escala.