Propuesta de Apache Spark para consultas de grandes cantidades de datos

El siguiente documento consta de una problemática con referencia a la evolución del software de la app y de los programas web que tiene un amplio flujo de datos estos estaban presentando retrasos a la hora de lectura perdida de información entre otras y es donde nace Apache Spark, siendo una de las...

Full description

Autores:
Balza Guerrero, Holman
Florez Amaris, Kevin
Mercado Lopez, Leonardo
Mendoza Mendoza, Rony
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad Simón Bolívar
Repositorio:
Repositorio Digital USB
Idioma:
spa
OAI Identifier:
oai:bonga.unisimon.edu.co:20.500.12442/10260
Acceso en línea:
https://hdl.handle.net/20.500.12442/10260
Palabra clave:
Apache Spark
Big Data
Analítica de datos
MapReduce
Hadoop
Clúster
Apache Spark
Big Data
Data Analytics
MapReduce
Hadoop
Cluster
Rights
restrictedAccess
License
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
id USIMONBOL2_d396810ba170e2d741be65bd6f57b1cf
oai_identifier_str oai:bonga.unisimon.edu.co:20.500.12442/10260
network_acronym_str USIMONBOL2
network_name_str Repositorio Digital USB
repository_id_str
dc.title.spa.fl_str_mv Propuesta de Apache Spark para consultas de grandes cantidades de datos
dc.title.translated.eng.fl_str_mv Apache Spark proposal for large data queries
title Propuesta de Apache Spark para consultas de grandes cantidades de datos
spellingShingle Propuesta de Apache Spark para consultas de grandes cantidades de datos
Apache Spark
Big Data
Analítica de datos
MapReduce
Hadoop
Clúster
Apache Spark
Big Data
Data Analytics
MapReduce
Hadoop
Cluster
title_short Propuesta de Apache Spark para consultas de grandes cantidades de datos
title_full Propuesta de Apache Spark para consultas de grandes cantidades de datos
title_fullStr Propuesta de Apache Spark para consultas de grandes cantidades de datos
title_full_unstemmed Propuesta de Apache Spark para consultas de grandes cantidades de datos
title_sort Propuesta de Apache Spark para consultas de grandes cantidades de datos
dc.creator.fl_str_mv Balza Guerrero, Holman
Florez Amaris, Kevin
Mercado Lopez, Leonardo
Mendoza Mendoza, Rony
dc.contributor.author.none.fl_str_mv Balza Guerrero, Holman
Florez Amaris, Kevin
Mercado Lopez, Leonardo
Mendoza Mendoza, Rony
dc.subject.spa.fl_str_mv Apache Spark
Big Data
Analítica de datos
MapReduce
Hadoop
Clúster
topic Apache Spark
Big Data
Analítica de datos
MapReduce
Hadoop
Clúster
Apache Spark
Big Data
Data Analytics
MapReduce
Hadoop
Cluster
dc.subject.eng.fl_str_mv Apache Spark
Big Data
Data Analytics
MapReduce
Hadoop
Cluster
description El siguiente documento consta de una problemática con referencia a la evolución del software de la app y de los programas web que tiene un amplio flujo de datos estos estaban presentando retrasos a la hora de lectura perdida de información entre otras y es donde nace Apache Spark, siendo una de las herramientas BigData con mayor crecimiento y adopción en la actualidad, esta representa una gran oportunidad para las organizaciones de obtener los beneficios del análisis de datos a gran escala. Apache Spark ha emergido recientemente para integrarse y quedarse en el dominio del análisis de datos a gran escala.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-07-15T15:31:04Z
dc.date.available.none.fl_str_mv 2022-07-15T15:31:04Z
dc.date.issued.none.fl_str_mv 2022
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.driver.eng.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.spa.spa.fl_str_mv Trabajo de grado - pregrado
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12442/10260
url https://hdl.handle.net/20.500.12442/10260
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 Internacional
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_16ec
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.eng.fl_str_mv info:eu-repo/semantics/restrictedAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 Internacional
http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_16ec
eu_rights_str_mv restrictedAccess
dc.format.mimetype.spa.fl_str_mv pdf
dc.publisher.spa.fl_str_mv Ediciones Universidad Simón Bolívar
Facultad de Ingenierías
institution Universidad Simón Bolívar
bitstream.url.fl_str_mv https://bonga.unisimon.edu.co/bitstreams/9b98b076-b57f-44b7-8214-b82d95296d9a/download
https://bonga.unisimon.edu.co/bitstreams/a6188cd4-2ebf-42fe-aca5-48708eb78ea0/download
https://bonga.unisimon.edu.co/bitstreams/d48ecbc2-c031-4439-a0ec-08d63759d495/download
https://bonga.unisimon.edu.co/bitstreams/32f4b049-78eb-43ce-b210-7b78d3478428/download
https://bonga.unisimon.edu.co/bitstreams/79c64b45-69bb-4541-99ae-74fcb3d62e4e/download
https://bonga.unisimon.edu.co/bitstreams/2f7e13f4-7634-4947-8708-99d2727d7ea8/download
https://bonga.unisimon.edu.co/bitstreams/6b710368-21fc-4af2-9d19-0703fadd2bf5/download
https://bonga.unisimon.edu.co/bitstreams/39b04354-6dfd-4acd-b1da-dd8642e90079/download
https://bonga.unisimon.edu.co/bitstreams/d4622e02-2219-48a7-a0f4-c61a6c446200/download
bitstream.checksum.fl_str_mv 4460e5956bc1d1639be9ae6146a50347
2a1661e5960a7bab4fd8dda692fb677c
8d6347de4bea62fc971b52f22f19ac7d
442fa6de0530400648b25a2528490fbd
442fa6de0530400648b25a2528490fbd
442fa6de0530400648b25a2528490fbd
6f1cf80f7f40cf332ec3199f527fbeea
6f1cf80f7f40cf332ec3199f527fbeea
6f1cf80f7f40cf332ec3199f527fbeea
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital Universidad Simón Bolívar
repository.mail.fl_str_mv repositorio.digital@unisimon.edu.co
_version_ 1812100469570404352
spelling Balza Guerrero, Holman320f7113-617f-428c-baad-86db18523aafFlorez Amaris, Kevine5ece56c-83c8-4e66-a402-c45516beecd3Mercado Lopez, Leonardoc7e2e756-3248-42b2-a9a9-0d8b40439dd6Mendoza Mendoza, Rony38d28d39-1ddd-4cf9-a622-c3a4b6ec75202022-07-15T15:31:04Z2022-07-15T15:31:04Z2022https://hdl.handle.net/20.500.12442/10260El siguiente documento consta de una problemática con referencia a la evolución del software de la app y de los programas web que tiene un amplio flujo de datos estos estaban presentando retrasos a la hora de lectura perdida de información entre otras y es donde nace Apache Spark, siendo una de las herramientas BigData con mayor crecimiento y adopción en la actualidad, esta representa una gran oportunidad para las organizaciones de obtener los beneficios del análisis de datos a gran escala. Apache Spark ha emergido recientemente para integrarse y quedarse en el dominio del análisis de datos a gran escala.The following document consists of a problem with reference to the evolution of the app software and web programs that have a large flow of data, these were presenting delays when reading lost information, among others, and that is where Apache Spark was born. Being one of the Big Data tools with the highest growth and adoption today, it represents a great opportunity for organizations to obtain the benefits of large-scale data analysis. Apache Spark has recently emerged to enter and remain in the domain of large-scale data analysis.pdfspaEdiciones Universidad Simón BolívarFacultad de IngenieríasAttribution-NonCommercial-NoDerivatives 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/restrictedAccesshttp://purl.org/coar/access_right/c_16ecApache SparkBig DataAnalítica de datosMapReduceHadoopClústerApache SparkBig DataData AnalyticsMapReduceHadoopClusterPropuesta de Apache Spark para consultas de grandes cantidades de datosApache Spark proposal for large data queriesinfo:eu-repo/semantics/bachelorThesisTrabajo de grado - pregradohttp://purl.org/coar/resource_type/c_7a1fP. J. M.-D. Pozo, «ANÁLISIS TECNOLÓGICO DEL DISEÑO,» Universidad Carlos III de Madrid, Leganes, 2018.F. C. Martín, DISEÑO E IMPLEMENTACIÓN DE CLÚSTER SPARK, Y ANÁLISIS DE DATOS DE TRÁFICO MEDIANTE EL USO DE LA LIBRERÍA MLLIB, Universidad De Las Palmas De Gran Canaria.M. Macías, Introducción a Apache Spark, Editorial UOC, 2015.««¿Que es apache Saprk?,»,» Google Cloud, 2021. [En línea]. Available: https://cloud.google.com/learn/what-is-apache-spark?hl=es#section-2.J. P. P. y. M. Merino, «Defincion.De,» 2021. [En línea]. Available: https://definicion.de/pipeline/.L. J. Rios, «SEDICI,» 2021. [En línea]. Available: http://sedici.unlp.edu.ar/handle/10915/53669.Google, «Google,» Google, [En línea]. Available: https://research.google.com/colaboratory/intl/es/faq.html. [Último acceso: 2022].P. S. Expósito, IMPLEMENTACIÓN DE MODELOS DE DATA SCIENCE UTILIZANDO SPARK Y MLLIB, Universidad de Jaen, 2019.A. R. Mesa, «Big Data: La evolución de los datos,» OpenWebinars, 25 Enero 2018. [En línea]. Available: https://openwebinars.net/blog/big-data-la-evolucion-de-los-datos/.I. K. A. A. a. Y. y. R. M. E. Alomari, A Big Data Tool with Automatic Labeling for Road Traffic Social Sensing and Event Detection Using Distributed Machine Learning, MPDI, 2021.E. B. &. M. ESIC SCHOOL, «ESIC,» Octubre 2018. [En línea]. Available: https://www.esic.edu/rethink/tecnologia/apache-spark-introduccion-que-es-y-como-funciona. [Último acceso: 2021].A. S. Foudation, «Apache Spark,» Apache Software Foudation, 2021. [En línea]. Available: https://spark.apache.org/.P. Clic, «Programmer Clic,» 2021. [En línea]. Available: https://programmerclick.com/article/36341465995/.Sede BarranquillaIngeniería de SistemasCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://bonga.unisimon.edu.co/bitstreams/9b98b076-b57f-44b7-8214-b82d95296d9a/download4460e5956bc1d1639be9ae6146a50347MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-83000https://bonga.unisimon.edu.co/bitstreams/a6188cd4-2ebf-42fe-aca5-48708eb78ea0/download2a1661e5960a7bab4fd8dda692fb677cMD54ORIGINALPDF.pdfPDF.pdfapplication/pdf606089https://bonga.unisimon.edu.co/bitstreams/d48ecbc2-c031-4439-a0ec-08d63759d495/download8d6347de4bea62fc971b52f22f19ac7dMD51TEXTPropuesta_Apache_Spark_Consultas_Cantidades_Datos_Artículo.pdf.txtPropuesta_Apache_Spark_Consultas_Cantidades_Datos_Artículo.pdf.txtExtracted texttext/plain25019https://bonga.unisimon.edu.co/bitstreams/32f4b049-78eb-43ce-b210-7b78d3478428/download442fa6de0530400648b25a2528490fbdMD55PDF.txtPDF.txtExtracted texttext/plain25019https://bonga.unisimon.edu.co/bitstreams/79c64b45-69bb-4541-99ae-74fcb3d62e4e/download442fa6de0530400648b25a2528490fbdMD57PDF.pdf.txtPDF.pdf.txtExtracted texttext/plain25019https://bonga.unisimon.edu.co/bitstreams/2f7e13f4-7634-4947-8708-99d2727d7ea8/download442fa6de0530400648b25a2528490fbdMD59THUMBNAILPropuesta_Apache_Spark_Consultas_Cantidades_Datos_Artículo.pdf.jpgPropuesta_Apache_Spark_Consultas_Cantidades_Datos_Artículo.pdf.jpgGenerated Thumbnailimage/jpeg5974https://bonga.unisimon.edu.co/bitstreams/6b710368-21fc-4af2-9d19-0703fadd2bf5/download6f1cf80f7f40cf332ec3199f527fbeeaMD56PDF.jpgPDF.jpgGenerated Thumbnailimage/jpeg5974https://bonga.unisimon.edu.co/bitstreams/39b04354-6dfd-4acd-b1da-dd8642e90079/download6f1cf80f7f40cf332ec3199f527fbeeaMD58PDF.pdf.jpgPDF.pdf.jpgGenerated Thumbnailimage/jpeg5974https://bonga.unisimon.edu.co/bitstreams/d4622e02-2219-48a7-a0f4-c61a6c446200/download6f1cf80f7f40cf332ec3199f527fbeeaMD51020.500.12442/10260oai:bonga.unisimon.edu.co:20.500.12442/102602024-08-14 21:52:14.358http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internacionalrestrictedhttps://bonga.unisimon.edu.coRepositorio Digital Universidad Simón Bolívarrepositorio.digital@unisimon.edu.co