Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.

El presente proyecto propone el desarrollo de una arquitectura de Big data que permita evaluar la satisfacción de los usuarios del sector turístico del departamento de Boyacá Colombia mediante el análisis de sentimientos multimodales, a través de una serie de parámetros en la extracción de datos a h...

Full description

Autores:
Algecira Arbelaez, Cristian David
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2021
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/35065
Acceso en línea:
http://hdl.handle.net/11634/35065
Palabra clave:
Sentiment analysis
Big Data
Extraction
Web Scraper
Tourism
Turismo
Arquitectura
Análisis de sentimientos
Big Data
Extracción
Turismo
Web Scraper
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id SANTTOMAS2_45d52c8579c2c8b83c56012069bbfbd6
oai_identifier_str oai:repository.usta.edu.co:11634/35065
network_acronym_str SANTTOMAS2
network_name_str Repositorio Institucional USTA
repository_id_str
dc.title.spa.fl_str_mv Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
title Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
spellingShingle Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
Sentiment analysis
Big Data
Extraction
Web Scraper
Tourism
Turismo
Arquitectura
Análisis de sentimientos
Big Data
Extracción
Turismo
Web Scraper
title_short Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
title_full Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
title_fullStr Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
title_full_unstemmed Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
title_sort Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
dc.creator.fl_str_mv Algecira Arbelaez, Cristian David
dc.contributor.advisor.none.fl_str_mv Monsalve Pulido, Julián Alberto
dc.contributor.author.none.fl_str_mv Algecira Arbelaez, Cristian David
dc.contributor.corporatename.spa.fl_str_mv Universidad Santo Tomas
Universidad Santo Tomás
dc.subject.keyword.spa.fl_str_mv Sentiment analysis
Big Data
Extraction
Web Scraper
Tourism
topic Sentiment analysis
Big Data
Extraction
Web Scraper
Tourism
Turismo
Arquitectura
Análisis de sentimientos
Big Data
Extracción
Turismo
Web Scraper
dc.subject.lemb.spa.fl_str_mv Turismo
Arquitectura
dc.subject.proposal.spa.fl_str_mv Análisis de sentimientos
Big Data
Extracción
Turismo
Web Scraper
description El presente proyecto propone el desarrollo de una arquitectura de Big data que permita evaluar la satisfacción de los usuarios del sector turístico del departamento de Boyacá Colombia mediante el análisis de sentimientos multimodales, a través de una serie de parámetros en la extracción de datos a herramientas como Booking, TripAdvisor y twitter, facilitando el análisis de los sentimiento del usuario por medio de variables de polaridad, esto con tal de conocer la opinión de los usuarios frente al sector turístico del departamento de Boyacá. El proyecto atiende a tres puntos fundamentales dentro del desarrollo de la arquitectura: extracción de datos, análisis de datos y visualización. Dichos puntos establecen un punto de partida dentro del desarrollo de la arquitectura; puesto que los subpuntos de los tres parámetros iniciales buscan el buen funcionamiento y desarrollo de la arquitectura. La extracción comprende el uso de la herramienta webs scraper encargada de la extracción de datos de las herramientas ya mencionadas para posterior uso en el segundo parámetro, el análisis; en este punto se pretende que los datos obtenidos de la extracción se sometan al proceso de polaridad que permita determinar las emociones y opiniones de los usuarios frente a sus visitas; esto para finalmente en el proceso de visualización los datos obtenidos como resultados puedan ser plasmados en gráficas que permiten su entendimiento y comprensión. Finalmente, el proyecto presenta una serie de conclusiones frente a los resultados obtenidos con la arquitectura. La arquitectura está basada en el proyecto de investigación Doctoral de la Pontificia Universidad Javeriana “Modelo multimodal para el análisis de sentimientos en un dominio turístico”.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-07-26T22:03:36Z
dc.date.available.none.fl_str_mv 2021-07-26T22:03:36Z
dc.date.issued.none.fl_str_mv 2021-07-13
dc.type.local.spa.fl_str_mv Trabajo de grado
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.drive.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.citation.spa.fl_str_mv Algecira Arbelaez, C. D. (2021). Arquitectura de big data para el análisis de sentimientos multimodales en el sector turístico del departamento de Boyacá, Colombia [Tesis de grado, pregrado en Ingeniería de Sistemas]. Universidad Santo Tomás, Tunja
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11634/35065
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad Santo Tomás
dc.identifier.instname.spa.fl_str_mv instname:Universidad Santo Tomás
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.usta.edu.co
identifier_str_mv Algecira Arbelaez, C. D. (2021). Arquitectura de big data para el análisis de sentimientos multimodales en el sector turístico del departamento de Boyacá, Colombia [Tesis de grado, pregrado en Ingeniería de Sistemas]. Universidad Santo Tomás, Tunja
reponame:Repositorio Institucional Universidad Santo Tomás
instname:Universidad Santo Tomás
repourl:https://repository.usta.edu.co
url http://hdl.handle.net/11634/35065
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv IngenioVirtual. (s.f.). IngenioVirtual. Obtenido de https://www.ingeniovirtual.com/tipos-de-graficos-y-diagramas-para-la-visualizacion-de-datos/
3.0, E. (30 de Septiembre de 2020). Obtenido de https://www.educaciontrespuntocero.com/recursos/crear-una-nube-tags-las-palabras-mas-usadas-texto/
300/1996, L. (1996).
Ahmed, I. (27 de Noviembre de 2020). Astera. Obtenido de https://www.astera.com/es/type/blog/automated-data-extraction-tools-for-faster-insights/
Akram Hernandez Vásquez, H. C. (2019). MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE. Obtenido de MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE: https://www.scielosp.org/pdf/rpmesp/2019.v36n1/128-133/es
Antonio Manuel Rodriguez Garcia, F. R. (2019). Píxel-BIT Revista de Medios y Educación. Obtenido de Píxel-BIT Revista de Medios y Educación: https://idus.us.es/bitstream/handle/11441/93761/Rodriguez-Garcia%20-%20competencia%20digital_removed.pdf?sequence=1&isAllowed=y
BBVA API_Market. (11 de Enero de 2016). Obtenido de https://www.bbvaapimarket.com/es/mundo-api/herramientas-de-extraccion-de-datos-para-principiantes-y-profesionales/
Bordignon, G. H. (s.f.). Introducción a la Recuperación de Información. Obtenido de http://eprints.rclis.org/12243/1/Introduccion-RI-v9f.pdf
Boyacá Visión 2019. (2019).
Carina Sofía Andrade and Maribel Yasmina Santos. (2017).
Cesteros, A. F.-P. (2018). La eficacia del análisis de sentimientos para la empresa: el caso de estudio Dell Technologies Inc. MADRID. Obtenido de https://www.ucm.es/data/cont/docs/758-2019-01-04-TFG_Panico_Chiara_TFG.pdf
clicdata. (s.f.). clicdata. Obtenido de https://www.clicdata.com/es/ejemplos/project-management/
conceptodefinicion. (s.f.). conceptodefinicion. Obtenido de https://conceptodefinicion.de/histograma/
datavizcatalogue. (s.f.). datavizcatalogue. Obtenido de https://datavizcatalogue.com/ES/metodos/grafica_de_area.html
De Rojas y Camarero, 2008; Rivera,2013. (2013). Visitors experience, mood and satisfaction in A heritage context: Evidence from an interpretation center. Tourism Management, 525-537.
Departamento Administrativo Nacional de Estadistica. (s.f.).
Divakar Mysore. (2013).
Divakar Mysore, S. K. (17 de Septiembre de 2013). IBM. Obtenido de https://developer.ibm.com/es/technologies/analytics/articles/bd-archpatterns1/
Dlib. (2020). Dlib. Obtenido de Dlib: http://dlib.net/
Earl, M. (28 de Julio de 2015). Obtenido de https://matthewearl.github.io/2015/07/28/switching-eds-with-python/
ecured. (s.f.). ecured. Obtenido de https://www.ecured.cu/Cartograma
Erik Cambria, A. H. (2012). Sentic Album: Content-, Concept-, and Context-Based Online. Science+Business Media, LLC 2012. Obtenido de https://sentic.net/sentic-album.pdf
Estadística, P. y. (27 de Mayo de 2012). Probabilidad y Estadística. Obtenido de http://probabilidadyestadisticaitsav.blogspot.com/2012/05/16-diagrama-de-arbol.html
Facultad de Estudios Estadisticos, Universidad Complutense de Madrid. (2020). Obtenido de https://www.masterBigdataucm.com/que-es-Big-data/
freepik. (2018). freepik. Obtenido de https://www.freepik.es/vector-gratis/ilustracion-burbujas-discurso-nube_2904317.htm
gamavision. (01 de Julio de 2020). gamavision. Obtenido de https://www.gamavision.com.ec/pros-y-contras-del-reconocimiento-facial/
García, S. M. (1997). Psicosociología del ocio y el turismo. Málaga: Algibe.
geeksforgeeks. (24 de Mayo de 2020). geeksforgeeks. Obtenido de https://www.geeksforgeeks.org/opencv-facial-landmarks-and-face-detection-using-dlib-and-opencv/
gisandbeers. (17 de Marzo de 2019). gisandbeers. Obtenido de http://www.gisandbeers.com/crear-mapas-calor-heatmaps/
Gómez, J. C. (10 de Enero de 2020). Obtenido de https://josecantero.com/uncategorized/tendencias-en-turismo-experiencial-en-2020-bienvenidos-a-la-decada/
HAA DnL. (s.f.). HAA DnL. Obtenido de https://sites.google.com/site/haadnl/home/diagrama-radial
Hong, M. K. (2017). Unstructured Social Media Data Mining System Based on Emotional Database and Unstructured Information Management Architecture Framework. ASP.
Jacinto, G. (1995). Psicología social del turismo. Psicología Social de la Educación y de la Cultura, Ocio, Deporte y Turismo. Salamanca, 245-272.
José Augusto Cadena Moreano, R. H. (2017). RECONOCIMIENTO FACIAL CON BASE EN IMÁGENES. B O L E T Í N V I R T U A L - M A Y O - V O L 6 - 5 I S N N 2 2 6 6 - 1 5 3 6. Obtenido de file:///C:/Users/Usuario/Downloads/Dialnet-ReconocimientoFacialConBaseEnImagenes-6145639.pdf
José Luis García Cué, J. A. (Octubre de 2008). Revista Estilos de Aprendizaje. Obtenido de Revista Estilos de Aprendizaje: http://revistaestilosdeaprendizaje.com/article/view/852/1540
Kanuk y Schiffman . (s.f.).
La Vanguardia. (11 de enero de 2020). Obtenido de https://www.vanguardia.com/economia/nacional/turismo-hara-importante-aporte-en-el-pib-del-pais-XM1860653
lucidchart. (s.f.). lucidchart. Obtenido de https://www.lucidchart.com/pages/es/que-es-un-diagrama-de-flujo
Martín, S. (1997).
Martinez, J. L. (08 de Junio de 2014). slideshare. Obtenido de https://es.slideshare.net/joseluis199222/tabla-de-resultados-obtenidos-mecanismos-1
McCannell. (1976). The Tourist. New York.
Mckercher. (1999).
McKercher, B. (1999). A chaos approach to tourism. Tourism Management, 425- 434.
Mérida, C. (2014). Modelo arquitectónico de información para una plataforma de Big Data para el Sector Turístico. Lima, Perú.
microsoft. (15 de Junio de 2016). microsoft. Obtenido de https://docs.microsoft.com/es-es/sql/reporting-services/tutorial-add-a-pie-chart-to-your-report-report-builder?view=sql-server-ver15
Molina et al. 2007; Troitiño, 1991. (1991). Segmentación de la demanda turística: Un análisis aplicado a un destino cultural. Revista de análisis turístico n° 4, 36-48.
Montaner, J. (1996). Psicosociología del turismo. Barcelona: Sintesis.
NodeJS. (2020). NodeJS. Obtenido de NodeJS: https://nodejs.org/es/docs/
npm ejs. (2020). npm ejs. Obtenido de npm ejs: https://www.npmjs.com/package/ejs
npm express. (2020). npm express. Obtenido de npm express: https://www.npmjs.com/package/express
npm mongoose. (2020). npm mongoose. Obtenido de npm mongoose: https://www.npmjs.com/package/mongoose
npm morgan. (2020). npm morgan. Obtenido de npm morgan: https://www.npmjs.com/package/morgan
npm nodemon. (2020). npm nodemon. Obtenido de npm nodemon: https://www.npmjs.com/package/nodemon
Numpy. (2020). Numpy. Obtenido de Numpy: https://numpy.org/doc/
Pandas. (2019). Pandas. Obtenido de Pandas: https://pandas.pydata.org/docs/
Paul Viola, M. J. (2001). Rapid Object Detection using a Boosted Cascade of Simple Features. Obtenido de https://web.iitd.ac.in/~sumeet/viola-cvpr-01.pdf
Pauli, P. A. (2019). Análisis de sentimiento. Comparación de algoritmos predictivos y métodos utilizando un lexicon español. BUENOS AIRES: INSTITUTO TECNOLÓGICO DE BUENOS AIRES – ITBA. Obtenido de https://ri.itba.edu.ar/bitstream/handle/123456789/1782/Proyecto%20Final.pdf?sequence=1&isAllowed=y
Pearce, P. (1993). Fundamentals of Tourist Motivation. Tourism Research: Critiques and Challenges.
Pine & Gilmore. (1998). The experience economy: Work is Theater& Every Business a Stage. Harvard Business School Press.
practicobaul. (s.f.). practicobaul. Obtenido de https://sites.google.com/site/unpracticobaul/tablas-en-un-texto
QuestionPro. (2020). QuestionPro. Obtenido de QuestionPro: https://www.questionpro.com/es/analisis-de-datos.html#:~:text=El%20an%C3%A1lisis%20de%20datos%20es%20la%20ciencia%20que%20se%20encarga,los%20conocimientos%20sobre%20diversos%20temas.
Redacción España. (18 de Noviembre de 2019). B12. Obtenido de https://agenciab12.mx/noticia/diferencia-datos-estructurados-y-datos-no-estructurados
Revuelta-Domínguez, F. I. (Diciembre de 2012). researchgate.net. Obtenido de https://www.researchgate.net/figure/Figura-4-Representacion-grafica-de-la-red-segun-el-grado_fig1_266025222
RICHARDS. (2004). Diputació de Barcelona. Obtenido de www.diba.es/cerc/arxinterac04/arcem1/richards/dipbarcelona
Rober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdf
Sande, J. C. (2018). Análisis de sentimientos en Twitter. UOC, Universitat Oberta de Catalunya, 99. Obtenido de http://openaccess.uoc.edu/webapps/o2/bitstream/10609/81435/6/jsobrinosTFM0618memoria.pdf
Schiffman, L. &. (1983). Consumer behavior. Englewood Cliffs: Prentice Hall.
Scikit-Learn. (2019). Scikit-Learn. Obtenido de Scikit-Learn: https://scikit-learn.org/0.21/documentation.html
SenticNet. (2018). SenticNet. Obtenido de SenticNet: https://sentic.net/
support.minitab. (2020). /support.minitab. Obtenido de https://support.minitab.com/es-mx/minitab/19/help-and-how-to/graphs/matrix-plot/before-you-start/overview/
themexpert. (s.f.). themexpert. Obtenido de https://www.themexpert.com/docs/quix/elements/polar-area-chart
TIBCO. (s.f.). TIBCO. Obtenido de https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-ES/WebHelp/GUID-6023CECC-E502-4AE1-B5C5-FFE5DAF6FAE2.html
Tremolosa. (2002). ACTIVIDAD DE OCIO-TURÍSTICO.
Universidad Alcala. (s.f.).
Universidad de Alcalá. (2020). Obtenido de https://www.master-Bigdata.com/Big-data-actualmente-tan-importante/
Vasavi Gajarla, A. G. (s.f.). Emotion Detection and Sentiment Analysis of Images. Obtenido de https://www.cc.gatech.edu/~hays/7476/projects/Aditi_Vasavi.pdf
Vieira, D. (06 de Mayo de 2019). rockcontent. Obtenido de https://rockcontent.com/es/blog/que-es-diagrama-de-gantt/
Zambrano, D. M. (2017). Innovación para el Análisis de Sentimientos en Texto, una revisión de la técnica actual aplicando metodologías de crowdsourcing. researchgate. Obtenido de file:///C:/Users/Usuario/Downloads/340-940-1-PB.pdf
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.campus.spa.fl_str_mv CRAI-USTA Tunja
dc.publisher.spa.fl_str_mv Universidad Santo Tomás
dc.publisher.program.spa.fl_str_mv Ingeniería Informática
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería de Sistemas
institution Universidad Santo Tomás
bitstream.url.fl_str_mv https://repository.usta.edu.co/bitstream/11634/35065/4/license_rdf
https://repository.usta.edu.co/bitstream/11634/35065/6/2021.cristianalgecira.pdf
https://repository.usta.edu.co/bitstream/11634/35065/7/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdf
https://repository.usta.edu.co/bitstream/11634/35065/8/Carta%20autorizaci%c3%b3n%20de%20facultad
https://repository.usta.edu.co/bitstream/11634/35065/9/license.txt
https://repository.usta.edu.co/bitstream/11634/35065/10/2021.cristianalgecira.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/35065/11/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/35065/12/Carta%20autorizaci%c3%b3n%20de%20facultad.jpg
bitstream.checksum.fl_str_mv 217700a34da79ed616c2feb68d4c5e06
e4ec3551bb3c5fac4d5b1add36bf3a08
e91a4e8cc0da99c52f9f3b4c4f04b3e9
2308cce1edb85d54becac5b1342c5400
aedeaf396fcd827b537c73d23464fc27
ecc476f8f3d74d7ba55f8bc19e675e92
16d6462ef41b9ebe8d06a3be8dd05d0f
abded5c00f7e9397cb83def519621aa2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad Santo Tomás
repository.mail.fl_str_mv repositorio@usantotomas.edu.co
_version_ 1782026225420599296
spelling Monsalve Pulido, Julián AlbertoAlgecira Arbelaez, Cristian DavidUniversidad Santo TomasUniversidad Santo Tomás2021-07-26T22:03:36Z2021-07-26T22:03:36Z2021-07-13Algecira Arbelaez, C. D. (2021). Arquitectura de big data para el análisis de sentimientos multimodales en el sector turístico del departamento de Boyacá, Colombia [Tesis de grado, pregrado en Ingeniería de Sistemas]. Universidad Santo Tomás, Tunjahttp://hdl.handle.net/11634/35065reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coEl presente proyecto propone el desarrollo de una arquitectura de Big data que permita evaluar la satisfacción de los usuarios del sector turístico del departamento de Boyacá Colombia mediante el análisis de sentimientos multimodales, a través de una serie de parámetros en la extracción de datos a herramientas como Booking, TripAdvisor y twitter, facilitando el análisis de los sentimiento del usuario por medio de variables de polaridad, esto con tal de conocer la opinión de los usuarios frente al sector turístico del departamento de Boyacá. El proyecto atiende a tres puntos fundamentales dentro del desarrollo de la arquitectura: extracción de datos, análisis de datos y visualización. Dichos puntos establecen un punto de partida dentro del desarrollo de la arquitectura; puesto que los subpuntos de los tres parámetros iniciales buscan el buen funcionamiento y desarrollo de la arquitectura. La extracción comprende el uso de la herramienta webs scraper encargada de la extracción de datos de las herramientas ya mencionadas para posterior uso en el segundo parámetro, el análisis; en este punto se pretende que los datos obtenidos de la extracción se sometan al proceso de polaridad que permita determinar las emociones y opiniones de los usuarios frente a sus visitas; esto para finalmente en el proceso de visualización los datos obtenidos como resultados puedan ser plasmados en gráficas que permiten su entendimiento y comprensión. Finalmente, el proyecto presenta una serie de conclusiones frente a los resultados obtenidos con la arquitectura. La arquitectura está basada en el proyecto de investigación Doctoral de la Pontificia Universidad Javeriana “Modelo multimodal para el análisis de sentimientos en un dominio turístico”.This project proposes the development of a Big data architecture that allows evaluating the satisfaction of users of the tourism sector in the department of Boyacá Colombia through the analysis of multimodal sentiments, through a series of parameters in the extraction of data to tools such as Booking, TripAdvisor and twitter, facilitating the analysis of user sentiment through polarity variables, this in order to know the opinion of users regarding the tourism sector of the department of Boyacá. The project addresses three fundamental points within the development of the architecture: data extraction, data analysis and visualization. These points establish a starting point within the development of architecture; since the sub-points of the three initial parameters seek the proper functioning and development of the architecture. The extraction includes the use of the web scraper tool in charge of extracting data from the aforementioned tools for later use in the second parameter, the analysis; At this point, it is intended that the data obtained from the extraction be subjected to the polarity process that allows determining the emotions and opinions of the users regarding their visits; this for finally in the visualization process the data obtained as results can be captured in graphs that allow their understanding and comprehension. Finally, the project presents a series of conclusions regarding the results obtained with architecture based on its objective.Ingeniero InformáticoPregradoapplication/pdfspaUniversidad Santo TomásIngeniería InformáticaFacultad de Ingeniería de SistemasAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.Sentiment analysisBig DataExtractionWeb ScraperTourismTurismoArquitecturaAnálisis de sentimientosBig DataExtracciónTurismoWeb ScraperTrabajo de gradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisCRAI-USTA TunjaIngenioVirtual. (s.f.). IngenioVirtual. Obtenido de https://www.ingeniovirtual.com/tipos-de-graficos-y-diagramas-para-la-visualizacion-de-datos/3.0, E. (30 de Septiembre de 2020). Obtenido de https://www.educaciontrespuntocero.com/recursos/crear-una-nube-tags-las-palabras-mas-usadas-texto/300/1996, L. (1996).Ahmed, I. (27 de Noviembre de 2020). Astera. Obtenido de https://www.astera.com/es/type/blog/automated-data-extraction-tools-for-faster-insights/Akram Hernandez Vásquez, H. C. (2019). MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE. Obtenido de MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE: https://www.scielosp.org/pdf/rpmesp/2019.v36n1/128-133/esAntonio Manuel Rodriguez Garcia, F. R. (2019). Píxel-BIT Revista de Medios y Educación. Obtenido de Píxel-BIT Revista de Medios y Educación: https://idus.us.es/bitstream/handle/11441/93761/Rodriguez-Garcia%20-%20competencia%20digital_removed.pdf?sequence=1&isAllowed=yBBVA API_Market. (11 de Enero de 2016). Obtenido de https://www.bbvaapimarket.com/es/mundo-api/herramientas-de-extraccion-de-datos-para-principiantes-y-profesionales/Bordignon, G. H. (s.f.). Introducción a la Recuperación de Información. Obtenido de http://eprints.rclis.org/12243/1/Introduccion-RI-v9f.pdfBoyacá Visión 2019. (2019).Carina Sofía Andrade and Maribel Yasmina Santos. (2017).Cesteros, A. F.-P. (2018). La eficacia del análisis de sentimientos para la empresa: el caso de estudio Dell Technologies Inc. MADRID. Obtenido de https://www.ucm.es/data/cont/docs/758-2019-01-04-TFG_Panico_Chiara_TFG.pdfclicdata. (s.f.). clicdata. Obtenido de https://www.clicdata.com/es/ejemplos/project-management/conceptodefinicion. (s.f.). conceptodefinicion. Obtenido de https://conceptodefinicion.de/histograma/datavizcatalogue. (s.f.). datavizcatalogue. Obtenido de https://datavizcatalogue.com/ES/metodos/grafica_de_area.htmlDe Rojas y Camarero, 2008; Rivera,2013. (2013). Visitors experience, mood and satisfaction in A heritage context: Evidence from an interpretation center. Tourism Management, 525-537.Departamento Administrativo Nacional de Estadistica. (s.f.).Divakar Mysore. (2013).Divakar Mysore, S. K. (17 de Septiembre de 2013). IBM. Obtenido de https://developer.ibm.com/es/technologies/analytics/articles/bd-archpatterns1/Dlib. (2020). Dlib. Obtenido de Dlib: http://dlib.net/Earl, M. (28 de Julio de 2015). Obtenido de https://matthewearl.github.io/2015/07/28/switching-eds-with-python/ecured. (s.f.). ecured. Obtenido de https://www.ecured.cu/CartogramaErik Cambria, A. H. (2012). Sentic Album: Content-, Concept-, and Context-Based Online. Science+Business Media, LLC 2012. Obtenido de https://sentic.net/sentic-album.pdfEstadística, P. y. (27 de Mayo de 2012). Probabilidad y Estadística. Obtenido de http://probabilidadyestadisticaitsav.blogspot.com/2012/05/16-diagrama-de-arbol.htmlFacultad de Estudios Estadisticos, Universidad Complutense de Madrid. (2020). Obtenido de https://www.masterBigdataucm.com/que-es-Big-data/freepik. (2018). freepik. Obtenido de https://www.freepik.es/vector-gratis/ilustracion-burbujas-discurso-nube_2904317.htmgamavision. (01 de Julio de 2020). gamavision. Obtenido de https://www.gamavision.com.ec/pros-y-contras-del-reconocimiento-facial/García, S. M. (1997). Psicosociología del ocio y el turismo. Málaga: Algibe.geeksforgeeks. (24 de Mayo de 2020). geeksforgeeks. Obtenido de https://www.geeksforgeeks.org/opencv-facial-landmarks-and-face-detection-using-dlib-and-opencv/gisandbeers. (17 de Marzo de 2019). gisandbeers. Obtenido de http://www.gisandbeers.com/crear-mapas-calor-heatmaps/Gómez, J. C. (10 de Enero de 2020). Obtenido de https://josecantero.com/uncategorized/tendencias-en-turismo-experiencial-en-2020-bienvenidos-a-la-decada/HAA DnL. (s.f.). HAA DnL. Obtenido de https://sites.google.com/site/haadnl/home/diagrama-radialHong, M. K. (2017). Unstructured Social Media Data Mining System Based on Emotional Database and Unstructured Information Management Architecture Framework. ASP.Jacinto, G. (1995). Psicología social del turismo. Psicología Social de la Educación y de la Cultura, Ocio, Deporte y Turismo. Salamanca, 245-272.José Augusto Cadena Moreano, R. H. (2017). RECONOCIMIENTO FACIAL CON BASE EN IMÁGENES. B O L E T Í N V I R T U A L - M A Y O - V O L 6 - 5 I S N N 2 2 6 6 - 1 5 3 6. Obtenido de file:///C:/Users/Usuario/Downloads/Dialnet-ReconocimientoFacialConBaseEnImagenes-6145639.pdfJosé Luis García Cué, J. A. (Octubre de 2008). Revista Estilos de Aprendizaje. Obtenido de Revista Estilos de Aprendizaje: http://revistaestilosdeaprendizaje.com/article/view/852/1540Kanuk y Schiffman . (s.f.).La Vanguardia. (11 de enero de 2020). Obtenido de https://www.vanguardia.com/economia/nacional/turismo-hara-importante-aporte-en-el-pib-del-pais-XM1860653lucidchart. (s.f.). lucidchart. Obtenido de https://www.lucidchart.com/pages/es/que-es-un-diagrama-de-flujoMartín, S. (1997).Martinez, J. L. (08 de Junio de 2014). slideshare. Obtenido de https://es.slideshare.net/joseluis199222/tabla-de-resultados-obtenidos-mecanismos-1McCannell. (1976). The Tourist. New York.Mckercher. (1999).McKercher, B. (1999). A chaos approach to tourism. Tourism Management, 425- 434.Mérida, C. (2014). Modelo arquitectónico de información para una plataforma de Big Data para el Sector Turístico. Lima, Perú.microsoft. (15 de Junio de 2016). microsoft. Obtenido de https://docs.microsoft.com/es-es/sql/reporting-services/tutorial-add-a-pie-chart-to-your-report-report-builder?view=sql-server-ver15Molina et al. 2007; Troitiño, 1991. (1991). Segmentación de la demanda turística: Un análisis aplicado a un destino cultural. Revista de análisis turístico n° 4, 36-48.Montaner, J. (1996). Psicosociología del turismo. Barcelona: Sintesis.NodeJS. (2020). NodeJS. Obtenido de NodeJS: https://nodejs.org/es/docs/npm ejs. (2020). npm ejs. Obtenido de npm ejs: https://www.npmjs.com/package/ejsnpm express. (2020). npm express. Obtenido de npm express: https://www.npmjs.com/package/expressnpm mongoose. (2020). npm mongoose. Obtenido de npm mongoose: https://www.npmjs.com/package/mongoosenpm morgan. (2020). npm morgan. Obtenido de npm morgan: https://www.npmjs.com/package/morgannpm nodemon. (2020). npm nodemon. Obtenido de npm nodemon: https://www.npmjs.com/package/nodemonNumpy. (2020). Numpy. Obtenido de Numpy: https://numpy.org/doc/Pandas. (2019). Pandas. Obtenido de Pandas: https://pandas.pydata.org/docs/Paul Viola, M. J. (2001). Rapid Object Detection using a Boosted Cascade of Simple Features. Obtenido de https://web.iitd.ac.in/~sumeet/viola-cvpr-01.pdfPauli, P. A. (2019). Análisis de sentimiento. Comparación de algoritmos predictivos y métodos utilizando un lexicon español. BUENOS AIRES: INSTITUTO TECNOLÓGICO DE BUENOS AIRES – ITBA. Obtenido de https://ri.itba.edu.ar/bitstream/handle/123456789/1782/Proyecto%20Final.pdf?sequence=1&isAllowed=yPearce, P. (1993). Fundamentals of Tourist Motivation. Tourism Research: Critiques and Challenges.Pine & Gilmore. (1998). The experience economy: Work is Theater& Every Business a Stage. Harvard Business School Press.practicobaul. (s.f.). practicobaul. Obtenido de https://sites.google.com/site/unpracticobaul/tablas-en-un-textoQuestionPro. (2020). QuestionPro. Obtenido de QuestionPro: https://www.questionpro.com/es/analisis-de-datos.html#:~:text=El%20an%C3%A1lisis%20de%20datos%20es%20la%20ciencia%20que%20se%20encarga,los%20conocimientos%20sobre%20diversos%20temas.Redacción España. (18 de Noviembre de 2019). B12. Obtenido de https://agenciab12.mx/noticia/diferencia-datos-estructurados-y-datos-no-estructuradosRevuelta-Domínguez, F. I. (Diciembre de 2012). researchgate.net. Obtenido de https://www.researchgate.net/figure/Figura-4-Representacion-grafica-de-la-red-segun-el-grado_fig1_266025222RICHARDS. (2004). Diputació de Barcelona. Obtenido de www.diba.es/cerc/arxinterac04/arcem1/richards/dipbarcelonaRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfSande, J. C. (2018). Análisis de sentimientos en Twitter. UOC, Universitat Oberta de Catalunya, 99. Obtenido de http://openaccess.uoc.edu/webapps/o2/bitstream/10609/81435/6/jsobrinosTFM0618memoria.pdfSchiffman, L. &. (1983). Consumer behavior. Englewood Cliffs: Prentice Hall.Scikit-Learn. (2019). Scikit-Learn. Obtenido de Scikit-Learn: https://scikit-learn.org/0.21/documentation.htmlSenticNet. (2018). SenticNet. Obtenido de SenticNet: https://sentic.net/support.minitab. (2020). /support.minitab. Obtenido de https://support.minitab.com/es-mx/minitab/19/help-and-how-to/graphs/matrix-plot/before-you-start/overview/themexpert. (s.f.). themexpert. Obtenido de https://www.themexpert.com/docs/quix/elements/polar-area-chartTIBCO. (s.f.). TIBCO. Obtenido de https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-ES/WebHelp/GUID-6023CECC-E502-4AE1-B5C5-FFE5DAF6FAE2.htmlTremolosa. (2002). ACTIVIDAD DE OCIO-TURÍSTICO.Universidad Alcala. (s.f.).Universidad de Alcalá. (2020). Obtenido de https://www.master-Bigdata.com/Big-data-actualmente-tan-importante/Vasavi Gajarla, A. G. (s.f.). Emotion Detection and Sentiment Analysis of Images. Obtenido de https://www.cc.gatech.edu/~hays/7476/projects/Aditi_Vasavi.pdfVieira, D. (06 de Mayo de 2019). rockcontent. Obtenido de https://rockcontent.com/es/blog/que-es-diagrama-de-gantt/Zambrano, D. M. (2017). Innovación para el Análisis de Sentimientos en Texto, una revisión de la técnica actual aplicando metodologías de crowdsourcing. researchgate. Obtenido de file:///C:/Users/Usuario/Downloads/340-940-1-PB.pdfCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repository.usta.edu.co/bitstream/11634/35065/4/license_rdf217700a34da79ed616c2feb68d4c5e06MD54open accessORIGINAL2021.cristianalgecira.pdf2021.cristianalgecira.pdfTrabajo de Gradoapplication/pdf2374796https://repository.usta.edu.co/bitstream/11634/35065/6/2021.cristianalgecira.pdfe4ec3551bb3c5fac4d5b1add36bf3a08MD56open accessCarta autorización de derechos de autor.pdfCarta autorización de derechos de autor.pdfCarta Derechos de Autorapplication/pdf103338https://repository.usta.edu.co/bitstream/11634/35065/7/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdfe91a4e8cc0da99c52f9f3b4c4f04b3e9MD57metadata only accessCarta autorización de facultadCarta autorización de facultadCarta Aprobación Facultadapplication/pdf453456https://repository.usta.edu.co/bitstream/11634/35065/8/Carta%20autorizaci%c3%b3n%20de%20facultad2308cce1edb85d54becac5b1342c5400MD58metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8807https://repository.usta.edu.co/bitstream/11634/35065/9/license.txtaedeaf396fcd827b537c73d23464fc27MD59open accessTHUMBNAIL2021.cristianalgecira.pdf.jpg2021.cristianalgecira.pdf.jpgIM Thumbnailimage/jpeg4296https://repository.usta.edu.co/bitstream/11634/35065/10/2021.cristianalgecira.pdf.jpgecc476f8f3d74d7ba55f8bc19e675e92MD510open accessCarta autorización de derechos de autor.pdf.jpgCarta autorización de derechos de autor.pdf.jpgIM Thumbnailimage/jpeg7677https://repository.usta.edu.co/bitstream/11634/35065/11/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdf.jpg16d6462ef41b9ebe8d06a3be8dd05d0fMD511open accessCarta autorización de facultad.jpgCarta autorización de facultad.jpgIM Thumbnailimage/jpeg8751https://repository.usta.edu.co/bitstream/11634/35065/12/Carta%20autorizaci%c3%b3n%20de%20facultad.jpgabded5c00f7e9397cb83def519621aa2MD512open access11634/35065oai:repository.usta.edu.co:11634/350652022-10-21 03:02:58.462open accessRepositorio Universidad Santo Tomásrepositorio@usantotomas.edu.coQXV0b3Jpem8gYWwgQ2VudHJvIGRlIFJlY3Vyc29zIHBhcmEgZWwgQXByZW5kaXphamUgeSBsYSBJbnZlc3RpZ2FjacOzbiwgQ1JBSS1VU1RBCmRlIGxhIFVuaXZlcnNpZGFkIFNhbnRvIFRvbcOhcywgcGFyYSBxdWUgY29uIGZpbmVzIGFjYWTDqW1pY29zIGFsbWFjZW5lIGxhCmluZm9ybWFjacOzbiBpbmdyZXNhZGEgcHJldmlhbWVudGUuCgpTZSBwZXJtaXRlIGxhIGNvbnN1bHRhLCByZXByb2R1Y2Npw7NuIHBhcmNpYWwsIHRvdGFsIG8gY2FtYmlvIGRlIGZvcm1hdG8gY29uCmZpbmVzIGRlIGNvbnNlcnZhY2nDs24sIGEgbG9zIHVzdWFyaW9zIGludGVyZXNhZG9zIGVuIGVsIGNvbnRlbmlkbyBkZSBlc3RlCnRyYWJham8sIHBhcmEgdG9kb3MgbG9zIHVzb3MgcXVlIHRlbmdhbiBmaW5hbGlkYWQgYWNhZMOpbWljYSwgc2llbXByZSB5IGN1YW5kbwptZWRpYW50ZSBsYSBjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkw6kgY3LDqWRpdG8gYWwgdHJhYmFqbyBkZQpncmFkbyB5IGEgc3UgYXV0b3IuIERlIGNvbmZvcm1pZGFkIGNvbiBsbyBlc3RhYmxlY2lkbyBlbiBlbCBhcnTDrWN1bG8gMzAgZGUgbGEKTGV5IDIzIGRlIDE5ODIgeSBlbCBhcnTDrWN1bG8gMTEgZGUgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5Mywg4oCcTG9zIGRlcmVjaG9zCm1vcmFsZXMgc29icmUgZWwgdHJhYmFqbyBzb24gcHJvcGllZGFkIGRlIGxvcyBhdXRvcmVz4oCdLCBsb3MgY3VhbGVzIHNvbgppcnJlbnVuY2lhYmxlcywgaW1wcmVzY3JpcHRpYmxlcywgaW5lbWJhcmdhYmxlcyBlIGluYWxpZW5hYmxlcy4K