Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.
El presente proyecto propone el desarrollo de una arquitectura de Big data que permita evaluar la satisfacción de los usuarios del sector turístico del departamento de Boyacá Colombia mediante el análisis de sentimientos multimodales, a través de una serie de parámetros en la extracción de datos a h...
- Autores:
-
Algecira Arbelaez, Cristian David
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2021
- Institución:
- Universidad Santo Tomás
- Repositorio:
- Repositorio Institucional USTA
- Idioma:
- spa
- OAI Identifier:
- oai:repository.usta.edu.co:11634/35065
- Acceso en línea:
- http://hdl.handle.net/11634/35065
- Palabra clave:
- Sentiment analysis
Big Data
Extraction
Web Scraper
Tourism
Turismo
Arquitectura
Análisis de sentimientos
Big Data
Extracción
Turismo
Web Scraper
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 2.5 Colombia
id |
SANTTOMAS2_45d52c8579c2c8b83c56012069bbfbd6 |
---|---|
oai_identifier_str |
oai:repository.usta.edu.co:11634/35065 |
network_acronym_str |
SANTTOMAS2 |
network_name_str |
Repositorio Institucional USTA |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. |
title |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. |
spellingShingle |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. Sentiment analysis Big Data Extraction Web Scraper Tourism Turismo Arquitectura Análisis de sentimientos Big Data Extracción Turismo Web Scraper |
title_short |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. |
title_full |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. |
title_fullStr |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. |
title_full_unstemmed |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. |
title_sort |
Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia. |
dc.creator.fl_str_mv |
Algecira Arbelaez, Cristian David |
dc.contributor.advisor.none.fl_str_mv |
Monsalve Pulido, Julián Alberto |
dc.contributor.author.none.fl_str_mv |
Algecira Arbelaez, Cristian David |
dc.contributor.corporatename.spa.fl_str_mv |
Universidad Santo Tomas Universidad Santo Tomás |
dc.subject.keyword.spa.fl_str_mv |
Sentiment analysis Big Data Extraction Web Scraper Tourism |
topic |
Sentiment analysis Big Data Extraction Web Scraper Tourism Turismo Arquitectura Análisis de sentimientos Big Data Extracción Turismo Web Scraper |
dc.subject.lemb.spa.fl_str_mv |
Turismo Arquitectura |
dc.subject.proposal.spa.fl_str_mv |
Análisis de sentimientos Big Data Extracción Turismo Web Scraper |
description |
El presente proyecto propone el desarrollo de una arquitectura de Big data que permita evaluar la satisfacción de los usuarios del sector turístico del departamento de Boyacá Colombia mediante el análisis de sentimientos multimodales, a través de una serie de parámetros en la extracción de datos a herramientas como Booking, TripAdvisor y twitter, facilitando el análisis de los sentimiento del usuario por medio de variables de polaridad, esto con tal de conocer la opinión de los usuarios frente al sector turístico del departamento de Boyacá. El proyecto atiende a tres puntos fundamentales dentro del desarrollo de la arquitectura: extracción de datos, análisis de datos y visualización. Dichos puntos establecen un punto de partida dentro del desarrollo de la arquitectura; puesto que los subpuntos de los tres parámetros iniciales buscan el buen funcionamiento y desarrollo de la arquitectura. La extracción comprende el uso de la herramienta webs scraper encargada de la extracción de datos de las herramientas ya mencionadas para posterior uso en el segundo parámetro, el análisis; en este punto se pretende que los datos obtenidos de la extracción se sometan al proceso de polaridad que permita determinar las emociones y opiniones de los usuarios frente a sus visitas; esto para finalmente en el proceso de visualización los datos obtenidos como resultados puedan ser plasmados en gráficas que permiten su entendimiento y comprensión. Finalmente, el proyecto presenta una serie de conclusiones frente a los resultados obtenidos con la arquitectura. La arquitectura está basada en el proyecto de investigación Doctoral de la Pontificia Universidad Javeriana “Modelo multimodal para el análisis de sentimientos en un dominio turístico”. |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-07-26T22:03:36Z |
dc.date.available.none.fl_str_mv |
2021-07-26T22:03:36Z |
dc.date.issued.none.fl_str_mv |
2021-07-13 |
dc.type.local.spa.fl_str_mv |
Trabajo de grado |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.drive.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
acceptedVersion |
dc.identifier.citation.spa.fl_str_mv |
Algecira Arbelaez, C. D. (2021). Arquitectura de big data para el análisis de sentimientos multimodales en el sector turístico del departamento de Boyacá, Colombia [Tesis de grado, pregrado en Ingeniería de Sistemas]. Universidad Santo Tomás, Tunja |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/11634/35065 |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Universidad Santo Tomás |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Santo Tomás |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repository.usta.edu.co |
identifier_str_mv |
Algecira Arbelaez, C. D. (2021). Arquitectura de big data para el análisis de sentimientos multimodales en el sector turístico del departamento de Boyacá, Colombia [Tesis de grado, pregrado en Ingeniería de Sistemas]. Universidad Santo Tomás, Tunja reponame:Repositorio Institucional Universidad Santo Tomás instname:Universidad Santo Tomás repourl:https://repository.usta.edu.co |
url |
http://hdl.handle.net/11634/35065 |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
IngenioVirtual. (s.f.). IngenioVirtual. Obtenido de https://www.ingeniovirtual.com/tipos-de-graficos-y-diagramas-para-la-visualizacion-de-datos/ 3.0, E. (30 de Septiembre de 2020). Obtenido de https://www.educaciontrespuntocero.com/recursos/crear-una-nube-tags-las-palabras-mas-usadas-texto/ 300/1996, L. (1996). Ahmed, I. (27 de Noviembre de 2020). Astera. Obtenido de https://www.astera.com/es/type/blog/automated-data-extraction-tools-for-faster-insights/ Akram Hernandez Vásquez, H. C. (2019). MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE. Obtenido de MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE: https://www.scielosp.org/pdf/rpmesp/2019.v36n1/128-133/es Antonio Manuel Rodriguez Garcia, F. R. (2019). Píxel-BIT Revista de Medios y Educación. Obtenido de Píxel-BIT Revista de Medios y Educación: https://idus.us.es/bitstream/handle/11441/93761/Rodriguez-Garcia%20-%20competencia%20digital_removed.pdf?sequence=1&isAllowed=y BBVA API_Market. (11 de Enero de 2016). Obtenido de https://www.bbvaapimarket.com/es/mundo-api/herramientas-de-extraccion-de-datos-para-principiantes-y-profesionales/ Bordignon, G. H. (s.f.). Introducción a la Recuperación de Información. Obtenido de http://eprints.rclis.org/12243/1/Introduccion-RI-v9f.pdf Boyacá Visión 2019. (2019). Carina Sofía Andrade and Maribel Yasmina Santos. (2017). Cesteros, A. F.-P. (2018). La eficacia del análisis de sentimientos para la empresa: el caso de estudio Dell Technologies Inc. MADRID. Obtenido de https://www.ucm.es/data/cont/docs/758-2019-01-04-TFG_Panico_Chiara_TFG.pdf clicdata. (s.f.). clicdata. Obtenido de https://www.clicdata.com/es/ejemplos/project-management/ conceptodefinicion. (s.f.). conceptodefinicion. Obtenido de https://conceptodefinicion.de/histograma/ datavizcatalogue. (s.f.). datavizcatalogue. Obtenido de https://datavizcatalogue.com/ES/metodos/grafica_de_area.html De Rojas y Camarero, 2008; Rivera,2013. (2013). Visitors experience, mood and satisfaction in A heritage context: Evidence from an interpretation center. Tourism Management, 525-537. Departamento Administrativo Nacional de Estadistica. (s.f.). Divakar Mysore. (2013). Divakar Mysore, S. K. (17 de Septiembre de 2013). IBM. Obtenido de https://developer.ibm.com/es/technologies/analytics/articles/bd-archpatterns1/ Dlib. (2020). Dlib. Obtenido de Dlib: http://dlib.net/ Earl, M. (28 de Julio de 2015). Obtenido de https://matthewearl.github.io/2015/07/28/switching-eds-with-python/ ecured. (s.f.). ecured. Obtenido de https://www.ecured.cu/Cartograma Erik Cambria, A. H. (2012). Sentic Album: Content-, Concept-, and Context-Based Online. Science+Business Media, LLC 2012. Obtenido de https://sentic.net/sentic-album.pdf Estadística, P. y. (27 de Mayo de 2012). Probabilidad y Estadística. Obtenido de http://probabilidadyestadisticaitsav.blogspot.com/2012/05/16-diagrama-de-arbol.html Facultad de Estudios Estadisticos, Universidad Complutense de Madrid. (2020). Obtenido de https://www.masterBigdataucm.com/que-es-Big-data/ freepik. (2018). freepik. Obtenido de https://www.freepik.es/vector-gratis/ilustracion-burbujas-discurso-nube_2904317.htm gamavision. (01 de Julio de 2020). gamavision. Obtenido de https://www.gamavision.com.ec/pros-y-contras-del-reconocimiento-facial/ García, S. M. (1997). Psicosociología del ocio y el turismo. Málaga: Algibe. geeksforgeeks. (24 de Mayo de 2020). geeksforgeeks. Obtenido de https://www.geeksforgeeks.org/opencv-facial-landmarks-and-face-detection-using-dlib-and-opencv/ gisandbeers. (17 de Marzo de 2019). gisandbeers. Obtenido de http://www.gisandbeers.com/crear-mapas-calor-heatmaps/ Gómez, J. C. (10 de Enero de 2020). Obtenido de https://josecantero.com/uncategorized/tendencias-en-turismo-experiencial-en-2020-bienvenidos-a-la-decada/ HAA DnL. (s.f.). HAA DnL. Obtenido de https://sites.google.com/site/haadnl/home/diagrama-radial Hong, M. K. (2017). Unstructured Social Media Data Mining System Based on Emotional Database and Unstructured Information Management Architecture Framework. ASP. Jacinto, G. (1995). Psicología social del turismo. Psicología Social de la Educación y de la Cultura, Ocio, Deporte y Turismo. Salamanca, 245-272. José Augusto Cadena Moreano, R. H. (2017). RECONOCIMIENTO FACIAL CON BASE EN IMÁGENES. B O L E T Í N V I R T U A L - M A Y O - V O L 6 - 5 I S N N 2 2 6 6 - 1 5 3 6. Obtenido de file:///C:/Users/Usuario/Downloads/Dialnet-ReconocimientoFacialConBaseEnImagenes-6145639.pdf José Luis García Cué, J. A. (Octubre de 2008). Revista Estilos de Aprendizaje. Obtenido de Revista Estilos de Aprendizaje: http://revistaestilosdeaprendizaje.com/article/view/852/1540 Kanuk y Schiffman . (s.f.). La Vanguardia. (11 de enero de 2020). Obtenido de https://www.vanguardia.com/economia/nacional/turismo-hara-importante-aporte-en-el-pib-del-pais-XM1860653 lucidchart. (s.f.). lucidchart. Obtenido de https://www.lucidchart.com/pages/es/que-es-un-diagrama-de-flujo Martín, S. (1997). Martinez, J. L. (08 de Junio de 2014). slideshare. Obtenido de https://es.slideshare.net/joseluis199222/tabla-de-resultados-obtenidos-mecanismos-1 McCannell. (1976). The Tourist. New York. Mckercher. (1999). McKercher, B. (1999). A chaos approach to tourism. Tourism Management, 425- 434. Mérida, C. (2014). Modelo arquitectónico de información para una plataforma de Big Data para el Sector Turístico. Lima, Perú. microsoft. (15 de Junio de 2016). microsoft. Obtenido de https://docs.microsoft.com/es-es/sql/reporting-services/tutorial-add-a-pie-chart-to-your-report-report-builder?view=sql-server-ver15 Molina et al. 2007; Troitiño, 1991. (1991). Segmentación de la demanda turística: Un análisis aplicado a un destino cultural. Revista de análisis turístico n° 4, 36-48. Montaner, J. (1996). Psicosociología del turismo. Barcelona: Sintesis. NodeJS. (2020). NodeJS. Obtenido de NodeJS: https://nodejs.org/es/docs/ npm ejs. (2020). npm ejs. Obtenido de npm ejs: https://www.npmjs.com/package/ejs npm express. (2020). npm express. Obtenido de npm express: https://www.npmjs.com/package/express npm mongoose. (2020). npm mongoose. Obtenido de npm mongoose: https://www.npmjs.com/package/mongoose npm morgan. (2020). npm morgan. Obtenido de npm morgan: https://www.npmjs.com/package/morgan npm nodemon. (2020). npm nodemon. Obtenido de npm nodemon: https://www.npmjs.com/package/nodemon Numpy. (2020). Numpy. Obtenido de Numpy: https://numpy.org/doc/ Pandas. (2019). Pandas. Obtenido de Pandas: https://pandas.pydata.org/docs/ Paul Viola, M. J. (2001). Rapid Object Detection using a Boosted Cascade of Simple Features. Obtenido de https://web.iitd.ac.in/~sumeet/viola-cvpr-01.pdf Pauli, P. A. (2019). Análisis de sentimiento. Comparación de algoritmos predictivos y métodos utilizando un lexicon español. BUENOS AIRES: INSTITUTO TECNOLÓGICO DE BUENOS AIRES – ITBA. Obtenido de https://ri.itba.edu.ar/bitstream/handle/123456789/1782/Proyecto%20Final.pdf?sequence=1&isAllowed=y Pearce, P. (1993). Fundamentals of Tourist Motivation. Tourism Research: Critiques and Challenges. Pine & Gilmore. (1998). The experience economy: Work is Theater& Every Business a Stage. Harvard Business School Press. practicobaul. (s.f.). practicobaul. Obtenido de https://sites.google.com/site/unpracticobaul/tablas-en-un-texto QuestionPro. (2020). QuestionPro. Obtenido de QuestionPro: https://www.questionpro.com/es/analisis-de-datos.html#:~:text=El%20an%C3%A1lisis%20de%20datos%20es%20la%20ciencia%20que%20se%20encarga,los%20conocimientos%20sobre%20diversos%20temas. Redacción España. (18 de Noviembre de 2019). B12. Obtenido de https://agenciab12.mx/noticia/diferencia-datos-estructurados-y-datos-no-estructurados Revuelta-Domínguez, F. I. (Diciembre de 2012). researchgate.net. Obtenido de https://www.researchgate.net/figure/Figura-4-Representacion-grafica-de-la-red-segun-el-grado_fig1_266025222 RICHARDS. (2004). Diputació de Barcelona. Obtenido de www.diba.es/cerc/arxinterac04/arcem1/richards/dipbarcelona Rober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdf Sande, J. C. (2018). Análisis de sentimientos en Twitter. UOC, Universitat Oberta de Catalunya, 99. Obtenido de http://openaccess.uoc.edu/webapps/o2/bitstream/10609/81435/6/jsobrinosTFM0618memoria.pdf Schiffman, L. &. (1983). Consumer behavior. Englewood Cliffs: Prentice Hall. Scikit-Learn. (2019). Scikit-Learn. Obtenido de Scikit-Learn: https://scikit-learn.org/0.21/documentation.html SenticNet. (2018). SenticNet. Obtenido de SenticNet: https://sentic.net/ support.minitab. (2020). /support.minitab. Obtenido de https://support.minitab.com/es-mx/minitab/19/help-and-how-to/graphs/matrix-plot/before-you-start/overview/ themexpert. (s.f.). themexpert. Obtenido de https://www.themexpert.com/docs/quix/elements/polar-area-chart TIBCO. (s.f.). TIBCO. Obtenido de https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-ES/WebHelp/GUID-6023CECC-E502-4AE1-B5C5-FFE5DAF6FAE2.html Tremolosa. (2002). ACTIVIDAD DE OCIO-TURÍSTICO. Universidad Alcala. (s.f.). Universidad de Alcalá. (2020). Obtenido de https://www.master-Bigdata.com/Big-data-actualmente-tan-importante/ Vasavi Gajarla, A. G. (s.f.). Emotion Detection and Sentiment Analysis of Images. Obtenido de https://www.cc.gatech.edu/~hays/7476/projects/Aditi_Vasavi.pdf Vieira, D. (06 de Mayo de 2019). rockcontent. Obtenido de https://rockcontent.com/es/blog/que-es-diagrama-de-gantt/ Zambrano, D. M. (2017). Innovación para el Análisis de Sentimientos en Texto, una revisión de la técnica actual aplicando metodologías de crowdsourcing. researchgate. Obtenido de file:///C:/Users/Usuario/Downloads/340-940-1-PB.pdf |
dc.rights.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.campus.spa.fl_str_mv |
CRAI-USTA Tunja |
dc.publisher.spa.fl_str_mv |
Universidad Santo Tomás |
dc.publisher.program.spa.fl_str_mv |
Ingeniería Informática |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería de Sistemas |
institution |
Universidad Santo Tomás |
bitstream.url.fl_str_mv |
https://repository.usta.edu.co/bitstream/11634/35065/4/license_rdf https://repository.usta.edu.co/bitstream/11634/35065/6/2021.cristianalgecira.pdf https://repository.usta.edu.co/bitstream/11634/35065/7/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdf https://repository.usta.edu.co/bitstream/11634/35065/8/Carta%20autorizaci%c3%b3n%20de%20facultad https://repository.usta.edu.co/bitstream/11634/35065/9/license.txt https://repository.usta.edu.co/bitstream/11634/35065/10/2021.cristianalgecira.pdf.jpg https://repository.usta.edu.co/bitstream/11634/35065/11/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdf.jpg https://repository.usta.edu.co/bitstream/11634/35065/12/Carta%20autorizaci%c3%b3n%20de%20facultad.jpg |
bitstream.checksum.fl_str_mv |
217700a34da79ed616c2feb68d4c5e06 e4ec3551bb3c5fac4d5b1add36bf3a08 e91a4e8cc0da99c52f9f3b4c4f04b3e9 2308cce1edb85d54becac5b1342c5400 aedeaf396fcd827b537c73d23464fc27 ecc476f8f3d74d7ba55f8bc19e675e92 16d6462ef41b9ebe8d06a3be8dd05d0f abded5c00f7e9397cb83def519621aa2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Universidad Santo Tomás |
repository.mail.fl_str_mv |
repositorio@usantotomas.edu.co |
_version_ |
1782026225420599296 |
spelling |
Monsalve Pulido, Julián AlbertoAlgecira Arbelaez, Cristian DavidUniversidad Santo TomasUniversidad Santo Tomás2021-07-26T22:03:36Z2021-07-26T22:03:36Z2021-07-13Algecira Arbelaez, C. D. (2021). Arquitectura de big data para el análisis de sentimientos multimodales en el sector turístico del departamento de Boyacá, Colombia [Tesis de grado, pregrado en Ingeniería de Sistemas]. Universidad Santo Tomás, Tunjahttp://hdl.handle.net/11634/35065reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coEl presente proyecto propone el desarrollo de una arquitectura de Big data que permita evaluar la satisfacción de los usuarios del sector turístico del departamento de Boyacá Colombia mediante el análisis de sentimientos multimodales, a través de una serie de parámetros en la extracción de datos a herramientas como Booking, TripAdvisor y twitter, facilitando el análisis de los sentimiento del usuario por medio de variables de polaridad, esto con tal de conocer la opinión de los usuarios frente al sector turístico del departamento de Boyacá. El proyecto atiende a tres puntos fundamentales dentro del desarrollo de la arquitectura: extracción de datos, análisis de datos y visualización. Dichos puntos establecen un punto de partida dentro del desarrollo de la arquitectura; puesto que los subpuntos de los tres parámetros iniciales buscan el buen funcionamiento y desarrollo de la arquitectura. La extracción comprende el uso de la herramienta webs scraper encargada de la extracción de datos de las herramientas ya mencionadas para posterior uso en el segundo parámetro, el análisis; en este punto se pretende que los datos obtenidos de la extracción se sometan al proceso de polaridad que permita determinar las emociones y opiniones de los usuarios frente a sus visitas; esto para finalmente en el proceso de visualización los datos obtenidos como resultados puedan ser plasmados en gráficas que permiten su entendimiento y comprensión. Finalmente, el proyecto presenta una serie de conclusiones frente a los resultados obtenidos con la arquitectura. La arquitectura está basada en el proyecto de investigación Doctoral de la Pontificia Universidad Javeriana “Modelo multimodal para el análisis de sentimientos en un dominio turístico”.This project proposes the development of a Big data architecture that allows evaluating the satisfaction of users of the tourism sector in the department of Boyacá Colombia through the analysis of multimodal sentiments, through a series of parameters in the extraction of data to tools such as Booking, TripAdvisor and twitter, facilitating the analysis of user sentiment through polarity variables, this in order to know the opinion of users regarding the tourism sector of the department of Boyacá. The project addresses three fundamental points within the development of the architecture: data extraction, data analysis and visualization. These points establish a starting point within the development of architecture; since the sub-points of the three initial parameters seek the proper functioning and development of the architecture. The extraction includes the use of the web scraper tool in charge of extracting data from the aforementioned tools for later use in the second parameter, the analysis; At this point, it is intended that the data obtained from the extraction be subjected to the polarity process that allows determining the emotions and opinions of the users regarding their visits; this for finally in the visualization process the data obtained as results can be captured in graphs that allow their understanding and comprehension. Finally, the project presents a series of conclusions regarding the results obtained with architecture based on its objective.Ingeniero InformáticoPregradoapplication/pdfspaUniversidad Santo TomásIngeniería InformáticaFacultad de Ingeniería de SistemasAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Arquitectura de Big Data para el análisis de sentimientos multimodales en el sector turístico del Departamento de Boyacá,Colombia.Sentiment analysisBig DataExtractionWeb ScraperTourismTurismoArquitecturaAnálisis de sentimientosBig DataExtracciónTurismoWeb ScraperTrabajo de gradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisCRAI-USTA TunjaIngenioVirtual. (s.f.). IngenioVirtual. Obtenido de https://www.ingeniovirtual.com/tipos-de-graficos-y-diagramas-para-la-visualizacion-de-datos/3.0, E. (30 de Septiembre de 2020). Obtenido de https://www.educaciontrespuntocero.com/recursos/crear-una-nube-tags-las-palabras-mas-usadas-texto/300/1996, L. (1996).Ahmed, I. (27 de Noviembre de 2020). Astera. Obtenido de https://www.astera.com/es/type/blog/automated-data-extraction-tools-for-faster-insights/Akram Hernandez Vásquez, H. C. (2019). MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE. Obtenido de MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE: https://www.scielosp.org/pdf/rpmesp/2019.v36n1/128-133/esAntonio Manuel Rodriguez Garcia, F. R. (2019). Píxel-BIT Revista de Medios y Educación. Obtenido de Píxel-BIT Revista de Medios y Educación: https://idus.us.es/bitstream/handle/11441/93761/Rodriguez-Garcia%20-%20competencia%20digital_removed.pdf?sequence=1&isAllowed=yBBVA API_Market. (11 de Enero de 2016). Obtenido de https://www.bbvaapimarket.com/es/mundo-api/herramientas-de-extraccion-de-datos-para-principiantes-y-profesionales/Bordignon, G. H. (s.f.). Introducción a la Recuperación de Información. Obtenido de http://eprints.rclis.org/12243/1/Introduccion-RI-v9f.pdfBoyacá Visión 2019. (2019).Carina Sofía Andrade and Maribel Yasmina Santos. (2017).Cesteros, A. F.-P. (2018). La eficacia del análisis de sentimientos para la empresa: el caso de estudio Dell Technologies Inc. MADRID. Obtenido de https://www.ucm.es/data/cont/docs/758-2019-01-04-TFG_Panico_Chiara_TFG.pdfclicdata. (s.f.). clicdata. Obtenido de https://www.clicdata.com/es/ejemplos/project-management/conceptodefinicion. (s.f.). conceptodefinicion. Obtenido de https://conceptodefinicion.de/histograma/datavizcatalogue. (s.f.). datavizcatalogue. Obtenido de https://datavizcatalogue.com/ES/metodos/grafica_de_area.htmlDe Rojas y Camarero, 2008; Rivera,2013. (2013). Visitors experience, mood and satisfaction in A heritage context: Evidence from an interpretation center. Tourism Management, 525-537.Departamento Administrativo Nacional de Estadistica. (s.f.).Divakar Mysore. (2013).Divakar Mysore, S. K. (17 de Septiembre de 2013). IBM. Obtenido de https://developer.ibm.com/es/technologies/analytics/articles/bd-archpatterns1/Dlib. (2020). Dlib. Obtenido de Dlib: http://dlib.net/Earl, M. (28 de Julio de 2015). Obtenido de https://matthewearl.github.io/2015/07/28/switching-eds-with-python/ecured. (s.f.). ecured. Obtenido de https://www.ecured.cu/CartogramaErik Cambria, A. H. (2012). Sentic Album: Content-, Concept-, and Context-Based Online. Science+Business Media, LLC 2012. Obtenido de https://sentic.net/sentic-album.pdfEstadística, P. y. (27 de Mayo de 2012). Probabilidad y Estadística. Obtenido de http://probabilidadyestadisticaitsav.blogspot.com/2012/05/16-diagrama-de-arbol.htmlFacultad de Estudios Estadisticos, Universidad Complutense de Madrid. (2020). Obtenido de https://www.masterBigdataucm.com/que-es-Big-data/freepik. (2018). freepik. Obtenido de https://www.freepik.es/vector-gratis/ilustracion-burbujas-discurso-nube_2904317.htmgamavision. (01 de Julio de 2020). gamavision. Obtenido de https://www.gamavision.com.ec/pros-y-contras-del-reconocimiento-facial/García, S. M. (1997). Psicosociología del ocio y el turismo. Málaga: Algibe.geeksforgeeks. (24 de Mayo de 2020). geeksforgeeks. Obtenido de https://www.geeksforgeeks.org/opencv-facial-landmarks-and-face-detection-using-dlib-and-opencv/gisandbeers. (17 de Marzo de 2019). gisandbeers. Obtenido de http://www.gisandbeers.com/crear-mapas-calor-heatmaps/Gómez, J. C. (10 de Enero de 2020). Obtenido de https://josecantero.com/uncategorized/tendencias-en-turismo-experiencial-en-2020-bienvenidos-a-la-decada/HAA DnL. (s.f.). HAA DnL. Obtenido de https://sites.google.com/site/haadnl/home/diagrama-radialHong, M. K. (2017). Unstructured Social Media Data Mining System Based on Emotional Database and Unstructured Information Management Architecture Framework. ASP.Jacinto, G. (1995). Psicología social del turismo. Psicología Social de la Educación y de la Cultura, Ocio, Deporte y Turismo. Salamanca, 245-272.José Augusto Cadena Moreano, R. H. (2017). RECONOCIMIENTO FACIAL CON BASE EN IMÁGENES. B O L E T Í N V I R T U A L - M A Y O - V O L 6 - 5 I S N N 2 2 6 6 - 1 5 3 6. Obtenido de file:///C:/Users/Usuario/Downloads/Dialnet-ReconocimientoFacialConBaseEnImagenes-6145639.pdfJosé Luis García Cué, J. A. (Octubre de 2008). Revista Estilos de Aprendizaje. Obtenido de Revista Estilos de Aprendizaje: http://revistaestilosdeaprendizaje.com/article/view/852/1540Kanuk y Schiffman . (s.f.).La Vanguardia. (11 de enero de 2020). Obtenido de https://www.vanguardia.com/economia/nacional/turismo-hara-importante-aporte-en-el-pib-del-pais-XM1860653lucidchart. (s.f.). lucidchart. Obtenido de https://www.lucidchart.com/pages/es/que-es-un-diagrama-de-flujoMartín, S. (1997).Martinez, J. L. (08 de Junio de 2014). slideshare. Obtenido de https://es.slideshare.net/joseluis199222/tabla-de-resultados-obtenidos-mecanismos-1McCannell. (1976). The Tourist. New York.Mckercher. (1999).McKercher, B. (1999). A chaos approach to tourism. Tourism Management, 425- 434.Mérida, C. (2014). Modelo arquitectónico de información para una plataforma de Big Data para el Sector Turístico. Lima, Perú.microsoft. (15 de Junio de 2016). microsoft. Obtenido de https://docs.microsoft.com/es-es/sql/reporting-services/tutorial-add-a-pie-chart-to-your-report-report-builder?view=sql-server-ver15Molina et al. 2007; Troitiño, 1991. (1991). Segmentación de la demanda turística: Un análisis aplicado a un destino cultural. Revista de análisis turístico n° 4, 36-48.Montaner, J. (1996). Psicosociología del turismo. Barcelona: Sintesis.NodeJS. (2020). NodeJS. Obtenido de NodeJS: https://nodejs.org/es/docs/npm ejs. (2020). npm ejs. Obtenido de npm ejs: https://www.npmjs.com/package/ejsnpm express. (2020). npm express. Obtenido de npm express: https://www.npmjs.com/package/expressnpm mongoose. (2020). npm mongoose. Obtenido de npm mongoose: https://www.npmjs.com/package/mongoosenpm morgan. (2020). npm morgan. Obtenido de npm morgan: https://www.npmjs.com/package/morgannpm nodemon. (2020). npm nodemon. Obtenido de npm nodemon: https://www.npmjs.com/package/nodemonNumpy. (2020). Numpy. Obtenido de Numpy: https://numpy.org/doc/Pandas. (2019). Pandas. Obtenido de Pandas: https://pandas.pydata.org/docs/Paul Viola, M. J. (2001). Rapid Object Detection using a Boosted Cascade of Simple Features. Obtenido de https://web.iitd.ac.in/~sumeet/viola-cvpr-01.pdfPauli, P. A. (2019). Análisis de sentimiento. Comparación de algoritmos predictivos y métodos utilizando un lexicon español. BUENOS AIRES: INSTITUTO TECNOLÓGICO DE BUENOS AIRES – ITBA. Obtenido de https://ri.itba.edu.ar/bitstream/handle/123456789/1782/Proyecto%20Final.pdf?sequence=1&isAllowed=yPearce, P. (1993). Fundamentals of Tourist Motivation. Tourism Research: Critiques and Challenges.Pine & Gilmore. (1998). The experience economy: Work is Theater& Every Business a Stage. Harvard Business School Press.practicobaul. (s.f.). practicobaul. Obtenido de https://sites.google.com/site/unpracticobaul/tablas-en-un-textoQuestionPro. (2020). QuestionPro. Obtenido de QuestionPro: https://www.questionpro.com/es/analisis-de-datos.html#:~:text=El%20an%C3%A1lisis%20de%20datos%20es%20la%20ciencia%20que%20se%20encarga,los%20conocimientos%20sobre%20diversos%20temas.Redacción España. (18 de Noviembre de 2019). B12. Obtenido de https://agenciab12.mx/noticia/diferencia-datos-estructurados-y-datos-no-estructuradosRevuelta-Domínguez, F. I. (Diciembre de 2012). researchgate.net. Obtenido de https://www.researchgate.net/figure/Figura-4-Representacion-grafica-de-la-red-segun-el-grado_fig1_266025222RICHARDS. (2004). Diputació de Barcelona. Obtenido de www.diba.es/cerc/arxinterac04/arcem1/richards/dipbarcelonaRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfSande, J. C. (2018). Análisis de sentimientos en Twitter. UOC, Universitat Oberta de Catalunya, 99. Obtenido de http://openaccess.uoc.edu/webapps/o2/bitstream/10609/81435/6/jsobrinosTFM0618memoria.pdfSchiffman, L. &. (1983). Consumer behavior. Englewood Cliffs: Prentice Hall.Scikit-Learn. (2019). Scikit-Learn. Obtenido de Scikit-Learn: https://scikit-learn.org/0.21/documentation.htmlSenticNet. (2018). SenticNet. Obtenido de SenticNet: https://sentic.net/support.minitab. (2020). /support.minitab. Obtenido de https://support.minitab.com/es-mx/minitab/19/help-and-how-to/graphs/matrix-plot/before-you-start/overview/themexpert. (s.f.). themexpert. Obtenido de https://www.themexpert.com/docs/quix/elements/polar-area-chartTIBCO. (s.f.). TIBCO. Obtenido de https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-ES/WebHelp/GUID-6023CECC-E502-4AE1-B5C5-FFE5DAF6FAE2.htmlTremolosa. (2002). ACTIVIDAD DE OCIO-TURÍSTICO.Universidad Alcala. (s.f.).Universidad de Alcalá. (2020). Obtenido de https://www.master-Bigdata.com/Big-data-actualmente-tan-importante/Vasavi Gajarla, A. G. (s.f.). Emotion Detection and Sentiment Analysis of Images. Obtenido de https://www.cc.gatech.edu/~hays/7476/projects/Aditi_Vasavi.pdfVieira, D. (06 de Mayo de 2019). rockcontent. Obtenido de https://rockcontent.com/es/blog/que-es-diagrama-de-gantt/Zambrano, D. M. (2017). Innovación para el Análisis de Sentimientos en Texto, una revisión de la técnica actual aplicando metodologías de crowdsourcing. researchgate. Obtenido de file:///C:/Users/Usuario/Downloads/340-940-1-PB.pdfCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repository.usta.edu.co/bitstream/11634/35065/4/license_rdf217700a34da79ed616c2feb68d4c5e06MD54open accessORIGINAL2021.cristianalgecira.pdf2021.cristianalgecira.pdfTrabajo de Gradoapplication/pdf2374796https://repository.usta.edu.co/bitstream/11634/35065/6/2021.cristianalgecira.pdfe4ec3551bb3c5fac4d5b1add36bf3a08MD56open accessCarta autorización de derechos de autor.pdfCarta autorización de derechos de autor.pdfCarta Derechos de Autorapplication/pdf103338https://repository.usta.edu.co/bitstream/11634/35065/7/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdfe91a4e8cc0da99c52f9f3b4c4f04b3e9MD57metadata only accessCarta autorización de facultadCarta autorización de facultadCarta Aprobación Facultadapplication/pdf453456https://repository.usta.edu.co/bitstream/11634/35065/8/Carta%20autorizaci%c3%b3n%20de%20facultad2308cce1edb85d54becac5b1342c5400MD58metadata only accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8807https://repository.usta.edu.co/bitstream/11634/35065/9/license.txtaedeaf396fcd827b537c73d23464fc27MD59open accessTHUMBNAIL2021.cristianalgecira.pdf.jpg2021.cristianalgecira.pdf.jpgIM Thumbnailimage/jpeg4296https://repository.usta.edu.co/bitstream/11634/35065/10/2021.cristianalgecira.pdf.jpgecc476f8f3d74d7ba55f8bc19e675e92MD510open accessCarta autorización de derechos de autor.pdf.jpgCarta autorización de derechos de autor.pdf.jpgIM Thumbnailimage/jpeg7677https://repository.usta.edu.co/bitstream/11634/35065/11/Carta%20autorizaci%c3%b3n%20de%20derechos%20de%20autor.pdf.jpg16d6462ef41b9ebe8d06a3be8dd05d0fMD511open accessCarta autorización de facultad.jpgCarta autorización de facultad.jpgIM Thumbnailimage/jpeg8751https://repository.usta.edu.co/bitstream/11634/35065/12/Carta%20autorizaci%c3%b3n%20de%20facultad.jpgabded5c00f7e9397cb83def519621aa2MD512open access11634/35065oai:repository.usta.edu.co:11634/350652022-10-21 03:02:58.462open accessRepositorio Universidad Santo Tomásrepositorio@usantotomas.edu.coQXV0b3Jpem8gYWwgQ2VudHJvIGRlIFJlY3Vyc29zIHBhcmEgZWwgQXByZW5kaXphamUgeSBsYSBJbnZlc3RpZ2FjacOzbiwgQ1JBSS1VU1RBCmRlIGxhIFVuaXZlcnNpZGFkIFNhbnRvIFRvbcOhcywgcGFyYSBxdWUgY29uIGZpbmVzIGFjYWTDqW1pY29zIGFsbWFjZW5lIGxhCmluZm9ybWFjacOzbiBpbmdyZXNhZGEgcHJldmlhbWVudGUuCgpTZSBwZXJtaXRlIGxhIGNvbnN1bHRhLCByZXByb2R1Y2Npw7NuIHBhcmNpYWwsIHRvdGFsIG8gY2FtYmlvIGRlIGZvcm1hdG8gY29uCmZpbmVzIGRlIGNvbnNlcnZhY2nDs24sIGEgbG9zIHVzdWFyaW9zIGludGVyZXNhZG9zIGVuIGVsIGNvbnRlbmlkbyBkZSBlc3RlCnRyYWJham8sIHBhcmEgdG9kb3MgbG9zIHVzb3MgcXVlIHRlbmdhbiBmaW5hbGlkYWQgYWNhZMOpbWljYSwgc2llbXByZSB5IGN1YW5kbwptZWRpYW50ZSBsYSBjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkw6kgY3LDqWRpdG8gYWwgdHJhYmFqbyBkZQpncmFkbyB5IGEgc3UgYXV0b3IuIERlIGNvbmZvcm1pZGFkIGNvbiBsbyBlc3RhYmxlY2lkbyBlbiBlbCBhcnTDrWN1bG8gMzAgZGUgbGEKTGV5IDIzIGRlIDE5ODIgeSBlbCBhcnTDrWN1bG8gMTEgZGUgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5Mywg4oCcTG9zIGRlcmVjaG9zCm1vcmFsZXMgc29icmUgZWwgdHJhYmFqbyBzb24gcHJvcGllZGFkIGRlIGxvcyBhdXRvcmVz4oCdLCBsb3MgY3VhbGVzIHNvbgppcnJlbnVuY2lhYmxlcywgaW1wcmVzY3JpcHRpYmxlcywgaW5lbWJhcmdhYmxlcyBlIGluYWxpZW5hYmxlcy4K |