Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining

Este trabajo de investigación trata acerca de la minería de opiniones (opinion mining) basada en la recolección de textos a través de la Web, con el objetivo de realizar un análisis de los sentimientos de los colombianos con base en comentarios expresados en sitios web 2.0, para lo cual se tomó como...

Full description

Autores:
Vargas Cogollo, Luis Carlos
Tipo de recurso:
Fecha de publicación:
2014
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/3523
Acceso en línea:
http://hdl.handle.net/20.500.12749/3523
Palabra clave:
Information systems
Communication
Systems Engineering
Software management
Software application
Software development
New technologies
Investigations
Teaching
Web 2.0
Microblogging
Sentiment Analysis
Sistemas de información
Comunicación
Ingeniería de sistemas
Gestión de software
Aplicación de software
Desarrollo de software
Nuevas tecnologías
Investigaciones
Enseñanza
Web 2.0
Microblogging
Análisis de sentimiento
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_fb9482ed90d8a9430237848dc74ffc86
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/3523
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
dc.title.translated.eng.fl_str_mv Emotions and opinions: an analysis of the Colombian context through opinion mining
title Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
spellingShingle Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
Information systems
Communication
Systems Engineering
Software management
Software application
Software development
New technologies
Investigations
Teaching
Web 2.0
Microblogging
Sentiment Analysis
Sistemas de información
Comunicación
Ingeniería de sistemas
Gestión de software
Aplicación de software
Desarrollo de software
Nuevas tecnologías
Investigaciones
Enseñanza
Web 2.0
Microblogging
Análisis de sentimiento
title_short Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
title_full Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
title_fullStr Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
title_full_unstemmed Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
title_sort Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
dc.creator.fl_str_mv Vargas Cogollo, Luis Carlos
dc.contributor.advisor.spa.fl_str_mv Calderón Benavides, Maritza Liliana
dc.contributor.author.spa.fl_str_mv Vargas Cogollo, Luis Carlos
dc.contributor.cvlac.*.fl_str_mv https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068900
dc.contributor.googlescholar.*.fl_str_mv https://scholar.google.es/citations?hl=es&user=XihGBWoAAAAJ
dc.contributor.scopus.*.fl_str_mv https://www.scopus.com/authid/detail.uri?authorId=15043558200
dc.contributor.researchgate.*.fl_str_mv https://www.researchgate.net/profile/Liliana_Calderon-Benavides
dc.contributor.researchgroup.spa.fl_str_mv Grupo de Investigación Tecnologías de Información - GTI
Grupo de Investigaciones Clínicas
dc.subject.keywords.eng.fl_str_mv Information systems
Communication
Systems Engineering
Software management
Software application
Software development
New technologies
Investigations
Teaching
Web 2.0
Microblogging
Sentiment Analysis
topic Information systems
Communication
Systems Engineering
Software management
Software application
Software development
New technologies
Investigations
Teaching
Web 2.0
Microblogging
Sentiment Analysis
Sistemas de información
Comunicación
Ingeniería de sistemas
Gestión de software
Aplicación de software
Desarrollo de software
Nuevas tecnologías
Investigaciones
Enseñanza
Web 2.0
Microblogging
Análisis de sentimiento
dc.subject.lemb.spa.fl_str_mv Sistemas de información
Comunicación
Ingeniería de sistemas
Gestión de software
Aplicación de software
Desarrollo de software
Nuevas tecnologías
Investigaciones
Enseñanza
dc.subject.proposal.spa.fl_str_mv Web 2.0
Microblogging
Análisis de sentimiento
description Este trabajo de investigación trata acerca de la minería de opiniones (opinion mining) basada en la recolección de textos a través de la Web, con el objetivo de realizar un análisis de los sentimientos de los colombianos con base en comentarios expresados en sitios web 2.0, para lo cual se tomó como tema central las elecciones presidenciales de Colombia en el año 2014. Para la captura de opiniones se desarrolló una aplicación web capaz de recolectar tweets basados en una entidad específica; mientras que para la recolección de otros comentarios contenidos en sitios web de noticias, se llevó a cabo un proceso de web crawling. Gracias a estos instrumentos de captura de opiniones fueron recolectados, entre el 9 de mayo y el 15 de junio de 2014, 33570 comentarios relacionados con las elecciones presidenciales. Los comentarios recolectados fueron sometidos a opinion mining por medio de la solución especializada de software SentiStrength, pero antes de esto fue necesario construir una base de conocimientos en español, ajustada al contexto colombiano. La base de conocimientos resultante contiene 2878 términos, y es un aporte al estado del arte porque plantea los cimientos para la creación de bases de conocimientos en castellano con el objetivo de realizar opinion mining frente a procesos electorales, pues a la fecha no existía ninguna base de conocimientos disponible en español. Mediante opinion mining se conoció la imagen que para los ciudadanos reflejó cada uno de los candidatos en las dos vueltas presidenciales, y se construyó un análisis general que permitió comprender mejor las tendencias de los colombianos durante las elecciones presidenciales en Colombia en 2014, y evidenció que para los ciudadanos hubo una perspectiva mayoritariamente negativa acerca de dicho proceso, soportada principalmente en la inconformidad con los candidatos y sus propuestas. Dicha inconformidad se pudo reflejar en los resultados de la minería de opiniones, los cuales indicaron que los candidatos Juan Manuel Santos y Oscar Iván Zuluaga obtuvieron una polaridad o imagen negativa con respecto al resto de candidatos durante la primera vuelta. El análisis general realizado fue contrastado con resultados arrojados por varias encuestas acerca del proceso de elecciones, realizadas por firmas encuestadoras muy reconocidas, hallándose una importante relación entre los resultados de dichas encuestas y los resultados arrojados por la minería de opiniones realizada en este trabajo. Se concluye que la minería de opiniones es un área capaz de identificar tendencias en la población, por lo cual puede ser utilizada para predecir fenómenos o situaciones, incluida la política, y por ende facilitar la toma de decisiones.
publishDate 2014
dc.date.issued.none.fl_str_mv 2014-07
dc.date.accessioned.none.fl_str_mv 2020-06-26T21:35:03Z
dc.date.available.none.fl_str_mv 2020-06-26T21:35:03Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.local.spa.fl_str_mv Tesis
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TM
http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/3523
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
url http://hdl.handle.net/20.500.12749/3523
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Vargas Cogollo, Luis Carlos (2014). Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOC
AGARWAL, A., XIE, B., VOVSHA, I., RAMBOW, O., & PASSONNEAU, R. (2011). Sentiment Analysis of Twitter Data. En LSM 2011, actas del Workshop sobre lenguajes en medios de comunicación social, pág. 30-38.http://aclweb.org/anthology//W/W11/W11-0705.pdf?CFID=262217785&CFTOKEN=33606415
ARAÚJO, M., GONÇALVES, P., & BENEVENUTO, F. (2013). Measuring Sentiments in Online Social Networks. En WebMedia 2013, actas del 19° simposio brasileño en Multimedia y la Web, pág. 97-104. http://dl.acm.org/citation.cfm?id=2526196
BAEZA-YATES, R. & RIBEIRO-NETO, B. (2011). Modern Information Retrieval: The Concepts and Technology behind Search (2a edición). USA: Addison-Wesley.
BALAHUR, A. (2011). Methods and Resources for Sentiment Analysis in Multilingual Documents of Different Text Types. Tesis de Doctorado, Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante, Alicante, España. http://rua.ua.es/dspace/bitstream/10045/19437/1/tesis_alexandrabalahur.pdf
BALAHUR, A. & MONTOYO, A. (2008). Determining the Semantic Orientation of Opinions on Products - a Comparative Analysis. Procesamiento del Lenguaje Natural, vol. 41, pp. 201-208. http://www.sepln.org/revistaSEPLN/revista/41/sec8-art1.pdf
BANFIELD, A. (1982). Unspeakable Sentences: Narration and Representation in the Language of Fiction. Routledge & Kegan Paul.
BERRY, M. & KOGAN, J. (2010). Text Mining: Applications and Theory. Chichester, Reino Unido: John Wiley & Sons Ltd.http://gendocs.ru/docs/3/2304/conv_1/file1.pdf
CASTILLO, C., MENDOZA, M., & POBLETE, B. (2011). Information Credibility on Twitter. En WWW 2011, actas de la 20ª conferencia internacional en World Wide Web, pág. 675-684. http://chato.cl/papers/castillo_mendoza_poblete_2010_twitter_credibility.pdf
DAVE, K., LAWRENCE, S., & PENNOCK, D. (2003). Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews. En WWW 2003, actas de la 12ª conferencia internacional en World Wide Web, pág. 519-528. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.13.2424&rep=rep1&type=pdf
Ekman, P. (1992). An Argument for Basic Emotions. Cognition & Emotion, pág. 169-200. http://www.paulekman.com/wp-content/uploads/2013/07/An-Argument-For-Basic-Emotions.pdf
Ekman, P. (1999). Basic Emotions. En T. Dalgleish and M. Power (Eds.). Handbook of Cognition and Emotion. Sussex, U.K.: John Wiley & Sons, Ltd. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.123.1143&rep=rep1&type=pdf
JOACHIMS, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. En ECML 1998, actas de la 10ª conferencia europea en Machine Learning, pág. 137-142. http://www.cs.cornell.edu/people/tj/publications/joachims_98a.pdf
KIM, S., & HOVY, E. (2005). Automatic Detection of Opinion Bearing Words and Sentences. En IJCNLP, actas de la Conferencia Conjunta Internacional sobre Procesamiento del Lenguaje Natural, Isla de Jeju, Corea del Sur. http://acl.ldc.upenn.edu/I/I05/I05-2011.pdf?origin=publication_detail
LIU, B. (2012). Sentiment Analysis and Opinion Mining. California, EE. UU.: Morgan & Claypool Publishers. http://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.pdf
MENDOZA, M., POBLETE, B., & CASTILLO, C. (2010). Twitter Under Crisis: Can we trust what we RT? En SOMA 2010, actas del primer Workshop sobre análisis de medios sociales, pág. 71-79. http://chato.cl/papers/mendoza_poblete_castillo_2010_twitter_terremoto.pdf
NASUKAWA, T., & YI, J. (2003). Sentiment analysis: Capturing Favorability Using Natural Language Processing. En K-CAP 2003, actas de la 2ª conferencia internacional sobre la captura del conocimiento, pág. 70-77.http://tredocs.com/tw_files2/urls_41/40/d-39217/7z-docs/7.pdf
O’CONNOR, B., BALASUBRAMANYAN, R., ROUTLEDGE, B. & SMITH, N. (2010). From tweets to polls: Linking text sentiment to public opinion time series. En ICWSM ’10, actas de la conferencia internacional AAAI en Weblogs y Social Media, pág. 122-129. http://www.cs.cmu.edu/~nasmith/papers/oconnor+balasubramanyan+routledge+smith.icwsm10.pdf
PANG, B. (2006). Automatic Analysis of Document Sentiment. Tesis de Doctorado, Escuela de graduados, Universidad Cornell, Ithaca, Nueva York. http://www.cs.cornell.edu/home/llee/extra/pang-thesis.pdf
PANG, B. & LEE, L. (2008). Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, vol. 2(1-2): pp. 1-135.http://www.cse.iitb.ac.in/~pb/cs626-449-2009/prev-years-other-things-nlp/sentiment-analysis-opinion-mining-pang-lee-omsa-published.pdf
PÉREZ, D., LOZANO, C., LÓPEZ, A., et al. (2012). Sentiment Analysis in Colombian Online Newspaper Comments. Recent Progress in Data Engineering and Internet Technology, vol. 157, pp. 113-119. http://link.springer.com/chapter/10.1007%2F978-3-642-28798-5_16#page-1
SARMENTO, L., CARVALHO, P., SILVA, M. & DE OLIVEIRA, E. (2009). Automatic creation of a reference corpus for political opinion mining in user-generated content. En CIKM ’09, actas del primer Workshop internacional sobre Temas de Sentiment Analysis para Opinión Masiva, pág. 29-36. http://xldb.lasige.di.fc.ul.pt/xldb/publications/sarmento09_document.pdf
SCHERER, K. (2005). What are emotions? And how can they be measured? Social Science Information, vol. 3(44): pp. 695-729.http://www.affective-sciences.org/system/files/biblio/2005_Scherer_SSI.pdf
VAN DEN BOS, G. (2006). APA Dictionary of Psychology. Washington, DC, EE. UU.: American Psychological Association.
WIEBE, J. (1994). Tracking Point of View in Narrative. Computational Linguistics, vol. 20(2): pp. 233-287. http://acl.ldc.upenn.edu/J/J94/J94-2004.pdf?origin=publication_detail
WIEBE, J., WILSON, T., & CARDIE, C. (2005). Annotating Expressions of Opinions and Emotions in Language. Language Resources and Evaluation, vol. 39(2-3): pp. 119-122. http://www.cs.cornell.edu/home/cardie/papers/lre05withappendix.pdf
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
Atribución-NoComercial-SinDerivadas 2.5 Colombia
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spa.fl_str_mv Bucaramanga (Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Maestría en Software Libre
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/3523/1/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/3523/2/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/3523/3/Anexos.zip
https://repository.unab.edu.co/bitstream/20.500.12749/3523/4/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpg
https://repository.unab.edu.co/bitstream/20.500.12749/3523/5/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpg
bitstream.checksum.fl_str_mv a6ab73162c83d1cce238665c8f538096
6a7108ccb57696bc1c6d175a0423a6c6
583b6f3408ae9a1a46579b2bf3e3a678
8fd90d0133106c6d54ee9de8ffbd541f
64d45dbfb0e7c096a96c75192fc71632
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814278002608963584
spelling Calderón Benavides, Maritza Lilianaa478af73-8b10-4632-aff9-2b9977a8b4e2-1Vargas Cogollo, Luis Carlos17430a6a-4a22-4a4d-a95e-9a6ca9093261-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068900https://scholar.google.es/citations?hl=es&user=XihGBWoAAAAJhttps://www.scopus.com/authid/detail.uri?authorId=15043558200https://www.researchgate.net/profile/Liliana_Calderon-BenavidesGrupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones Clínicas2020-06-26T21:35:03Z2020-06-26T21:35:03Z2014-07http://hdl.handle.net/20.500.12749/3523instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEste trabajo de investigación trata acerca de la minería de opiniones (opinion mining) basada en la recolección de textos a través de la Web, con el objetivo de realizar un análisis de los sentimientos de los colombianos con base en comentarios expresados en sitios web 2.0, para lo cual se tomó como tema central las elecciones presidenciales de Colombia en el año 2014. Para la captura de opiniones se desarrolló una aplicación web capaz de recolectar tweets basados en una entidad específica; mientras que para la recolección de otros comentarios contenidos en sitios web de noticias, se llevó a cabo un proceso de web crawling. Gracias a estos instrumentos de captura de opiniones fueron recolectados, entre el 9 de mayo y el 15 de junio de 2014, 33570 comentarios relacionados con las elecciones presidenciales. Los comentarios recolectados fueron sometidos a opinion mining por medio de la solución especializada de software SentiStrength, pero antes de esto fue necesario construir una base de conocimientos en español, ajustada al contexto colombiano. La base de conocimientos resultante contiene 2878 términos, y es un aporte al estado del arte porque plantea los cimientos para la creación de bases de conocimientos en castellano con el objetivo de realizar opinion mining frente a procesos electorales, pues a la fecha no existía ninguna base de conocimientos disponible en español. Mediante opinion mining se conoció la imagen que para los ciudadanos reflejó cada uno de los candidatos en las dos vueltas presidenciales, y se construyó un análisis general que permitió comprender mejor las tendencias de los colombianos durante las elecciones presidenciales en Colombia en 2014, y evidenció que para los ciudadanos hubo una perspectiva mayoritariamente negativa acerca de dicho proceso, soportada principalmente en la inconformidad con los candidatos y sus propuestas. Dicha inconformidad se pudo reflejar en los resultados de la minería de opiniones, los cuales indicaron que los candidatos Juan Manuel Santos y Oscar Iván Zuluaga obtuvieron una polaridad o imagen negativa con respecto al resto de candidatos durante la primera vuelta. El análisis general realizado fue contrastado con resultados arrojados por varias encuestas acerca del proceso de elecciones, realizadas por firmas encuestadoras muy reconocidas, hallándose una importante relación entre los resultados de dichas encuestas y los resultados arrojados por la minería de opiniones realizada en este trabajo. Se concluye que la minería de opiniones es un área capaz de identificar tendencias en la población, por lo cual puede ser utilizada para predecir fenómenos o situaciones, incluida la política, y por ende facilitar la toma de decisiones.Universitat Oberta de Catalunya UOC1. Introducción 15 1.1 Planteamiento del Problema y Motivación 18 1.2 Hipótesis de Investigación 22 1.3 Objetivos 22 1.3.1 Objetivo General 22 1.3.2 Objetivos Específicos 22 1.4 Estructura de la Tesis 23 2. Marco Teórico 25 2.1 Sentiment Analysis 25 2.1.1 Aplicaciones del sentiment analysis 26 2.1.2 Clasificación de la polaridad de un texto 27 2.1.3 Herramientas disponibles para realizar opinion mining 28 2.1.3.1 SentiStrength 30 2.1.4 Factores que dificultan las tareas de opinion mining 31 2.1.5 Sentiment analysis y la Web 2.0 32 2.2 Redes Sociales de Internet y otros Medios Digitales de Expresión 33 2.2.1 Microblogging 35 2.2.1.1 Twitter 35 2.2.2 Medios digitales de expresión en Colombia 37 2.2.2.1 Diarios on-line 37 2.2.2.2 Revistas on-line 38 2.3 Recuperación de la Información 39 2.3.1 Recuperación de documentos desde la Web 39 2.3.1.1 Web Crawling 40 2.4 Subjetividad, Sentimientos, Opiniones y Emociones en los Seres Humanos 43 2.4.1 Subjetividad 44 2.4.2 Sentimientos 44 2.4.3 Opiniones 45 2.4.4 Emociones 46 2.5 Aspectos Relevantes en el Contexto Político de las Elecciones Presidenciales en Colombia 47 2.5.1 Proceso de elección del Presidente de la República 48 2.5.2 Reseña de los candidatos a la Presidencia de Colombia en el año 2014 49 3. Desarrollo de la Propuesta 52 3.1 Tipo de Investigación 52 3.2 Definición de Población y Muestra 52 3.3 Técnicas de Recolección de Datos 53 3.4 Procedimiento Experimental 54 3.4.1 Instrumentos de captura de opiniones 54 3.4.2 Clasificación de comentarios 59 3.4.2.1 Personalización del idioma de SentiStrength 61 3.4.2.2 Realizando opinion mining con SentiStrength 66 3.4.2.2.1 Cálculo de la polaridad global de un fichero generado por SentiStrength después de haber realizado opinion mining 70 3.5 Confiabilidad del Procedimiento 74 3.6 Plan de Presentación de Resultados 76 4. Resultados 77 4.1 Descripción de los resultados obtenidos mediante la captura de opiniones 77 4.2 Descripción de los resultados obtenidos mediante Opinion Mining 81 4.2.1 Resultados de opinion mining para la candidata Clara López 81 4.2.2 Resultados de opinion mining para el candidato Enrique Peñalosa 85 4.2.3 Resultados de opinion mining para la candidata Marta Lucía Ramírez 89 4.2.4 Resultados de opinion mining para el candidato Juan Manuel Santos 92 4.2.5 Resultados de opinion mining para el candidato Oscar Iván Zuluaga 96 4.2.6 Resultados de opinion mining obtenidos mediante otros hashtag 100 4.2.6.1 Resultados obtenidos para el hashtag #Elecciones2014 100 4.2.6.2 Resultados obtenidos para el hashtag #SegundaVuelta 101 4.3 Análisis general, con base en los resultados de Opinion Mining 102 4.3.1 Análisis basado en la primera vuelta presidencial y sus candidatos 104 4.3.2 Análisis basado en la segunda vuelta presidencial y sus candidatos 107 4.3.2.1 Análisis basado en otros tweets capturados durante la segunda vuelta presidencial 112 4.4 Contraste entre el análisis general y encuestas de Gallup y Datexco 113 4.4.1 Comparación con encuestas realizadas para la primera vuelta 113 4.4.2 Comparación con encuestas realizadas para la segunda vuelta 117 5. Conclusiones 122 5.1 Discusión 122 5.2 Conclusiones 125 6. Recomendaciones y Trabajo Futuro 127 6.1 Contribuciones 127 6.2 Recomendaciones 129 6.3 Trabajo Futuro 130 7. Referencias 131MaestríaThis research work deals with opinion mining based on the collection of texts through the Web, with the aim of carrying out an analysis of the feelings of Colombians based on comments expressed on 2.0 web sites, For which the central theme was the presidential elections of Colombia in 2014. To capture opinions, a web application capable of collecting tweets based on a specific entity was developed; while for the collection of other comments contained in news websites, a web crawling process was carried out. Thanks to these opinion-capturing instruments, 33,570 comments related to the presidential elections were collected between May 9 and June 15, 2014. The comments collected were submitted to opinion mining through the specialized SentiStrength software solution, but before this it was necessary to build a knowledge base in Spanish, adjusted to the Colombian context. The resulting knowledge base contains 2878 terms, and it is a contribution to the state of the art because it raises the foundations for the creation of knowledge bases in Spanish with the objective of conducting opinion mining in the face of electoral processes, since to date there was no basis of knowledge available in Spanish. Through opinion mining, the image that each of the candidates reflected for the citizens in the two presidential rounds was known, and a general analysis was constructed that allowed us to better understand the trends of Colombians during the presidential elections in Colombia in 2014, and showed that for citizens, there was a mostly negative perspective about said process, mainly supported by disagreement with the candidates and their proposals. This dissatisfaction could be reflected in the results of the opinion mining, which indicated that the candidates Juan Manuel Santos and Oscar Iván Zuluaga obtained a negative polarity or image with respect to the rest of the candidates during the first round. The general analysis carried out was contrasted with the results of various surveys about the election process, carried out by well-known polling firms, finding an important relationship between the results of these surveys and the results of the opinion mining carried out in this work. It is concluded that opinion mining is an area capable of identifying trends in the population, which is why it can be used to predict phenomena or situations, including politics, and therefore facilitate decision-making.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaEmociones y opiniones: un análisis del contexto colombiano a través de opinión miningEmotions and opinions: an analysis of the Colombian context through opinion miningMagíster en Software LibreBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaMaestría en Software Libreinfo:eu-repo/semantics/masterThesisTesishttp://purl.org/redcol/resource_type/TMhttp://purl.org/redcol/resource_type/TMInformation systemsCommunicationSystems EngineeringSoftware managementSoftware applicationSoftware developmentNew technologiesInvestigationsTeachingWeb 2.0MicrobloggingSentiment AnalysisSistemas de informaciónComunicaciónIngeniería de sistemasGestión de softwareAplicación de softwareDesarrollo de softwareNuevas tecnologíasInvestigacionesEnseñanzaWeb 2.0MicrobloggingAnálisis de sentimientoVargas Cogollo, Luis Carlos (2014). Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOCAGARWAL, A., XIE, B., VOVSHA, I., RAMBOW, O., & PASSONNEAU, R. (2011). Sentiment Analysis of Twitter Data. En LSM 2011, actas del Workshop sobre lenguajes en medios de comunicación social, pág. 30-38.http://aclweb.org/anthology//W/W11/W11-0705.pdf?CFID=262217785&CFTOKEN=33606415ARAÚJO, M., GONÇALVES, P., & BENEVENUTO, F. (2013). Measuring Sentiments in Online Social Networks. En WebMedia 2013, actas del 19° simposio brasileño en Multimedia y la Web, pág. 97-104. http://dl.acm.org/citation.cfm?id=2526196BAEZA-YATES, R. & RIBEIRO-NETO, B. (2011). Modern Information Retrieval: The Concepts and Technology behind Search (2a edición). USA: Addison-Wesley.BALAHUR, A. (2011). Methods and Resources for Sentiment Analysis in Multilingual Documents of Different Text Types. Tesis de Doctorado, Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante, Alicante, España. http://rua.ua.es/dspace/bitstream/10045/19437/1/tesis_alexandrabalahur.pdfBALAHUR, A. & MONTOYO, A. (2008). Determining the Semantic Orientation of Opinions on Products - a Comparative Analysis. Procesamiento del Lenguaje Natural, vol. 41, pp. 201-208. http://www.sepln.org/revistaSEPLN/revista/41/sec8-art1.pdfBANFIELD, A. (1982). Unspeakable Sentences: Narration and Representation in the Language of Fiction. Routledge & Kegan Paul.BERRY, M. & KOGAN, J. (2010). Text Mining: Applications and Theory. Chichester, Reino Unido: John Wiley & Sons Ltd.http://gendocs.ru/docs/3/2304/conv_1/file1.pdfCASTILLO, C., MENDOZA, M., & POBLETE, B. (2011). Information Credibility on Twitter. En WWW 2011, actas de la 20ª conferencia internacional en World Wide Web, pág. 675-684. http://chato.cl/papers/castillo_mendoza_poblete_2010_twitter_credibility.pdfDAVE, K., LAWRENCE, S., & PENNOCK, D. (2003). Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews. En WWW 2003, actas de la 12ª conferencia internacional en World Wide Web, pág. 519-528. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.13.2424&rep=rep1&type=pdfEkman, P. (1992). An Argument for Basic Emotions. Cognition & Emotion, pág. 169-200. http://www.paulekman.com/wp-content/uploads/2013/07/An-Argument-For-Basic-Emotions.pdfEkman, P. (1999). Basic Emotions. En T. Dalgleish and M. Power (Eds.). Handbook of Cognition and Emotion. Sussex, U.K.: John Wiley & Sons, Ltd. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.123.1143&rep=rep1&type=pdfJOACHIMS, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. En ECML 1998, actas de la 10ª conferencia europea en Machine Learning, pág. 137-142. http://www.cs.cornell.edu/people/tj/publications/joachims_98a.pdfKIM, S., & HOVY, E. (2005). Automatic Detection of Opinion Bearing Words and Sentences. En IJCNLP, actas de la Conferencia Conjunta Internacional sobre Procesamiento del Lenguaje Natural, Isla de Jeju, Corea del Sur. http://acl.ldc.upenn.edu/I/I05/I05-2011.pdf?origin=publication_detailLIU, B. (2012). Sentiment Analysis and Opinion Mining. California, EE. UU.: Morgan & Claypool Publishers. http://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.pdfMENDOZA, M., POBLETE, B., & CASTILLO, C. (2010). Twitter Under Crisis: Can we trust what we RT? En SOMA 2010, actas del primer Workshop sobre análisis de medios sociales, pág. 71-79. http://chato.cl/papers/mendoza_poblete_castillo_2010_twitter_terremoto.pdfNASUKAWA, T., & YI, J. (2003). Sentiment analysis: Capturing Favorability Using Natural Language Processing. En K-CAP 2003, actas de la 2ª conferencia internacional sobre la captura del conocimiento, pág. 70-77.http://tredocs.com/tw_files2/urls_41/40/d-39217/7z-docs/7.pdfO’CONNOR, B., BALASUBRAMANYAN, R., ROUTLEDGE, B. & SMITH, N. (2010). From tweets to polls: Linking text sentiment to public opinion time series. En ICWSM ’10, actas de la conferencia internacional AAAI en Weblogs y Social Media, pág. 122-129. http://www.cs.cmu.edu/~nasmith/papers/oconnor+balasubramanyan+routledge+smith.icwsm10.pdfPANG, B. (2006). Automatic Analysis of Document Sentiment. Tesis de Doctorado, Escuela de graduados, Universidad Cornell, Ithaca, Nueva York. http://www.cs.cornell.edu/home/llee/extra/pang-thesis.pdfPANG, B. & LEE, L. (2008). Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, vol. 2(1-2): pp. 1-135.http://www.cse.iitb.ac.in/~pb/cs626-449-2009/prev-years-other-things-nlp/sentiment-analysis-opinion-mining-pang-lee-omsa-published.pdfPÉREZ, D., LOZANO, C., LÓPEZ, A., et al. (2012). Sentiment Analysis in Colombian Online Newspaper Comments. Recent Progress in Data Engineering and Internet Technology, vol. 157, pp. 113-119. http://link.springer.com/chapter/10.1007%2F978-3-642-28798-5_16#page-1SARMENTO, L., CARVALHO, P., SILVA, M. & DE OLIVEIRA, E. (2009). Automatic creation of a reference corpus for political opinion mining in user-generated content. En CIKM ’09, actas del primer Workshop internacional sobre Temas de Sentiment Analysis para Opinión Masiva, pág. 29-36. http://xldb.lasige.di.fc.ul.pt/xldb/publications/sarmento09_document.pdfSCHERER, K. (2005). What are emotions? And how can they be measured? Social Science Information, vol. 3(44): pp. 695-729.http://www.affective-sciences.org/system/files/biblio/2005_Scherer_SSI.pdfVAN DEN BOS, G. (2006). APA Dictionary of Psychology. Washington, DC, EE. UU.: American Psychological Association.WIEBE, J. (1994). Tracking Point of View in Narrative. Computational Linguistics, vol. 20(2): pp. 233-287. http://acl.ldc.upenn.edu/J/J94/J94-2004.pdf?origin=publication_detailWIEBE, J., WILSON, T., & CARDIE, C. (2005). Annotating Expressions of Opinions and Emotions in Language. Language Resources and Evaluation, vol. 39(2-3): pp. 119-122. http://www.cs.cornell.edu/home/cardie/papers/lre05withappendix.pdfORIGINAL2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdfTesisapplication/pdf2114539https://repository.unab.edu.co/bitstream/20.500.12749/3523/1/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdfa6ab73162c83d1cce238665c8f538096MD51open access2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdfArtículoapplication/pdf637208https://repository.unab.edu.co/bitstream/20.500.12749/3523/2/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf6a7108ccb57696bc1c6d175a0423a6c6MD52open accessAnexos.zipAnexos.zipAnexosapplication/octet-stream2779349https://repository.unab.edu.co/bitstream/20.500.12749/3523/3/Anexos.zip583b6f3408ae9a1a46579b2bf3e3a678MD53open accessTHUMBNAIL2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpg2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpgIM Thumbnailimage/jpeg7508https://repository.unab.edu.co/bitstream/20.500.12749/3523/4/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpg8fd90d0133106c6d54ee9de8ffbd541fMD54open access2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpg2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpgIM Thumbnailimage/jpeg9731https://repository.unab.edu.co/bitstream/20.500.12749/3523/5/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpg64d45dbfb0e7c096a96c75192fc71632MD55open access20.500.12749/3523oai:repository.unab.edu.co:20.500.12749/35232024-01-19 20:01:24.838open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co