Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining
Este trabajo de investigación trata acerca de la minería de opiniones (opinion mining) basada en la recolección de textos a través de la Web, con el objetivo de realizar un análisis de los sentimientos de los colombianos con base en comentarios expresados en sitios web 2.0, para lo cual se tomó como...
- Autores:
-
Vargas Cogollo, Luis Carlos
- Tipo de recurso:
- Fecha de publicación:
- 2014
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/3523
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/3523
- Palabra clave:
- Information systems
Communication
Systems Engineering
Software management
Software application
Software development
New technologies
Investigations
Teaching
Web 2.0
Microblogging
Sentiment Analysis
Sistemas de información
Comunicación
Ingeniería de sistemas
Gestión de software
Aplicación de software
Desarrollo de software
Nuevas tecnologías
Investigaciones
Enseñanza
Web 2.0
Microblogging
Análisis de sentimiento
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_fb9482ed90d8a9430237848dc74ffc86 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/3523 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining |
dc.title.translated.eng.fl_str_mv |
Emotions and opinions: an analysis of the Colombian context through opinion mining |
title |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining |
spellingShingle |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining Information systems Communication Systems Engineering Software management Software application Software development New technologies Investigations Teaching Web 2.0 Microblogging Sentiment Analysis Sistemas de información Comunicación Ingeniería de sistemas Gestión de software Aplicación de software Desarrollo de software Nuevas tecnologías Investigaciones Enseñanza Web 2.0 Microblogging Análisis de sentimiento |
title_short |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining |
title_full |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining |
title_fullStr |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining |
title_full_unstemmed |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining |
title_sort |
Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining |
dc.creator.fl_str_mv |
Vargas Cogollo, Luis Carlos |
dc.contributor.advisor.spa.fl_str_mv |
Calderón Benavides, Maritza Liliana |
dc.contributor.author.spa.fl_str_mv |
Vargas Cogollo, Luis Carlos |
dc.contributor.cvlac.*.fl_str_mv |
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068900 |
dc.contributor.googlescholar.*.fl_str_mv |
https://scholar.google.es/citations?hl=es&user=XihGBWoAAAAJ |
dc.contributor.scopus.*.fl_str_mv |
https://www.scopus.com/authid/detail.uri?authorId=15043558200 |
dc.contributor.researchgate.*.fl_str_mv |
https://www.researchgate.net/profile/Liliana_Calderon-Benavides |
dc.contributor.researchgroup.spa.fl_str_mv |
Grupo de Investigación Tecnologías de Información - GTI Grupo de Investigaciones Clínicas |
dc.subject.keywords.eng.fl_str_mv |
Information systems Communication Systems Engineering Software management Software application Software development New technologies Investigations Teaching Web 2.0 Microblogging Sentiment Analysis |
topic |
Information systems Communication Systems Engineering Software management Software application Software development New technologies Investigations Teaching Web 2.0 Microblogging Sentiment Analysis Sistemas de información Comunicación Ingeniería de sistemas Gestión de software Aplicación de software Desarrollo de software Nuevas tecnologías Investigaciones Enseñanza Web 2.0 Microblogging Análisis de sentimiento |
dc.subject.lemb.spa.fl_str_mv |
Sistemas de información Comunicación Ingeniería de sistemas Gestión de software Aplicación de software Desarrollo de software Nuevas tecnologías Investigaciones Enseñanza |
dc.subject.proposal.spa.fl_str_mv |
Web 2.0 Microblogging Análisis de sentimiento |
description |
Este trabajo de investigación trata acerca de la minería de opiniones (opinion mining) basada en la recolección de textos a través de la Web, con el objetivo de realizar un análisis de los sentimientos de los colombianos con base en comentarios expresados en sitios web 2.0, para lo cual se tomó como tema central las elecciones presidenciales de Colombia en el año 2014. Para la captura de opiniones se desarrolló una aplicación web capaz de recolectar tweets basados en una entidad específica; mientras que para la recolección de otros comentarios contenidos en sitios web de noticias, se llevó a cabo un proceso de web crawling. Gracias a estos instrumentos de captura de opiniones fueron recolectados, entre el 9 de mayo y el 15 de junio de 2014, 33570 comentarios relacionados con las elecciones presidenciales. Los comentarios recolectados fueron sometidos a opinion mining por medio de la solución especializada de software SentiStrength, pero antes de esto fue necesario construir una base de conocimientos en español, ajustada al contexto colombiano. La base de conocimientos resultante contiene 2878 términos, y es un aporte al estado del arte porque plantea los cimientos para la creación de bases de conocimientos en castellano con el objetivo de realizar opinion mining frente a procesos electorales, pues a la fecha no existía ninguna base de conocimientos disponible en español. Mediante opinion mining se conoció la imagen que para los ciudadanos reflejó cada uno de los candidatos en las dos vueltas presidenciales, y se construyó un análisis general que permitió comprender mejor las tendencias de los colombianos durante las elecciones presidenciales en Colombia en 2014, y evidenció que para los ciudadanos hubo una perspectiva mayoritariamente negativa acerca de dicho proceso, soportada principalmente en la inconformidad con los candidatos y sus propuestas. Dicha inconformidad se pudo reflejar en los resultados de la minería de opiniones, los cuales indicaron que los candidatos Juan Manuel Santos y Oscar Iván Zuluaga obtuvieron una polaridad o imagen negativa con respecto al resto de candidatos durante la primera vuelta. El análisis general realizado fue contrastado con resultados arrojados por varias encuestas acerca del proceso de elecciones, realizadas por firmas encuestadoras muy reconocidas, hallándose una importante relación entre los resultados de dichas encuestas y los resultados arrojados por la minería de opiniones realizada en este trabajo. Se concluye que la minería de opiniones es un área capaz de identificar tendencias en la población, por lo cual puede ser utilizada para predecir fenómenos o situaciones, incluida la política, y por ende facilitar la toma de decisiones. |
publishDate |
2014 |
dc.date.issued.none.fl_str_mv |
2014-07 |
dc.date.accessioned.none.fl_str_mv |
2020-06-26T21:35:03Z |
dc.date.available.none.fl_str_mv |
2020-06-26T21:35:03Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.local.spa.fl_str_mv |
Tesis |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TM http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/3523 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
url |
http://hdl.handle.net/20.500.12749/3523 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Vargas Cogollo, Luis Carlos (2014). Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOC AGARWAL, A., XIE, B., VOVSHA, I., RAMBOW, O., & PASSONNEAU, R. (2011). Sentiment Analysis of Twitter Data. En LSM 2011, actas del Workshop sobre lenguajes en medios de comunicación social, pág. 30-38.http://aclweb.org/anthology//W/W11/W11-0705.pdf?CFID=262217785&CFTOKEN=33606415 ARAÚJO, M., GONÇALVES, P., & BENEVENUTO, F. (2013). Measuring Sentiments in Online Social Networks. En WebMedia 2013, actas del 19° simposio brasileño en Multimedia y la Web, pág. 97-104. http://dl.acm.org/citation.cfm?id=2526196 BAEZA-YATES, R. & RIBEIRO-NETO, B. (2011). Modern Information Retrieval: The Concepts and Technology behind Search (2a edición). USA: Addison-Wesley. BALAHUR, A. (2011). Methods and Resources for Sentiment Analysis in Multilingual Documents of Different Text Types. Tesis de Doctorado, Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante, Alicante, España. http://rua.ua.es/dspace/bitstream/10045/19437/1/tesis_alexandrabalahur.pdf BALAHUR, A. & MONTOYO, A. (2008). Determining the Semantic Orientation of Opinions on Products - a Comparative Analysis. Procesamiento del Lenguaje Natural, vol. 41, pp. 201-208. http://www.sepln.org/revistaSEPLN/revista/41/sec8-art1.pdf BANFIELD, A. (1982). Unspeakable Sentences: Narration and Representation in the Language of Fiction. Routledge & Kegan Paul. BERRY, M. & KOGAN, J. (2010). Text Mining: Applications and Theory. Chichester, Reino Unido: John Wiley & Sons Ltd.http://gendocs.ru/docs/3/2304/conv_1/file1.pdf CASTILLO, C., MENDOZA, M., & POBLETE, B. (2011). Information Credibility on Twitter. En WWW 2011, actas de la 20ª conferencia internacional en World Wide Web, pág. 675-684. http://chato.cl/papers/castillo_mendoza_poblete_2010_twitter_credibility.pdf DAVE, K., LAWRENCE, S., & PENNOCK, D. (2003). Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews. En WWW 2003, actas de la 12ª conferencia internacional en World Wide Web, pág. 519-528. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.13.2424&rep=rep1&type=pdf Ekman, P. (1992). An Argument for Basic Emotions. Cognition & Emotion, pág. 169-200. http://www.paulekman.com/wp-content/uploads/2013/07/An-Argument-For-Basic-Emotions.pdf Ekman, P. (1999). Basic Emotions. En T. Dalgleish and M. Power (Eds.). Handbook of Cognition and Emotion. Sussex, U.K.: John Wiley & Sons, Ltd. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.123.1143&rep=rep1&type=pdf JOACHIMS, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. En ECML 1998, actas de la 10ª conferencia europea en Machine Learning, pág. 137-142. http://www.cs.cornell.edu/people/tj/publications/joachims_98a.pdf KIM, S., & HOVY, E. (2005). Automatic Detection of Opinion Bearing Words and Sentences. En IJCNLP, actas de la Conferencia Conjunta Internacional sobre Procesamiento del Lenguaje Natural, Isla de Jeju, Corea del Sur. http://acl.ldc.upenn.edu/I/I05/I05-2011.pdf?origin=publication_detail LIU, B. (2012). Sentiment Analysis and Opinion Mining. California, EE. UU.: Morgan & Claypool Publishers. http://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.pdf MENDOZA, M., POBLETE, B., & CASTILLO, C. (2010). Twitter Under Crisis: Can we trust what we RT? En SOMA 2010, actas del primer Workshop sobre análisis de medios sociales, pág. 71-79. http://chato.cl/papers/mendoza_poblete_castillo_2010_twitter_terremoto.pdf NASUKAWA, T., & YI, J. (2003). Sentiment analysis: Capturing Favorability Using Natural Language Processing. En K-CAP 2003, actas de la 2ª conferencia internacional sobre la captura del conocimiento, pág. 70-77.http://tredocs.com/tw_files2/urls_41/40/d-39217/7z-docs/7.pdf O’CONNOR, B., BALASUBRAMANYAN, R., ROUTLEDGE, B. & SMITH, N. (2010). From tweets to polls: Linking text sentiment to public opinion time series. En ICWSM ’10, actas de la conferencia internacional AAAI en Weblogs y Social Media, pág. 122-129. http://www.cs.cmu.edu/~nasmith/papers/oconnor+balasubramanyan+routledge+smith.icwsm10.pdf PANG, B. (2006). Automatic Analysis of Document Sentiment. Tesis de Doctorado, Escuela de graduados, Universidad Cornell, Ithaca, Nueva York. http://www.cs.cornell.edu/home/llee/extra/pang-thesis.pdf PANG, B. & LEE, L. (2008). Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, vol. 2(1-2): pp. 1-135.http://www.cse.iitb.ac.in/~pb/cs626-449-2009/prev-years-other-things-nlp/sentiment-analysis-opinion-mining-pang-lee-omsa-published.pdf PÉREZ, D., LOZANO, C., LÓPEZ, A., et al. (2012). Sentiment Analysis in Colombian Online Newspaper Comments. Recent Progress in Data Engineering and Internet Technology, vol. 157, pp. 113-119. http://link.springer.com/chapter/10.1007%2F978-3-642-28798-5_16#page-1 SARMENTO, L., CARVALHO, P., SILVA, M. & DE OLIVEIRA, E. (2009). Automatic creation of a reference corpus for political opinion mining in user-generated content. En CIKM ’09, actas del primer Workshop internacional sobre Temas de Sentiment Analysis para Opinión Masiva, pág. 29-36. http://xldb.lasige.di.fc.ul.pt/xldb/publications/sarmento09_document.pdf SCHERER, K. (2005). What are emotions? And how can they be measured? Social Science Information, vol. 3(44): pp. 695-729.http://www.affective-sciences.org/system/files/biblio/2005_Scherer_SSI.pdf VAN DEN BOS, G. (2006). APA Dictionary of Psychology. Washington, DC, EE. UU.: American Psychological Association. WIEBE, J. (1994). Tracking Point of View in Narrative. Computational Linguistics, vol. 20(2): pp. 233-287. http://acl.ldc.upenn.edu/J/J94/J94-2004.pdf?origin=publication_detail WIEBE, J., WILSON, T., & CARDIE, C. (2005). Annotating Expressions of Opinions and Emotions in Language. Language Resources and Evaluation, vol. 39(2-3): pp. 119-122. http://www.cs.cornell.edu/home/cardie/papers/lre05withappendix.pdf |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 2.5 Colombia |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spa.fl_str_mv |
Bucaramanga (Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Maestría en Software Libre |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/3523/1/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf https://repository.unab.edu.co/bitstream/20.500.12749/3523/2/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf https://repository.unab.edu.co/bitstream/20.500.12749/3523/3/Anexos.zip https://repository.unab.edu.co/bitstream/20.500.12749/3523/4/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpg https://repository.unab.edu.co/bitstream/20.500.12749/3523/5/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpg |
bitstream.checksum.fl_str_mv |
a6ab73162c83d1cce238665c8f538096 6a7108ccb57696bc1c6d175a0423a6c6 583b6f3408ae9a1a46579b2bf3e3a678 8fd90d0133106c6d54ee9de8ffbd541f 64d45dbfb0e7c096a96c75192fc71632 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814278002608963584 |
spelling |
Calderón Benavides, Maritza Lilianaa478af73-8b10-4632-aff9-2b9977a8b4e2-1Vargas Cogollo, Luis Carlos17430a6a-4a22-4a4d-a95e-9a6ca9093261-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068900https://scholar.google.es/citations?hl=es&user=XihGBWoAAAAJhttps://www.scopus.com/authid/detail.uri?authorId=15043558200https://www.researchgate.net/profile/Liliana_Calderon-BenavidesGrupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones Clínicas2020-06-26T21:35:03Z2020-06-26T21:35:03Z2014-07http://hdl.handle.net/20.500.12749/3523instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEste trabajo de investigación trata acerca de la minería de opiniones (opinion mining) basada en la recolección de textos a través de la Web, con el objetivo de realizar un análisis de los sentimientos de los colombianos con base en comentarios expresados en sitios web 2.0, para lo cual se tomó como tema central las elecciones presidenciales de Colombia en el año 2014. Para la captura de opiniones se desarrolló una aplicación web capaz de recolectar tweets basados en una entidad específica; mientras que para la recolección de otros comentarios contenidos en sitios web de noticias, se llevó a cabo un proceso de web crawling. Gracias a estos instrumentos de captura de opiniones fueron recolectados, entre el 9 de mayo y el 15 de junio de 2014, 33570 comentarios relacionados con las elecciones presidenciales. Los comentarios recolectados fueron sometidos a opinion mining por medio de la solución especializada de software SentiStrength, pero antes de esto fue necesario construir una base de conocimientos en español, ajustada al contexto colombiano. La base de conocimientos resultante contiene 2878 términos, y es un aporte al estado del arte porque plantea los cimientos para la creación de bases de conocimientos en castellano con el objetivo de realizar opinion mining frente a procesos electorales, pues a la fecha no existía ninguna base de conocimientos disponible en español. Mediante opinion mining se conoció la imagen que para los ciudadanos reflejó cada uno de los candidatos en las dos vueltas presidenciales, y se construyó un análisis general que permitió comprender mejor las tendencias de los colombianos durante las elecciones presidenciales en Colombia en 2014, y evidenció que para los ciudadanos hubo una perspectiva mayoritariamente negativa acerca de dicho proceso, soportada principalmente en la inconformidad con los candidatos y sus propuestas. Dicha inconformidad se pudo reflejar en los resultados de la minería de opiniones, los cuales indicaron que los candidatos Juan Manuel Santos y Oscar Iván Zuluaga obtuvieron una polaridad o imagen negativa con respecto al resto de candidatos durante la primera vuelta. El análisis general realizado fue contrastado con resultados arrojados por varias encuestas acerca del proceso de elecciones, realizadas por firmas encuestadoras muy reconocidas, hallándose una importante relación entre los resultados de dichas encuestas y los resultados arrojados por la minería de opiniones realizada en este trabajo. Se concluye que la minería de opiniones es un área capaz de identificar tendencias en la población, por lo cual puede ser utilizada para predecir fenómenos o situaciones, incluida la política, y por ende facilitar la toma de decisiones.Universitat Oberta de Catalunya UOC1. Introducción 15 1.1 Planteamiento del Problema y Motivación 18 1.2 Hipótesis de Investigación 22 1.3 Objetivos 22 1.3.1 Objetivo General 22 1.3.2 Objetivos Específicos 22 1.4 Estructura de la Tesis 23 2. Marco Teórico 25 2.1 Sentiment Analysis 25 2.1.1 Aplicaciones del sentiment analysis 26 2.1.2 Clasificación de la polaridad de un texto 27 2.1.3 Herramientas disponibles para realizar opinion mining 28 2.1.3.1 SentiStrength 30 2.1.4 Factores que dificultan las tareas de opinion mining 31 2.1.5 Sentiment analysis y la Web 2.0 32 2.2 Redes Sociales de Internet y otros Medios Digitales de Expresión 33 2.2.1 Microblogging 35 2.2.1.1 Twitter 35 2.2.2 Medios digitales de expresión en Colombia 37 2.2.2.1 Diarios on-line 37 2.2.2.2 Revistas on-line 38 2.3 Recuperación de la Información 39 2.3.1 Recuperación de documentos desde la Web 39 2.3.1.1 Web Crawling 40 2.4 Subjetividad, Sentimientos, Opiniones y Emociones en los Seres Humanos 43 2.4.1 Subjetividad 44 2.4.2 Sentimientos 44 2.4.3 Opiniones 45 2.4.4 Emociones 46 2.5 Aspectos Relevantes en el Contexto Político de las Elecciones Presidenciales en Colombia 47 2.5.1 Proceso de elección del Presidente de la República 48 2.5.2 Reseña de los candidatos a la Presidencia de Colombia en el año 2014 49 3. Desarrollo de la Propuesta 52 3.1 Tipo de Investigación 52 3.2 Definición de Población y Muestra 52 3.3 Técnicas de Recolección de Datos 53 3.4 Procedimiento Experimental 54 3.4.1 Instrumentos de captura de opiniones 54 3.4.2 Clasificación de comentarios 59 3.4.2.1 Personalización del idioma de SentiStrength 61 3.4.2.2 Realizando opinion mining con SentiStrength 66 3.4.2.2.1 Cálculo de la polaridad global de un fichero generado por SentiStrength después de haber realizado opinion mining 70 3.5 Confiabilidad del Procedimiento 74 3.6 Plan de Presentación de Resultados 76 4. Resultados 77 4.1 Descripción de los resultados obtenidos mediante la captura de opiniones 77 4.2 Descripción de los resultados obtenidos mediante Opinion Mining 81 4.2.1 Resultados de opinion mining para la candidata Clara López 81 4.2.2 Resultados de opinion mining para el candidato Enrique Peñalosa 85 4.2.3 Resultados de opinion mining para la candidata Marta Lucía Ramírez 89 4.2.4 Resultados de opinion mining para el candidato Juan Manuel Santos 92 4.2.5 Resultados de opinion mining para el candidato Oscar Iván Zuluaga 96 4.2.6 Resultados de opinion mining obtenidos mediante otros hashtag 100 4.2.6.1 Resultados obtenidos para el hashtag #Elecciones2014 100 4.2.6.2 Resultados obtenidos para el hashtag #SegundaVuelta 101 4.3 Análisis general, con base en los resultados de Opinion Mining 102 4.3.1 Análisis basado en la primera vuelta presidencial y sus candidatos 104 4.3.2 Análisis basado en la segunda vuelta presidencial y sus candidatos 107 4.3.2.1 Análisis basado en otros tweets capturados durante la segunda vuelta presidencial 112 4.4 Contraste entre el análisis general y encuestas de Gallup y Datexco 113 4.4.1 Comparación con encuestas realizadas para la primera vuelta 113 4.4.2 Comparación con encuestas realizadas para la segunda vuelta 117 5. Conclusiones 122 5.1 Discusión 122 5.2 Conclusiones 125 6. Recomendaciones y Trabajo Futuro 127 6.1 Contribuciones 127 6.2 Recomendaciones 129 6.3 Trabajo Futuro 130 7. Referencias 131MaestríaThis research work deals with opinion mining based on the collection of texts through the Web, with the aim of carrying out an analysis of the feelings of Colombians based on comments expressed on 2.0 web sites, For which the central theme was the presidential elections of Colombia in 2014. To capture opinions, a web application capable of collecting tweets based on a specific entity was developed; while for the collection of other comments contained in news websites, a web crawling process was carried out. Thanks to these opinion-capturing instruments, 33,570 comments related to the presidential elections were collected between May 9 and June 15, 2014. The comments collected were submitted to opinion mining through the specialized SentiStrength software solution, but before this it was necessary to build a knowledge base in Spanish, adjusted to the Colombian context. The resulting knowledge base contains 2878 terms, and it is a contribution to the state of the art because it raises the foundations for the creation of knowledge bases in Spanish with the objective of conducting opinion mining in the face of electoral processes, since to date there was no basis of knowledge available in Spanish. Through opinion mining, the image that each of the candidates reflected for the citizens in the two presidential rounds was known, and a general analysis was constructed that allowed us to better understand the trends of Colombians during the presidential elections in Colombia in 2014, and showed that for citizens, there was a mostly negative perspective about said process, mainly supported by disagreement with the candidates and their proposals. This dissatisfaction could be reflected in the results of the opinion mining, which indicated that the candidates Juan Manuel Santos and Oscar Iván Zuluaga obtained a negative polarity or image with respect to the rest of the candidates during the first round. The general analysis carried out was contrasted with the results of various surveys about the election process, carried out by well-known polling firms, finding an important relationship between the results of these surveys and the results of the opinion mining carried out in this work. It is concluded that opinion mining is an area capable of identifying trends in the population, which is why it can be used to predict phenomena or situations, including politics, and therefore facilitate decision-making.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaEmociones y opiniones: un análisis del contexto colombiano a través de opinión miningEmotions and opinions: an analysis of the Colombian context through opinion miningMagíster en Software LibreBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaMaestría en Software Libreinfo:eu-repo/semantics/masterThesisTesishttp://purl.org/redcol/resource_type/TMhttp://purl.org/redcol/resource_type/TMInformation systemsCommunicationSystems EngineeringSoftware managementSoftware applicationSoftware developmentNew technologiesInvestigationsTeachingWeb 2.0MicrobloggingSentiment AnalysisSistemas de informaciónComunicaciónIngeniería de sistemasGestión de softwareAplicación de softwareDesarrollo de softwareNuevas tecnologíasInvestigacionesEnseñanzaWeb 2.0MicrobloggingAnálisis de sentimientoVargas Cogollo, Luis Carlos (2014). Emociones y opiniones: un análisis del contexto colombiano a través de opinión mining. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB, Universitat Oberta de Catalunya UOCAGARWAL, A., XIE, B., VOVSHA, I., RAMBOW, O., & PASSONNEAU, R. (2011). Sentiment Analysis of Twitter Data. En LSM 2011, actas del Workshop sobre lenguajes en medios de comunicación social, pág. 30-38.http://aclweb.org/anthology//W/W11/W11-0705.pdf?CFID=262217785&CFTOKEN=33606415ARAÚJO, M., GONÇALVES, P., & BENEVENUTO, F. (2013). Measuring Sentiments in Online Social Networks. En WebMedia 2013, actas del 19° simposio brasileño en Multimedia y la Web, pág. 97-104. http://dl.acm.org/citation.cfm?id=2526196BAEZA-YATES, R. & RIBEIRO-NETO, B. (2011). Modern Information Retrieval: The Concepts and Technology behind Search (2a edición). USA: Addison-Wesley.BALAHUR, A. (2011). Methods and Resources for Sentiment Analysis in Multilingual Documents of Different Text Types. Tesis de Doctorado, Departamento de Lenguajes y Sistemas Informáticos, Universidad de Alicante, Alicante, España. http://rua.ua.es/dspace/bitstream/10045/19437/1/tesis_alexandrabalahur.pdfBALAHUR, A. & MONTOYO, A. (2008). Determining the Semantic Orientation of Opinions on Products - a Comparative Analysis. Procesamiento del Lenguaje Natural, vol. 41, pp. 201-208. http://www.sepln.org/revistaSEPLN/revista/41/sec8-art1.pdfBANFIELD, A. (1982). Unspeakable Sentences: Narration and Representation in the Language of Fiction. Routledge & Kegan Paul.BERRY, M. & KOGAN, J. (2010). Text Mining: Applications and Theory. Chichester, Reino Unido: John Wiley & Sons Ltd.http://gendocs.ru/docs/3/2304/conv_1/file1.pdfCASTILLO, C., MENDOZA, M., & POBLETE, B. (2011). Information Credibility on Twitter. En WWW 2011, actas de la 20ª conferencia internacional en World Wide Web, pág. 675-684. http://chato.cl/papers/castillo_mendoza_poblete_2010_twitter_credibility.pdfDAVE, K., LAWRENCE, S., & PENNOCK, D. (2003). Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews. En WWW 2003, actas de la 12ª conferencia internacional en World Wide Web, pág. 519-528. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.13.2424&rep=rep1&type=pdfEkman, P. (1992). An Argument for Basic Emotions. Cognition & Emotion, pág. 169-200. http://www.paulekman.com/wp-content/uploads/2013/07/An-Argument-For-Basic-Emotions.pdfEkman, P. (1999). Basic Emotions. En T. Dalgleish and M. Power (Eds.). Handbook of Cognition and Emotion. Sussex, U.K.: John Wiley & Sons, Ltd. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.123.1143&rep=rep1&type=pdfJOACHIMS, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. En ECML 1998, actas de la 10ª conferencia europea en Machine Learning, pág. 137-142. http://www.cs.cornell.edu/people/tj/publications/joachims_98a.pdfKIM, S., & HOVY, E. (2005). Automatic Detection of Opinion Bearing Words and Sentences. En IJCNLP, actas de la Conferencia Conjunta Internacional sobre Procesamiento del Lenguaje Natural, Isla de Jeju, Corea del Sur. http://acl.ldc.upenn.edu/I/I05/I05-2011.pdf?origin=publication_detailLIU, B. (2012). Sentiment Analysis and Opinion Mining. California, EE. UU.: Morgan & Claypool Publishers. http://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.pdfMENDOZA, M., POBLETE, B., & CASTILLO, C. (2010). Twitter Under Crisis: Can we trust what we RT? En SOMA 2010, actas del primer Workshop sobre análisis de medios sociales, pág. 71-79. http://chato.cl/papers/mendoza_poblete_castillo_2010_twitter_terremoto.pdfNASUKAWA, T., & YI, J. (2003). Sentiment analysis: Capturing Favorability Using Natural Language Processing. En K-CAP 2003, actas de la 2ª conferencia internacional sobre la captura del conocimiento, pág. 70-77.http://tredocs.com/tw_files2/urls_41/40/d-39217/7z-docs/7.pdfO’CONNOR, B., BALASUBRAMANYAN, R., ROUTLEDGE, B. & SMITH, N. (2010). From tweets to polls: Linking text sentiment to public opinion time series. En ICWSM ’10, actas de la conferencia internacional AAAI en Weblogs y Social Media, pág. 122-129. http://www.cs.cmu.edu/~nasmith/papers/oconnor+balasubramanyan+routledge+smith.icwsm10.pdfPANG, B. (2006). Automatic Analysis of Document Sentiment. Tesis de Doctorado, Escuela de graduados, Universidad Cornell, Ithaca, Nueva York. http://www.cs.cornell.edu/home/llee/extra/pang-thesis.pdfPANG, B. & LEE, L. (2008). Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, vol. 2(1-2): pp. 1-135.http://www.cse.iitb.ac.in/~pb/cs626-449-2009/prev-years-other-things-nlp/sentiment-analysis-opinion-mining-pang-lee-omsa-published.pdfPÉREZ, D., LOZANO, C., LÓPEZ, A., et al. (2012). Sentiment Analysis in Colombian Online Newspaper Comments. Recent Progress in Data Engineering and Internet Technology, vol. 157, pp. 113-119. http://link.springer.com/chapter/10.1007%2F978-3-642-28798-5_16#page-1SARMENTO, L., CARVALHO, P., SILVA, M. & DE OLIVEIRA, E. (2009). Automatic creation of a reference corpus for political opinion mining in user-generated content. En CIKM ’09, actas del primer Workshop internacional sobre Temas de Sentiment Analysis para Opinión Masiva, pág. 29-36. http://xldb.lasige.di.fc.ul.pt/xldb/publications/sarmento09_document.pdfSCHERER, K. (2005). What are emotions? And how can they be measured? Social Science Information, vol. 3(44): pp. 695-729.http://www.affective-sciences.org/system/files/biblio/2005_Scherer_SSI.pdfVAN DEN BOS, G. (2006). APA Dictionary of Psychology. Washington, DC, EE. UU.: American Psychological Association.WIEBE, J. (1994). Tracking Point of View in Narrative. Computational Linguistics, vol. 20(2): pp. 233-287. http://acl.ldc.upenn.edu/J/J94/J94-2004.pdf?origin=publication_detailWIEBE, J., WILSON, T., & CARDIE, C. (2005). Annotating Expressions of Opinions and Emotions in Language. Language Resources and Evaluation, vol. 39(2-3): pp. 119-122. http://www.cs.cornell.edu/home/cardie/papers/lre05withappendix.pdfORIGINAL2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdfTesisapplication/pdf2114539https://repository.unab.edu.co/bitstream/20.500.12749/3523/1/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdfa6ab73162c83d1cce238665c8f538096MD51open access2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdfArtículoapplication/pdf637208https://repository.unab.edu.co/bitstream/20.500.12749/3523/2/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf6a7108ccb57696bc1c6d175a0423a6c6MD52open accessAnexos.zipAnexos.zipAnexosapplication/octet-stream2779349https://repository.unab.edu.co/bitstream/20.500.12749/3523/3/Anexos.zip583b6f3408ae9a1a46579b2bf3e3a678MD53open accessTHUMBNAIL2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpg2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpgIM Thumbnailimage/jpeg7508https://repository.unab.edu.co/bitstream/20.500.12749/3523/4/2014_Tesis_Vargas_Cogollo_Luis_Carlos.pdf.jpg8fd90d0133106c6d54ee9de8ffbd541fMD54open access2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpg2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpgIM Thumbnailimage/jpeg9731https://repository.unab.edu.co/bitstream/20.500.12749/3523/5/2014_Articulo_Vargas_Cogollo_Luis_Carlos.pdf.jpg64d45dbfb0e7c096a96c75192fc71632MD55open access20.500.12749/3523oai:repository.unab.edu.co:20.500.12749/35232024-01-19 20:01:24.838open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co |