From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques

Los cambios producidos en los últimos años en cuanto a modelos de comunicación social han llevado a todos los sectores a adaptarse a los nuevos medios para alcanzar a su público. La comunicación de la ciencia no es una excepción. La manera en que se distribuyen contenidos sobre ciencia está cambiand...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2020
Institución:
Universidad del Rosario
Repositorio:
Repositorio EdocUR - U. Rosario
Idioma:
spa
OAI Identifier:
oai:repository.urosario.edu.co:10336/29119
Acceso en línea:
https://doi.org/10.12804/revistas.urosario.edu.co/disertaciones/a.7691
https://repository.urosario.edu.co/handle/10336/29119
Palabra clave:
Análisis de sentimiento
aprendizaje automático supervisado
Twitter
comunicación científica
Sentiment analysis
Twitter
supervised machine learning
scientific communication
Análise de Sentimento
aprendizagem automática supervisada
Twitter
comunicação científica
Rights
License
Abierto (Texto Completo)
id EDOCUR2_80c9965fad92efb683ed2f4a74621391
oai_identifier_str oai:repository.urosario.edu.co:10336/29119
network_acronym_str EDOCUR2
network_name_str Repositorio EdocUR - U. Rosario
repository_id_str
dc.title.spa.fl_str_mv From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
dc.title.TranslatedTitle.por.fl_str_mv Do data-driven ao data-feeling: análise de sentimento no tempo real de mensagens em espanhol sobre divulgação científica usando técnicas de aprendizagem automática
dc.title.alternative.spa.fl_str_mv Del data-driven al data-feeling: análisis de sentimiento en tiempo real de mensajes en español sobre divulgación científica usando técnicas de aprendizaje automático
title From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
spellingShingle From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
Análisis de sentimiento
aprendizaje automático supervisado
Twitter
comunicación científica
Sentiment analysis
Twitter
supervised machine learning
scientific communication
Análise de Sentimento
aprendizagem automática supervisada
Twitter
comunicação científica
title_short From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
title_full From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
title_fullStr From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
title_full_unstemmed From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
title_sort From Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning Techniques
dc.subject.spa.fl_str_mv Análisis de sentimiento
aprendizaje automático supervisado
Twitter
comunicación científica
Sentiment analysis
Twitter
supervised machine learning
scientific communication
Análise de Sentimento
aprendizagem automática supervisada
Twitter
topic Análisis de sentimiento
aprendizaje automático supervisado
Twitter
comunicación científica
Sentiment analysis
Twitter
supervised machine learning
scientific communication
Análise de Sentimento
aprendizagem automática supervisada
Twitter
comunicação científica
dc.subject.keyword.por.fl_str_mv comunicação científica
description Los cambios producidos en los últimos años en cuanto a modelos de comunicación social han llevado a todos los sectores a adaptarse a los nuevos medios para alcanzar a su público. La comunicación de la ciencia no es una excepción. La manera en que se distribuyen contenidos sobre ciencia está cambiando debido a la presencia creciente de tecnologías, y la red social Twitter se ha convertido en un importante aliado debido a su gran volumen de usuarios. En el presente trabajo, se utilizan técnicas de aprendizaje automático para desarrollar un clasificador -que funciona en tiempo real- de sentimiento relacionados con mensajes publicados en Twitter. Para ello, se descargaron 200 000 tweets destinados a construir un corpus de entrenamiento limpio y procesado de 10 000 textos etiquetados, la mitad positivos y la mitad negativos, sobre ciencia en español. El corpus permite entrenar el modelo de aprendizaje automático y construir un prototipo OpScience, capaz de determinar el sentimiento de mensajes publicados en Twitter en tiempo real. Los resultados relacionados con la exactitud del clasificador corresponden al 72 %. Estos resultados pueden ayudar a darle mayor valor a temas de la comunicación científica en un espacio de debate social y predecir intereses o tendencias futuras, como se pudo comprobar en una prueba en enero de 2019.
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-09-09T15:33:52Z
dc.date.available.none.fl_str_mv 2020-09-09T15:33:52Z
dc.date.created.spa.fl_str_mv 2020-01-17
dc.type.eng.fl_str_mv article
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.spa.spa.fl_str_mv Artículo
dc.identifier.doi.none.fl_str_mv https://doi.org/10.12804/revistas.urosario.edu.co/disertaciones/a.7691
dc.identifier.issn.none.fl_str_mv 1856-9536
dc.identifier.uri.none.fl_str_mv https://repository.urosario.edu.co/handle/10336/29119
url https://doi.org/10.12804/revistas.urosario.edu.co/disertaciones/a.7691
https://repository.urosario.edu.co/handle/10336/29119
identifier_str_mv 1856-9536
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.citationEndPage.none.fl_str_mv 58
dc.relation.citationIssue.none.fl_str_mv No. 1
dc.relation.citationStartPage.none.fl_str_mv 35
dc.relation.citationTitle.none.fl_str_mv Anuario Electrónico de Estudios en Comunicación Social Disertaciones
dc.relation.citationVolume.none.fl_str_mv Vol. 13
dc.relation.ispartof.spa.fl_str_mv Anuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; Vol. 13 Núm. 1 (2020); 35-58
Anuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; v. 13 n. 1 (2020); 35-58
Anuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; Vol. 13 No. 1 (2020); 35-58
dc.relation.uri.spa.fl_str_mv https://revistas.urosario.edu.co/index.php/disertaciones/article/view/7691
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.acceso.spa.fl_str_mv Abierto (Texto Completo)
rights_invalid_str_mv Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad del Rosario
Universidad de Los Andes
Universidad Complutense de Madrid
dc.source.spa.fl_str_mv Anuario Electrónico de Estudios en Comunicación Social 'Disertaciones
institution Universidad del Rosario
dc.source.instname.none.fl_str_mv instname:Universidad del Rosario
dc.source.reponame.none.fl_str_mv reponame:Repositorio Institucional EdocUR
repository.name.fl_str_mv Repositorio institucional EdocUR
repository.mail.fl_str_mv edocur@urosario.edu.co
_version_ 1814167679129354240
spelling 09fa4120-d0fb-424e-b854-9d2a41573220-1fe842197-95fc-4f39-a3ba-cfc09d861f72-1a5827b21-82ec-421d-be76-d9c446d34c49-12020-09-09T15:33:52Z2020-09-09T15:33:52Z2020-01-17Los cambios producidos en los últimos años en cuanto a modelos de comunicación social han llevado a todos los sectores a adaptarse a los nuevos medios para alcanzar a su público. La comunicación de la ciencia no es una excepción. La manera en que se distribuyen contenidos sobre ciencia está cambiando debido a la presencia creciente de tecnologías, y la red social Twitter se ha convertido en un importante aliado debido a su gran volumen de usuarios. En el presente trabajo, se utilizan técnicas de aprendizaje automático para desarrollar un clasificador -que funciona en tiempo real- de sentimiento relacionados con mensajes publicados en Twitter. Para ello, se descargaron 200 000 tweets destinados a construir un corpus de entrenamiento limpio y procesado de 10 000 textos etiquetados, la mitad positivos y la mitad negativos, sobre ciencia en español. El corpus permite entrenar el modelo de aprendizaje automático y construir un prototipo OpScience, capaz de determinar el sentimiento de mensajes publicados en Twitter en tiempo real. Los resultados relacionados con la exactitud del clasificador corresponden al 72 %. Estos resultados pueden ayudar a darle mayor valor a temas de la comunicación científica en un espacio de debate social y predecir intereses o tendencias futuras, como se pudo comprobar en una prueba en enero de 2019.The changes produced in recent years in social communication models have meant that all sectors have had to adapt to new media to reach their audiences. The communication of science is no exception. The distribution of contents about science is adapting to an increasing presence of technologies, and the social network Twitter has become a necessary ally due to its large volume of users. In this paper, machine learning techniques are used to develop a sentiment classifier of messages posted in real-time on Twitter. To this end, 200 000 tweets were downloaded to build a training corpus of 10 000 clean and processed labeled texts, half positive and half negative, about science in Spanish. This corpus allows the training of the machine learning model and builds a prototype, OpScience, able to determine the sentiment of messages posted on Twitter in real-time. The accuracy results obtained by the classifier is around 72 %. This can help to assess issues of scientific communication in a space of social debate and predict future interests or trends, as observed during the test in January 2019.application/pdfhttps://doi.org/10.12804/revistas.urosario.edu.co/disertaciones/a.76911856-9536https://repository.urosario.edu.co/handle/10336/29119spaUniversidad del RosarioUniversidad de Los AndesUniversidad Complutense de Madrid58No. 135Anuario Electrónico de Estudios en Comunicación Social DisertacionesVol. 13Anuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; Vol. 13 Núm. 1 (2020); 35-58Anuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; v. 13 n. 1 (2020); 35-58Anuario Electrónico de Estudios en Comunicación Social 'Disertaciones'; Vol. 13 No. 1 (2020); 35-58https://revistas.urosario.edu.co/index.php/disertaciones/article/view/7691Abierto (Texto Completo)http://purl.org/coar/access_right/c_abf2Anuario Electrónico de Estudios en Comunicación Social 'Disertacionesinstname:Universidad del Rosarioreponame:Repositorio Institucional EdocURAnálisis de sentimientoaprendizaje automático supervisadoTwittercomunicación científicaSentiment analysisTwittersupervised machine learningscientific communicationAnálise de Sentimentoaprendizagem automática supervisadaTwittercomunicação científicaFrom Data-Driven to Data-Feeling: Sentiment Analysis in Real-Time of Messages in Spanish about Scientific Communication Using Machine Learning TechniquesDo data-driven ao data-feeling: análise de sentimento no tempo real de mensagens em espanhol sobre divulgação científica usando técnicas de aprendizagem automáticaDel data-driven al data-feeling: análisis de sentimiento en tiempo real de mensajes en español sobre divulgación científica usando técnicas de aprendizaje automáticoarticleArtículohttp://purl.org/coar/version/c_970fb48d4fbd8a85http://purl.org/coar/resource_type/c_6501Sánchez-Holgado, PatriciaMartín-Merino Acera, ManuelBlanco Herrero, David10336/29119oai:repository.urosario.edu.co:10336/291192021-06-03 00:52:28.71https://repository.urosario.edu.coRepositorio institucional EdocURedocur@urosario.edu.co