Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets

The Twitter account of the department of system and computing engineering of the University of Andes is having trouble getting retweets and likes in its tweets. The coordinator of communications says this lack of interaction in Twitter is due to the poor interest from the community towards academic...

Full description

Autores:
Beltrán Ochoa, Santiago
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/51484
Acceso en línea:
http://hdl.handle.net/1992/51484
Palabra clave:
Redes sociales en línea
Medios de comunicación de masas
Clusters (Sistemas computacionales)
Redes sociales
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_2eafd1f27259591983f1a8f92f6284a7
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/51484
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
title Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
spellingShingle Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
Redes sociales en línea
Medios de comunicación de masas
Clusters (Sistemas computacionales)
Redes sociales
Ingeniería
title_short Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
title_full Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
title_fullStr Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
title_full_unstemmed Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
title_sort Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
dc.creator.fl_str_mv Beltrán Ochoa, Santiago
dc.contributor.advisor.none.fl_str_mv Villamil Giraldo, María del Pilar
Moreno Barbosa, Andrés Darío
Calvo Martínez, John Steven
dc.contributor.author.none.fl_str_mv Beltrán Ochoa, Santiago
dc.subject.armarc.none.fl_str_mv Redes sociales en línea
Medios de comunicación de masas
Clusters (Sistemas computacionales)
Redes sociales
topic Redes sociales en línea
Medios de comunicación de masas
Clusters (Sistemas computacionales)
Redes sociales
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description The Twitter account of the department of system and computing engineering of the University of Andes is having trouble getting retweets and likes in its tweets. The coordinator of communications says this lack of interaction in Twitter is due to the poor interest from the community towards academic social networks, and not being able to recognize which topics interest the public more than others. This project helps its user understand better which terms, used in a Tweet, generate more retweets based on the topic being displayed in the tweet. This is achieved through prediction, clustering, and a display based on dashboards, that analyzes the behavior of all historical tweets from the department. The solution consists of a pipeline that extracts, cleans, and analyzes tweets to determine which words receive better retweets, based on the topic in which they are used. This solution is deployed in the form of dashboards, each with a different visualization. One with general information from the account, like retweets and likes by date, another which recapitulates retweets by hashtags, likes, and topics, and finally a visualization where you can see which words generate more retweets based on the topic being spoken. This project manages to identify which words have been historically receiving more retweets, based on topics over the years. It also displays information about the state of the tweets from the account throughout time in a straightforward way.
publishDate 2020
dc.date.issued.none.fl_str_mv 2020
dc.date.accessioned.none.fl_str_mv 2021-08-10T18:27:11Z
dc.date.available.none.fl_str_mv 2021-08-10T18:27:11Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/51484
dc.identifier.pdf.none.fl_str_mv 23203.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/51484
identifier_str_mv 23203.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 34 hojas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Ingeniería de Sistemas y Computación
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/d9f67fed-7c30-49a2-9156-e34af8b7be2f/download
https://repositorio.uniandes.edu.co/bitstreams/39cb71bd-42e8-44b6-9706-817978092649/download
https://repositorio.uniandes.edu.co/bitstreams/043e3f1f-795f-46fa-9262-5217c489763a/download
bitstream.checksum.fl_str_mv 096e00691337245b2ac03ab9132c0f13
b121e723cb4db45c0da437f64a42afc1
235dff1278e40e97d81450f618e83cc2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812134066409963520
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Villamil Giraldo, María del Pilarcc5a2eb9-8c22-4773-870f-33c0c82f4c38400Moreno Barbosa, Andrés Daríodc73c7d4-83ed-44e6-b08b-75035edc0957500Calvo Martínez, John Steven4693b1d3-e258-4e7d-b2e5-42a9ad9f7797500Beltrán Ochoa, Santiagoa407295b-f56a-4646-8f7f-7a87428d35375002021-08-10T18:27:11Z2021-08-10T18:27:11Z2020http://hdl.handle.net/1992/5148423203.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/The Twitter account of the department of system and computing engineering of the University of Andes is having trouble getting retweets and likes in its tweets. The coordinator of communications says this lack of interaction in Twitter is due to the poor interest from the community towards academic social networks, and not being able to recognize which topics interest the public more than others. This project helps its user understand better which terms, used in a Tweet, generate more retweets based on the topic being displayed in the tweet. This is achieved through prediction, clustering, and a display based on dashboards, that analyzes the behavior of all historical tweets from the department. The solution consists of a pipeline that extracts, cleans, and analyzes tweets to determine which words receive better retweets, based on the topic in which they are used. This solution is deployed in the form of dashboards, each with a different visualization. One with general information from the account, like retweets and likes by date, another which recapitulates retweets by hashtags, likes, and topics, and finally a visualization where you can see which words generate more retweets based on the topic being spoken. This project manages to identify which words have been historically receiving more retweets, based on topics over the years. It also displays information about the state of the tweets from the account throughout time in a straightforward way.La red social de Twitter del departamento de ingeniería de sistemas y computación de la universidad de los Andes, actualmente no logra llegar al número de retweets y likes que quisiera en sus publicaciones. Según la coordinadora de gestión y comunicaciones, debido a la falta de interés del público hacia las redes sociales académicas y a la falta de tiempo de la gestión de comunicaciones del departamento, no es posible saber y entender cuáles tópicos, palabras o temáticas en un tweet generan un mayor número de retweets. Es debido a esto que el presente proyecto de grado ayuda a entender que términos en un tweet determinan su número de retweets por temática, mediante el uso de técnicas de predicción, clustering y tableros de control para analizar el comportamiento de los tweets previos del departamento. Estos tableros de control son alimentados por un pipeline que recolecta, procesa y analiza los tweets históricos y actuales del departamento. La solución entregada es un pipeline que extrae, limpia y analiza los tweets para determinar las palabras por tópicos que reciben el mayor número de retweets. Esta solución se despliega en tableros de control con diferentes visualizaciones, una con la información general de la cuenta, retweets por hashtag, likes y tópicos, y una visualización de las palabras por tópicos que más generan retweets. En términos de efectividad, el proyecto logra identificar las palabras más exitosas en los tweets separadas por tópicos a través de los años, y despliega la información general acerca de los tweets de una forma fácil de entender para el usuario.Ingeniero de Sistemas y ComputaciónPregrado34 hojasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónModelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweetsTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPRedes sociales en líneaMedios de comunicación de masasClusters (Sistemas computacionales)Redes socialesIngeniería201632541PublicationTHUMBNAIL23203.pdf.jpg23203.pdf.jpgIM Thumbnailimage/jpeg5798https://repositorio.uniandes.edu.co/bitstreams/d9f67fed-7c30-49a2-9156-e34af8b7be2f/download096e00691337245b2ac03ab9132c0f13MD55ORIGINAL23203.pdfapplication/pdf1175782https://repositorio.uniandes.edu.co/bitstreams/39cb71bd-42e8-44b6-9706-817978092649/downloadb121e723cb4db45c0da437f64a42afc1MD51TEXT23203.pdf.txt23203.pdf.txtExtracted texttext/plain79303https://repositorio.uniandes.edu.co/bitstreams/043e3f1f-795f-46fa-9262-5217c489763a/download235dff1278e40e97d81450f618e83cc2MD541992/51484oai:repositorio.uniandes.edu.co:1992/514842023-10-10 19:41:34.909http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co