Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets
The Twitter account of the department of system and computing engineering of the University of Andes is having trouble getting retweets and likes in its tweets. The coordinator of communications says this lack of interaction in Twitter is due to the poor interest from the community towards academic...
- Autores:
-
Beltrán Ochoa, Santiago
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2020
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/51484
- Acceso en línea:
- http://hdl.handle.net/1992/51484
- Palabra clave:
- Redes sociales en línea
Medios de comunicación de masas
Clusters (Sistemas computacionales)
Redes sociales
Ingeniería
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/4.0/
id |
UNIANDES2_2eafd1f27259591983f1a8f92f6284a7 |
---|---|
oai_identifier_str |
oai:repositorio.uniandes.edu.co:1992/51484 |
network_acronym_str |
UNIANDES2 |
network_name_str |
Séneca: repositorio Uniandes |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets |
title |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets |
spellingShingle |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets Redes sociales en línea Medios de comunicación de masas Clusters (Sistemas computacionales) Redes sociales Ingeniería |
title_short |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets |
title_full |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets |
title_fullStr |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets |
title_full_unstemmed |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets |
title_sort |
Modelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweets |
dc.creator.fl_str_mv |
Beltrán Ochoa, Santiago |
dc.contributor.advisor.none.fl_str_mv |
Villamil Giraldo, María del Pilar Moreno Barbosa, Andrés Darío Calvo Martínez, John Steven |
dc.contributor.author.none.fl_str_mv |
Beltrán Ochoa, Santiago |
dc.subject.armarc.none.fl_str_mv |
Redes sociales en línea Medios de comunicación de masas Clusters (Sistemas computacionales) Redes sociales |
topic |
Redes sociales en línea Medios de comunicación de masas Clusters (Sistemas computacionales) Redes sociales Ingeniería |
dc.subject.themes.none.fl_str_mv |
Ingeniería |
description |
The Twitter account of the department of system and computing engineering of the University of Andes is having trouble getting retweets and likes in its tweets. The coordinator of communications says this lack of interaction in Twitter is due to the poor interest from the community towards academic social networks, and not being able to recognize which topics interest the public more than others. This project helps its user understand better which terms, used in a Tweet, generate more retweets based on the topic being displayed in the tweet. This is achieved through prediction, clustering, and a display based on dashboards, that analyzes the behavior of all historical tweets from the department. The solution consists of a pipeline that extracts, cleans, and analyzes tweets to determine which words receive better retweets, based on the topic in which they are used. This solution is deployed in the form of dashboards, each with a different visualization. One with general information from the account, like retweets and likes by date, another which recapitulates retweets by hashtags, likes, and topics, and finally a visualization where you can see which words generate more retweets based on the topic being spoken. This project manages to identify which words have been historically receiving more retweets, based on topics over the years. It also displays information about the state of the tweets from the account throughout time in a straightforward way. |
publishDate |
2020 |
dc.date.issued.none.fl_str_mv |
2020 |
dc.date.accessioned.none.fl_str_mv |
2021-08-10T18:27:11Z |
dc.date.available.none.fl_str_mv |
2021-08-10T18:27:11Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/1992/51484 |
dc.identifier.pdf.none.fl_str_mv |
23203.pdf |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad de los Andes |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional Séneca |
dc.identifier.repourl.spa.fl_str_mv |
repourl:https://repositorio.uniandes.edu.co/ |
url |
http://hdl.handle.net/1992/51484 |
identifier_str_mv |
23203.pdf instname:Universidad de los Andes reponame:Repositorio Institucional Séneca repourl:https://repositorio.uniandes.edu.co/ |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.none.fl_str_mv |
34 hojas |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de los Andes |
dc.publisher.program.none.fl_str_mv |
Ingeniería de Sistemas y Computación |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeniería |
dc.publisher.department.none.fl_str_mv |
Departamento de Ingeniería de Sistemas y Computación |
publisher.none.fl_str_mv |
Universidad de los Andes |
institution |
Universidad de los Andes |
bitstream.url.fl_str_mv |
https://repositorio.uniandes.edu.co/bitstreams/d9f67fed-7c30-49a2-9156-e34af8b7be2f/download https://repositorio.uniandes.edu.co/bitstreams/39cb71bd-42e8-44b6-9706-817978092649/download https://repositorio.uniandes.edu.co/bitstreams/043e3f1f-795f-46fa-9262-5217c489763a/download |
bitstream.checksum.fl_str_mv |
096e00691337245b2ac03ab9132c0f13 b121e723cb4db45c0da437f64a42afc1 235dff1278e40e97d81450f618e83cc2 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional Séneca |
repository.mail.fl_str_mv |
adminrepositorio@uniandes.edu.co |
_version_ |
1812134066409963520 |
spelling |
Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Villamil Giraldo, María del Pilarcc5a2eb9-8c22-4773-870f-33c0c82f4c38400Moreno Barbosa, Andrés Daríodc73c7d4-83ed-44e6-b08b-75035edc0957500Calvo Martínez, John Steven4693b1d3-e258-4e7d-b2e5-42a9ad9f7797500Beltrán Ochoa, Santiagoa407295b-f56a-4646-8f7f-7a87428d35375002021-08-10T18:27:11Z2021-08-10T18:27:11Z2020http://hdl.handle.net/1992/5148423203.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/The Twitter account of the department of system and computing engineering of the University of Andes is having trouble getting retweets and likes in its tweets. The coordinator of communications says this lack of interaction in Twitter is due to the poor interest from the community towards academic social networks, and not being able to recognize which topics interest the public more than others. This project helps its user understand better which terms, used in a Tweet, generate more retweets based on the topic being displayed in the tweet. This is achieved through prediction, clustering, and a display based on dashboards, that analyzes the behavior of all historical tweets from the department. The solution consists of a pipeline that extracts, cleans, and analyzes tweets to determine which words receive better retweets, based on the topic in which they are used. This solution is deployed in the form of dashboards, each with a different visualization. One with general information from the account, like retweets and likes by date, another which recapitulates retweets by hashtags, likes, and topics, and finally a visualization where you can see which words generate more retweets based on the topic being spoken. This project manages to identify which words have been historically receiving more retweets, based on topics over the years. It also displays information about the state of the tweets from the account throughout time in a straightforward way.La red social de Twitter del departamento de ingeniería de sistemas y computación de la universidad de los Andes, actualmente no logra llegar al número de retweets y likes que quisiera en sus publicaciones. Según la coordinadora de gestión y comunicaciones, debido a la falta de interés del público hacia las redes sociales académicas y a la falta de tiempo de la gestión de comunicaciones del departamento, no es posible saber y entender cuáles tópicos, palabras o temáticas en un tweet generan un mayor número de retweets. Es debido a esto que el presente proyecto de grado ayuda a entender que términos en un tweet determinan su número de retweets por temática, mediante el uso de técnicas de predicción, clustering y tableros de control para analizar el comportamiento de los tweets previos del departamento. Estos tableros de control son alimentados por un pipeline que recolecta, procesa y analiza los tweets históricos y actuales del departamento. La solución entregada es un pipeline que extrae, limpia y analiza los tweets para determinar las palabras por tópicos que reciben el mayor número de retweets. Esta solución se despliega en tableros de control con diferentes visualizaciones, una con la información general de la cuenta, retweets por hashtag, likes y tópicos, y una visualización de las palabras por tópicos que más generan retweets. En términos de efectividad, el proyecto logra identificar las palabras más exitosas en los tweets separadas por tópicos a través de los años, y despliega la información general acerca de los tweets de una forma fácil de entender para el usuario.Ingeniero de Sistemas y ComputaciónPregrado34 hojasapplication/pdfspaUniversidad de los AndesIngeniería de Sistemas y ComputaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónModelo de clustering para identificar términos que se utilizan conjuntamente para aumentar la cantidad de retweetsTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TPRedes sociales en líneaMedios de comunicación de masasClusters (Sistemas computacionales)Redes socialesIngeniería201632541PublicationTHUMBNAIL23203.pdf.jpg23203.pdf.jpgIM Thumbnailimage/jpeg5798https://repositorio.uniandes.edu.co/bitstreams/d9f67fed-7c30-49a2-9156-e34af8b7be2f/download096e00691337245b2ac03ab9132c0f13MD55ORIGINAL23203.pdfapplication/pdf1175782https://repositorio.uniandes.edu.co/bitstreams/39cb71bd-42e8-44b6-9706-817978092649/downloadb121e723cb4db45c0da437f64a42afc1MD51TEXT23203.pdf.txt23203.pdf.txtExtracted texttext/plain79303https://repositorio.uniandes.edu.co/bitstreams/043e3f1f-795f-46fa-9262-5217c489763a/download235dff1278e40e97d81450f618e83cc2MD541992/51484oai:repositorio.uniandes.edu.co:1992/514842023-10-10 19:41:34.909http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co |