Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones

Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis...

Full description

Autores:
Rincón Ruiz, John Harley
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/53331
Acceso en línea:
http://hdl.handle.net/1992/53331
Palabra clave:
Redes neurales (Computadores)
Recuperación de información
Sistemas de almacenamiento y recuperación de información
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
id UNIANDES2_a9169bfd369ee9a8730f1a17d1360cc2
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/53331
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
title Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
spellingShingle Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
Redes neurales (Computadores)
Recuperación de información
Sistemas de almacenamiento y recuperación de información
Ingeniería
title_short Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
title_full Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
title_fullStr Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
title_full_unstemmed Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
title_sort Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones
dc.creator.fl_str_mv Rincón Ruiz, John Harley
dc.contributor.advisor.none.fl_str_mv Núñez Castro, Haydemar María
dc.contributor.author.none.fl_str_mv Rincón Ruiz, John Harley
dc.contributor.jury.none.fl_str_mv Jiménez Guarín, Claudia Lucía
Afanador Llach, María José
dc.subject.armarc.none.fl_str_mv Redes neurales (Computadores)
Recuperación de información
Sistemas de almacenamiento y recuperación de información
topic Redes neurales (Computadores)
Recuperación de información
Sistemas de almacenamiento y recuperación de información
Ingeniería
dc.subject.themes.none.fl_str_mv Ingeniería
description Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis, comprensión y entendimiento humano, por ejemplo, entender en un año de publicaciones de un periódico cuál fue el tema principal del que se habló en un país, conocer de los tweets disponibles cuál es el discurso real de un personaje político o extraer los detalles ocultos que se encuentran plasmados en los manuscritos de Leonardo Da Vinci. Realizar cualquiera de estas actividades de parte de un humano podría tomar un tiempo prolongado e indeterminado. Por fortuna, en los últimos años, dentro del campo del aprendizaje automático han surgido diversas técnicas que apoyan esta problemática y delegan este análisis de texto a las máquinas, entre estas se encuentra el modelado de tópicos. Esta propuesta basa su funcionamiento en el marco estadístico buscando apoyar el procesamiento y exploración de grandes volúmenes de textos digitales encontrando en ellos patrones ocultos que a simple vista no son fáciles de encontrar por un humano; es decir, es capaz de procesar colecciones de documentos digitales mostrando el espacio latente de los textos y revelando el significado profundo de la colección, del que se habla realmente.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-11-03T16:18:40Z
dc.date.available.none.fl_str_mv 2021-11-03T16:18:40Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/1992/53331
dc.identifier.pdf.none.fl_str_mv 24279.pdf
dc.identifier.instname.spa.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.spa.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url http://hdl.handle.net/1992/53331
identifier_str_mv 24279.pdf
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 84 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Maestría en Ingeniería de Información
dc.publisher.faculty.none.fl_str_mv Facultad de Ingeniería
dc.publisher.department.none.fl_str_mv Departamento de Ingeniería de Sistemas y Computación
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/ffd8b875-3359-49ad-8c04-aa38a54b4abe/download
https://repositorio.uniandes.edu.co/bitstreams/ba5e86c6-4eaa-481e-ae55-28ef6a493775/download
https://repositorio.uniandes.edu.co/bitstreams/f7f3bf27-ccce-4862-979e-1abab40d6a8c/download
bitstream.checksum.fl_str_mv 6b51b1d303a5c7902627ba319f0c5c4d
54e43a1ad12794380fcb77836bdd9b17
3e36e9b1670122bfc844da702684fe88
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812134029765378048
spelling Al consultar y hacer uso de este recurso, está aceptando las condiciones de uso establecidas por los autores.http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Núñez Castro, Haydemar Maríad6c667b2-5403-4255-b536-ba25a1f592ad600Rincón Ruiz, John Harleyf43b9555-b6b2-4fac-abcd-f6af28a3de6c600Jiménez Guarín, Claudia LucíaAfanador Llach, María José2021-11-03T16:18:40Z2021-11-03T16:18:40Z2021http://hdl.handle.net/1992/5333124279.pdfinstname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis, comprensión y entendimiento humano, por ejemplo, entender en un año de publicaciones de un periódico cuál fue el tema principal del que se habló en un país, conocer de los tweets disponibles cuál es el discurso real de un personaje político o extraer los detalles ocultos que se encuentran plasmados en los manuscritos de Leonardo Da Vinci. Realizar cualquiera de estas actividades de parte de un humano podría tomar un tiempo prolongado e indeterminado. Por fortuna, en los últimos años, dentro del campo del aprendizaje automático han surgido diversas técnicas que apoyan esta problemática y delegan este análisis de texto a las máquinas, entre estas se encuentra el modelado de tópicos. Esta propuesta basa su funcionamiento en el marco estadístico buscando apoyar el procesamiento y exploración de grandes volúmenes de textos digitales encontrando en ellos patrones ocultos que a simple vista no son fáciles de encontrar por un humano; es decir, es capaz de procesar colecciones de documentos digitales mostrando el espacio latente de los textos y revelando el significado profundo de la colección, del que se habla realmente.Minute by minute ideas, thoughts, opinions, books, documents, messages, among others, are captured around the world through different digital platforms available for the use of humanity. This exponential growth of digital texts has brought different challenges in terms of analysis, comprehension and human understanding, for example, understand what was the main topic that was discussed in a country in one year of newspaper publications, know from the available tweets what is the real speech of a political figure or extract the hidden details that are embedded in the manuscripts of Leonardo Da Vinci. Performing any of these activities by a human could take a long and indeterminate amount of time. Fortunately, in recent years, in the machine learning area, several techniques have emerged to tackle this problem e.g., topic modeling, technique that delegate text analysis to machines. Topic modelling bases its operation on the statistical framework to support the processing and exploration of large volumes of digital documents to find hidden patterns in them that at first glance are not easy to see by a human; this technique is able to process collections of digital documents showing the latent space of the texts and revealing the deep meaning of the collection, what being talked about around documents. Today, topic modeling relies on several traditional techniques such as latent semantic analysis (LSA), probabilistic latent semantic analysis (pLSA) and latent Dirichlet attribution (LDA). In parallel, but not different way are the neural networks (NN) in constant growth and adoption due to advances in data processing and storage which have facilitated their training and deployment, neural networks are versatile when processing different types of e.g., digital text. This research presents a comparison of the traditional techniques of topic modeling versus neural networks taking as context the thoughts expressed by different authors in short and long digital documents.Magíster en Ingeniería de InformaciónMaestría84 páginasapplication/pdfspaUniversidad de los AndesMaestría en Ingeniería de InformaciónFacultad de IngenieríaDepartamento de Ingeniería de Sistemas y ComputaciónEstudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicacionesTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesishttp://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/TMRedes neurales (Computadores)Recuperación de informaciónSistemas de almacenamiento y recuperación de informaciónIngeniería201707568PublicationTEXT24279.pdf.txt24279.pdf.txtExtracted texttext/plain191925https://repositorio.uniandes.edu.co/bitstreams/ffd8b875-3359-49ad-8c04-aa38a54b4abe/download6b51b1d303a5c7902627ba319f0c5c4dMD54THUMBNAIL24279.pdf.jpg24279.pdf.jpgIM Thumbnailimage/jpeg11296https://repositorio.uniandes.edu.co/bitstreams/ba5e86c6-4eaa-481e-ae55-28ef6a493775/download54e43a1ad12794380fcb77836bdd9b17MD55ORIGINAL24279.pdfapplication/pdf4316804https://repositorio.uniandes.edu.co/bitstreams/f7f3bf27-ccce-4862-979e-1abab40d6a8c/download3e36e9b1670122bfc844da702684fe88MD511992/53331oai:repositorio.uniandes.edu.co:1992/533312023-10-10 19:00:53.777http://creativecommons.org/licenses/by-nc-nd/4.0/open.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.co