Estudio comparativo de técnicas tradicionales del modelado de tópicos frente a redes neuronales artificiales tomando como contexto el discurso digital del autor en la red social Twitter y otras publicaciones

Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis...

Full description

Autores:
Rincón Ruiz, John Harley
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/53331
Acceso en línea:
http://hdl.handle.net/1992/53331
Palabra clave:
Redes neurales (Computadores)
Recuperación de información
Sistemas de almacenamiento y recuperación de información
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:Minuto a minuto ideas, pensamientos, opiniones, libros, documentos, mensajes entre otros, son plasmados en el mundo a través de diferentes plataformas digitales disponibles para el uso de la humanidad. Este crecimiento exponencial de textos digitales ha traído diferentes desafíos de cara al análisis, comprensión y entendimiento humano, por ejemplo, entender en un año de publicaciones de un periódico cuál fue el tema principal del que se habló en un país, conocer de los tweets disponibles cuál es el discurso real de un personaje político o extraer los detalles ocultos que se encuentran plasmados en los manuscritos de Leonardo Da Vinci. Realizar cualquiera de estas actividades de parte de un humano podría tomar un tiempo prolongado e indeterminado. Por fortuna, en los últimos años, dentro del campo del aprendizaje automático han surgido diversas técnicas que apoyan esta problemática y delegan este análisis de texto a las máquinas, entre estas se encuentra el modelado de tópicos. Esta propuesta basa su funcionamiento en el marco estadístico buscando apoyar el procesamiento y exploración de grandes volúmenes de textos digitales encontrando en ellos patrones ocultos que a simple vista no son fáciles de encontrar por un humano; es decir, es capaz de procesar colecciones de documentos digitales mostrando el espacio latente de los textos y revelando el significado profundo de la colección, del que se habla realmente.