Modelado de temas y análisis de sentimientos utilizando inteligencia artificial
Este documento describe el proyecto de pasantía realizado en Inversiones Gutiérrez García, que es una empresa que se centra en el desarrollo de herramientas basadas en inteligencia artificial, como la visión por computadora y el procesamiento del lenguaje natural (NLP). Una gran porción de sus clien...
- Autores:
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad Distrital Francisco José de Caldas
- Repositorio:
- RIUD: repositorio U. Distrital
- Idioma:
- spa
- OAI Identifier:
- oai:repository.udistrital.edu.co:11349/31845
- Acceso en línea:
- http://hdl.handle.net/11349/31845
- Palabra clave:
- Inteligencia artificial
Análisis de sentimientos
Modelado de temas
Procesamiento del lenguaje natural
Aprendizaje automático
Ingeniería Electrónica -- Tesis y disertaciones académicas
Inteligencia artificial en servicios de estaciones de servicio (EDS)
Análisis de sentimiento en textos en español
Reconocimiento de entidades nombradas (NER)
Modelos BERTopic y KeyBERT
Artificial intelligence
Sentiment analysis
Theme modeling
Natural language processing
Machine learning
- Rights
- License
- Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Summary: | Este documento describe el proyecto de pasantía realizado en Inversiones Gutiérrez García, que es una empresa que se centra en el desarrollo de herramientas basadas en inteligencia artificial, como la visión por computadora y el procesamiento del lenguaje natural (NLP). Una gran porción de sus clientes son estaciones de servicios (EDS). Estas necesitan aplicaciones de NLP que les permitan conocer de manera recursiva y automatizada la percepción de los clientes hacia su servicio y su posicionamiento como empresa frente a los competidores. Debido a las necesidades anteriormente descritas, se procede a desarrollar modelos que tengan como propósito la clasificación de la polaridad de comentarios y la identificación de temas, específicamente en textos en idioma español y en con un “lenguaje” particular y específico, como el usado en el contexto de las estaciones de servicio. Se logró entrenar dos modelos para distintas tareas, el primero es el modelo de análisis de sentimiento que permite clasificar documentos según la polaridad del comentario (negativa, neutra y positiva). El segundo es el modelo de reconocimiento de entidades nombradas (NER), el cual detecta automáticamente entidades importantes, lo que permite estructurar la información. Además de los modelos entrenados, se usaron los modelos BERTopic y KeyBert para la extracción de temas en un conjunto de documentos y la extracción de palabras clave en un documento. Finalmente se proponen seis aplicaciones para la navegación de los datos obtenidos y la utilización sencilla de los modelos. Cuatro de estas aplicaciones permiten usar de manera intuitiva y sencilla los cuatro modelos implementados en el proyecto (Análisis de sentimientos, modelo NER, BERTopic y KeyBERT). La quinta aplicación permite navegar geográficamente por estaciones de servicios y sus comentarios asociados, lo cual genera una percepción del posicionamiento de la EDS frente a la competencia. La sexta aplicación permite visualizar los embeddings de comentarios en 2 dimensiones, lo cual es clave para el entendimiento de la clasificación y separación de temas por documentos. |
---|