Prototipo de Herramienta de Software que Permite Realizar Minería de Opinión en Español Utilizando un Motor de Bases de Datos No Relacional

El presente documento describe el desarrollo e implementación de la herramienta de software que permite realizar análisis de opinión de hechos o personajes que estén siendo tendencia en el microblogging Twitter mediante la aplicación del procesamiento de lenguaje natural, recursos léxicos y usando e...

Full description

Autores:
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2017
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/6301
Acceso en línea:
http://hdl.handle.net/11349/6301
Palabra clave:
Minería de Opinión
Procesamiento de Lenguaje Natural
Bases de Datos No Relacionales
Twitter
Análisis de Sentimiento
Lexicón
INGENIERÍA DE SISTEMAS - TESIS Y DISERTACIONES ACADÉMICAS
DESARROLLO DE PROTOTIPOS
MINERÍA DE DATOS
REDES SOCIALES
BASES DE DATOS RELACIONALES
Opinion Mining
Natural Language Processing
Non-Relational Databases
Twitter
Sentiment Analysis
Lexicon
Rights
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional
Description
Summary:El presente documento describe el desarrollo e implementación de la herramienta de software que permite realizar análisis de opinión de hechos o personajes que estén siendo tendencia en el microblogging Twitter mediante la aplicación del procesamiento de lenguaje natural, recursos léxicos y usando el sistema de bases de datos no relacional orientado a documentos MongoDB . La herramienta se desarrolló aplicando la arquitectura de software cliente servidor y usando el lenguaje de programación Python para realizar el análisis de opinión junto con el API de Twitter, donde se descarga un conjunto de Tweets por cada uno de los hashtags a los que se les desea consultar su favorabilidad, se realiza un preprocesamiento para adecuar el contenido de los Tweets y el procesamiento que permite obtener el valor que representa la favorabilidad del Hashtag analizado.