Minería de opiniones basado en la adaptación al español de ANEW sobre opiniones acerca de hoteles

La minería de opiniones (MO) ha mostrado una alta tendencia de investigación en los últimos años debido a la producción en gran escala de opiniones y comentarios por parte de usuarios activos en Internet. Las empresas y organizaciones en general están interesadas en conocer cuál es la reputación que...

Full description

Autores:
Henriquez Miranda, Carlos
Guzmán Luna, Jaime Alberto
Salcedo Morillo, Dixon David
Tipo de recurso:
Article of journal
Fecha de publicación:
2016
Institución:
Corporación Universidad de la Costa
Repositorio:
REDICUC - Repositorio CUC
Idioma:
spa
OAI Identifier:
oai:repositorio.cuc.edu.co:11323/3263
Acceso en línea:
https://hdl.handle.net/11323/3263
https://repositorio.cuc.edu.co/
Palabra clave:
ANEW
Lexicon
NLP
Opinion mining
Sentiment analysis
Minería de opinión
Análisis de sentimiento
lexicón
PLN
Rights
openAccess
License
Attribution-NonCommercial-ShareAlike 4.0 International
Description
Summary:La minería de opiniones (MO) ha mostrado una alta tendencia de investigación en los últimos años debido a la producción en gran escala de opiniones y comentarios por parte de usuarios activos en Internet. Las empresas y organizaciones en general están interesadas en conocer cuál es la reputación que tienen de sus usuarios en las redes sociales, blogs, wikis y otros sitios web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de MO en el idioma inglés. Por este motivo, la comunidad científica está interesada en trabajos diferentes a este lenguaje. En este artículo se muestra la construcción de un sistema de minería de opiniones en español sobre comentarios dados por clientes de diferentes hoteles. El sistema trabaja bajo el enfoque léxico utilizando la adaptación al español de las normas afectivas para las palabras en inglés (ANEW). Estas normas se basan en las evaluaciones que se realizaron en las dimensiones de valencia, excitación y el dominio. Para la construcción del sistema se tuvo en cuenta las fases de extracción, pre procesamiento de textos, identificación del sentimiento y la respectiva clasificación de la opinión utilizando ANEW. Los experimentos del sistema se hicieron sobre un corpus etiquetado proveniente de la versión en español de Tripadvisor. Como resultado final se obtuvo una precisión del 94% superando a sistemas similares.