Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español

Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos d...

Full description

Autores:
Henriquez Miranda, Carlos Nelson
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
1997
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/61028
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/61028
http://bdigital.unal.edu.co/59833/
Palabra clave:
03 Obras enciclopédicas generales / Encyclopedias and books of facts
Análisis de sentimientos a nivel de aspectos
Ontologías
Aprendizaje de máquina no supervisado.
Aspect-Based Sentiment Analysis
Ontology
Unsupervised machine learning
Opinion mining
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_565546c638f1c9dfe27760b4747fb97d
oai_identifier_str oai:repositorio.unal.edu.co:unal/61028
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
title Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
spellingShingle Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
03 Obras enciclopédicas generales / Encyclopedias and books of facts
Análisis de sentimientos a nivel de aspectos
Ontologías
Aprendizaje de máquina no supervisado.
Aspect-Based Sentiment Analysis
Ontology
Unsupervised machine learning
Opinion mining
title_short Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
title_full Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
title_fullStr Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
title_full_unstemmed Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
title_sort Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español
dc.creator.fl_str_mv Henriquez Miranda, Carlos Nelson
dc.contributor.author.spa.fl_str_mv Henriquez Miranda, Carlos Nelson
dc.contributor.spa.fl_str_mv Guzman Luna, Jaime Alberto
dc.subject.ddc.spa.fl_str_mv 03 Obras enciclopédicas generales / Encyclopedias and books of facts
topic 03 Obras enciclopédicas generales / Encyclopedias and books of facts
Análisis de sentimientos a nivel de aspectos
Ontologías
Aprendizaje de máquina no supervisado.
Aspect-Based Sentiment Analysis
Ontology
Unsupervised machine learning
Opinion mining
dc.subject.proposal.spa.fl_str_mv Análisis de sentimientos a nivel de aspectos
Ontologías
Aprendizaje de máquina no supervisado.
Aspect-Based Sentiment Analysis
Ontology
Unsupervised machine learning
Opinion mining
description Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de AS que detectan el sentimiento global de una opinión escrita sobre una frase o un documento completo; estos sistemas resultan a veces incompletos ante la realidad de las organizaciones que quieren saber en detalle el comportamiento de sus productos. Resultados de esa necesidad, existen enfoques de AS dedicados a realizar un análisis más completo de grano fino, en donde se identifican las características o aspectos más importantes de una opinión para poder determinar el sentimiento de cada uno de los aspectos. Sin embargo, la mayoría de enfoques, no tienen en cuenta el concepto o significado de las palabras en el proceso de identificar los aspectos, por otra parte, se necesita un gran número de documentos etiquetados manualmente para determinar el sentimiento. Con el fin de dar solución a estos problemas, este trabajo de tesis doctoral, propone la construcción de un modelo para analizar sentimientos a nivel de aspectos en español, que permita extraer automáticamente las características de una opinión y determinar el sentimiento (polaridad) asociado. El modelo está basado en dos técnicas, la primera se basa en ontologías para detección aspectos explícitos e implícitos y la segunda, utiliza el aprendizaje de máquina no supervisado para determinar la polaridad sobre una estructura gramatical simple. Este modelo tiene en cuenta el significado de los aspectos en el momento de extracción, y es completamente no supervisado, lo que permite implementar un sistema que sea rápidamente escalable a cualquier idioma o dominio. Para la implementación del modelo, se desarrolló el prototipo AspectSA (elaborado en JAVA), que contiene componentes de software que permiten realizar el análisis de sentimientos a nivel de aspectos en los dominios de restaurante y hoteles. Adicionalmente, este prototipo se validó utilizando un conjunto de experimentos basados en corpus, desarrollados por SemEval 2016 en español. Los resultados obtenidos superaron a todos los participantes de SemEval y a los sistemas existentes para el lenguaje español.
publishDate 1997
dc.date.issued.spa.fl_str_mv 1997
dc.date.accessioned.spa.fl_str_mv 2019-07-02T19:44:05Z
dc.date.available.spa.fl_str_mv 2019-07-02T19:44:05Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/61028
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/59833/
url https://repositorio.unal.edu.co/handle/unal/61028
http://bdigital.unal.edu.co/59833/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemas Ingeniería de Sistemas e Informática
Ingeniería de Sistemas e Informática
dc.relation.references.spa.fl_str_mv Henriquez Miranda, Carlos Nelson (1997) Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español. Doctorado thesis, Universidad Nacional de Colombia - Sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/61028/1/72192582.2017.pdf
https://repositorio.unal.edu.co/bitstream/unal/61028/2/72192582.2017.pdf.jpg
bitstream.checksum.fl_str_mv cb18200a9c6fe7fa58ee3d30defdb432
19f922f439df2bc1db9194cf129387a2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1812169605006753792
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Guzman Luna, Jaime AlbertoHenriquez Miranda, Carlos Nelsonac34eb97-3b8d-470e-86aa-47c32aa15a923002019-07-02T19:44:05Z2019-07-02T19:44:05Z1997https://repositorio.unal.edu.co/handle/unal/61028http://bdigital.unal.edu.co/59833/Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de AS que detectan el sentimiento global de una opinión escrita sobre una frase o un documento completo; estos sistemas resultan a veces incompletos ante la realidad de las organizaciones que quieren saber en detalle el comportamiento de sus productos. Resultados de esa necesidad, existen enfoques de AS dedicados a realizar un análisis más completo de grano fino, en donde se identifican las características o aspectos más importantes de una opinión para poder determinar el sentimiento de cada uno de los aspectos. Sin embargo, la mayoría de enfoques, no tienen en cuenta el concepto o significado de las palabras en el proceso de identificar los aspectos, por otra parte, se necesita un gran número de documentos etiquetados manualmente para determinar el sentimiento. Con el fin de dar solución a estos problemas, este trabajo de tesis doctoral, propone la construcción de un modelo para analizar sentimientos a nivel de aspectos en español, que permita extraer automáticamente las características de una opinión y determinar el sentimiento (polaridad) asociado. El modelo está basado en dos técnicas, la primera se basa en ontologías para detección aspectos explícitos e implícitos y la segunda, utiliza el aprendizaje de máquina no supervisado para determinar la polaridad sobre una estructura gramatical simple. Este modelo tiene en cuenta el significado de los aspectos en el momento de extracción, y es completamente no supervisado, lo que permite implementar un sistema que sea rápidamente escalable a cualquier idioma o dominio. Para la implementación del modelo, se desarrolló el prototipo AspectSA (elaborado en JAVA), que contiene componentes de software que permiten realizar el análisis de sentimientos a nivel de aspectos en los dominios de restaurante y hoteles. Adicionalmente, este prototipo se validó utilizando un conjunto de experimentos basados en corpus, desarrollados por SemEval 2016 en español. Los resultados obtenidos superaron a todos los participantes de SemEval y a los sistemas existentes para el lenguaje español.Abstract: Recently the sentiment analysis has shown a high interest due to large-scale production of opinions by users on the Internet. The companies generally need to know the reputation they have of their users on the Web. So far, the vast majority of research involving this systems that detect the overall sentiment of a written opinion on a phrase or an entire document. These systems are sometimes incomplete before the reality of organizations that want to know in detail the behavior of their products. Due to the above, there are some approaches dedicated to a more complete analysis offine grain, where the characteristics or most important aspects of an opinion are identified in order to determine the feeling of each one of the aspects. However, most approaches do not take into account the concept or meaning of words in the process of identifying aspects and also a large number of documents labeled manually is needed to determine the sentiment. In order to solve these problems, this doctoral thesis proposes the construction of a model to aspect-based sentiment analysis in Spanish that allows to automatically extract the characteristics of an opinion and determine the associated sentiment (polarity). The model is based on Ontologies for detection of characteristics (explicit and implicit aspects) and machine learning unsupervised to determine the polarity on a simple grammatical structure. This model takes into account the meaning of the aspects at the time of extraction and is completely unsupervised which allows to implement a system that is quickly scalable to any language or domain. For the implementation of the model was developed the prototype AspectSA (elaborated in JAVA), which contains software components that allow the aspect-based sentiment analysis in the domains of restaurants and hotels. In addition, this prototype was validated using a set of experiments based on the data set developed by SemEval 2016 in Spanish. The results obtained exceeded all SemEval participants and the existing systems for the Spanish language.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Minas Escuela de Sistemas Ingeniería de Sistemas e InformáticaIngeniería de Sistemas e InformáticaHenriquez Miranda, Carlos Nelson (1997) Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español. Doctorado thesis, Universidad Nacional de Colombia - Sede Medellín.03 Obras enciclopédicas generales / Encyclopedias and books of factsAnálisis de sentimientos a nivel de aspectosOntologíasAprendizaje de máquina no supervisado.Aspect-Based Sentiment AnalysisOntologyUnsupervised machine learningOpinion miningUn modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en españolTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL72192582.2017.pdfTesis de Doctorado en Ingeniería - Sistemasapplication/pdf5705070https://repositorio.unal.edu.co/bitstream/unal/61028/1/72192582.2017.pdfcb18200a9c6fe7fa58ee3d30defdb432MD51THUMBNAIL72192582.2017.pdf.jpg72192582.2017.pdf.jpgGenerated Thumbnailimage/jpeg6227https://repositorio.unal.edu.co/bitstream/unal/61028/2/72192582.2017.pdf.jpg19f922f439df2bc1db9194cf129387a2MD52unal/61028oai:repositorio.unal.edu.co:unal/610282024-04-16 23:34:38.642Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co