Extracción de instancias de una clase desde textos en lenguaje natural independientes del dominio de aplicación
Las ontologías en computación se incluyen en el mundo de la inteligencia artificial y constituyen representaciones formales de un área de conocimiento o dominio. Las ontologías permiten modelar el conocimiento mediante una estructura de conceptos relacionados, lo cual proporciona un vocabulario comú...
- Autores:
-
Blandón Andrade, Juan Carlos
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2017
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/58998
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/58998
http://bdigital.unal.edu.co/56139/
- Palabra clave:
- 62 Ingeniería y operaciones afines / Engineering
Web semántica
Ontologías
Población automática de ontologías
Procesamiento de lenguaje natural
Extracción de información
Patrones GATE-JAPE
Semantic web
Ontologies
Automatic ontology population
Natural language processing
information extraction
Gate-Jape patterns
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | Las ontologías en computación se incluyen en el mundo de la inteligencia artificial y constituyen representaciones formales de un área de conocimiento o dominio. Las ontologías permiten modelar el conocimiento mediante una estructura de conceptos relacionados, lo cual proporciona un vocabulario común y que es de vital importancia para compartir información. La ingeniería ontológica es la disciplina que se encarga del estudio y construcción de herramientas para agilizar el proceso de creación de ontologías desde el lenguaje natural y tiene tres etapas cruciales: aprendizaje de ontologías (Ontology Learning), población de ontologías (Ontology Population) y enriquecimiento de ontologías (Ontology Enrichment). La literatura especializada muestra gran interés por las tres etapas y, para desarrollarlas, utiliza distintos métodos como estadística, extracción de información, procesamiento de lenguaje natural, aprendizaje de máquina (Machine Learning) y combinaciones entre ellos. Sin embargo, algunos problemas subsisten, tales como la dependencia del dominio de aplicación, la carencia de métodos completamente automáticos y la carencia de identificación de instancias de atributos. En consecuencia, el problema que se aborda en esta Tesis Doctoral es la extracción automática de instancias desde el lenguaje natural, sin importar el dominio de aplicación, con el fin de contribuir con el proceso de población de ontologías. En esta Tesis Doctoral se propone un método computacional que utiliza técnicas de extracción de información y procesamiento de lenguaje natural para extraer instancias de una clase y generar como resultado un archivo con una ontología completa en formato OWL, utilizando la herramienta GATE (General Architecture for Text Engineering). Los resultados son prometedores, pues se logra crear ontologías desde cero automáticamente, sin importar el dominio de aplicación y con buenos niveles de precision, recall y F-measure. |
---|