Modelos semánticos en recuperación de información: Usando topic maps

En la actualidad existen grandes problemas para la búsqueda y la recuperación de la información en la Web, y no es nada fácil obtener rápido los resultados deseados debido a que existen grandes volúmenes de datos. En la Web se esta viviendo una súper-abundancia de cantidad de la información publicad...

Full description

Autores:
Ortiz Gómez, Rafael Eduardo
Morillo Ordoñez, Manuel Jhobanny
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2005
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/1333
Acceso en línea:
http://hdl.handle.net/20.500.12749/1333
Palabra clave:
Information storage systems
Information retrieval systems
World Wide Web
Network information service
Conceptual mapping
Systems Engineering
Investigations
Analysis
Information retrieval
Use topic maps
Application design
Semantic web and ontologies
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World Wide Web
Servicio de información sobre redes
Mapeo conceptual
Ingeniería de sistemas
Investigaciones
Análisis
Recuperación de información
Uso topic maps
Diseño de aplicación
Web semántica y ontologías
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_a27c88fdfb5914a96dd3cf47440485ae
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/1333
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Modelos semánticos en recuperación de información: Usando topic maps
dc.title.translated.eng.fl_str_mv Semantic models in information retrieval: Using topic maps
title Modelos semánticos en recuperación de información: Usando topic maps
spellingShingle Modelos semánticos en recuperación de información: Usando topic maps
Information storage systems
Information retrieval systems
World Wide Web
Network information service
Conceptual mapping
Systems Engineering
Investigations
Analysis
Information retrieval
Use topic maps
Application design
Semantic web and ontologies
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World Wide Web
Servicio de información sobre redes
Mapeo conceptual
Ingeniería de sistemas
Investigaciones
Análisis
Recuperación de información
Uso topic maps
Diseño de aplicación
Web semántica y ontologías
title_short Modelos semánticos en recuperación de información: Usando topic maps
title_full Modelos semánticos en recuperación de información: Usando topic maps
title_fullStr Modelos semánticos en recuperación de información: Usando topic maps
title_full_unstemmed Modelos semánticos en recuperación de información: Usando topic maps
title_sort Modelos semánticos en recuperación de información: Usando topic maps
dc.creator.fl_str_mv Ortiz Gómez, Rafael Eduardo
Morillo Ordoñez, Manuel Jhobanny
dc.contributor.advisor.spa.fl_str_mv Nayesca González, Cristina
dc.contributor.author.spa.fl_str_mv Ortiz Gómez, Rafael Eduardo
Morillo Ordoñez, Manuel Jhobanny
dc.contributor.researchgroup.spa.fl_str_mv Grupo de Investigación Tecnologías de Información - GTI
Grupo de Investigaciones Clínicas
dc.subject.keywords.eng.fl_str_mv Information storage systems
Information retrieval systems
World Wide Web
Network information service
Conceptual mapping
Systems Engineering
Investigations
Analysis
Information retrieval
Use topic maps
Application design
Semantic web and ontologies
topic Information storage systems
Information retrieval systems
World Wide Web
Network information service
Conceptual mapping
Systems Engineering
Investigations
Analysis
Information retrieval
Use topic maps
Application design
Semantic web and ontologies
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World Wide Web
Servicio de información sobre redes
Mapeo conceptual
Ingeniería de sistemas
Investigaciones
Análisis
Recuperación de información
Uso topic maps
Diseño de aplicación
Web semántica y ontologías
dc.subject.lemb.spa.fl_str_mv Sistemas de almacenamiento de información
Sistemas de recuperación de información
World Wide Web
Servicio de información sobre redes
Mapeo conceptual
Ingeniería de sistemas
Investigaciones
Análisis
dc.subject.proposal.none.fl_str_mv Recuperación de información
Uso topic maps
Diseño de aplicación
Web semántica y ontologías
description En la actualidad existen grandes problemas para la búsqueda y la recuperación de la información en la Web, y no es nada fácil obtener rápido los resultados deseados debido a que existen grandes volúmenes de datos. En la Web se esta viviendo una súper-abundancia de cantidad de la información publicada. La mayoría de la información en Internet no tiene estructura ni semántica por eso es necesario adicionarle una estructura. También hay que buscar formas que permitan una descripción más precisa de los datos en la Web y que permitan la implementación de la estructura de la información por medio de lenguajes de representación de ontologías. Para motrar una posible solucion al problema de la busqueda de información, en este proyecto se desarrolla un prototipo de Recuperación de Información basado en el estándar de XML: Topic Maps, aplicándolo a los proyectos de grado de la facultad de ingeniería de sistemas. Este proyecto comenzo con un estudio sobre como funciona la búsqueda en Internet, luego se desarrollo un analisis más profundo sobre como funciona el Topic maps y como usar esta tecnologia para la busqueda en la web; se observo que no existe una estructura definida dentro de las pagínas web que se pueden encontrar, para la busqueda es importante entender la semántica. En esta propuesta se muestra el desarrollo de un prototipo de un sistema que utiliza la tecnología Topic Maps para la busqueda de información tomando como muestra una porcion de los proyectos de grado de la facultad de la Universidad Autónoma de Bucaramanga, en donde se muestra toda la documentación necesaria para poder cumplir con el estándar de Tópic maps. Este documento esta compuesto por cuatro secciones: La primera es el marco teórico en donde se encuentra toda la información teórica para poder tener el conocimiento para el desarrollo del proyecto. La segunda es el diseño de la aplicación por medio de Diagramas de caso de uso, se observa como se aplica la información estudiada para poder llevar a cabo el prototipo del sistema de búsqueda por medio de Topic Map. La tercera sección contiene el desarrollo de la aplicación donde se detalla cuáles son los pasos para el desarrollo de este tipo de aplicaciones. Por último en la cuarta sección se encuentran las conclusiones obtenidas después de la realización de este proyecto.
publishDate 2005
dc.date.issued.none.fl_str_mv 2005
dc.date.accessioned.none.fl_str_mv 2020-06-26T17:56:27Z
dc.date.available.none.fl_str_mv 2020-06-26T17:56:27Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv Trabajo de Grado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/1333
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
url http://hdl.handle.net/20.500.12749/1333
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Ortiz Gómez, Rafael Eduardo, Morillo Ordoñez, Manuel Jhobanny (2005). Modelos semánticos en recuperación de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB
Pack, Jack. XML Topic Maps, Editorial Addison-Wesley,2003
Baeza Yates Ricardo,William B Frakes. Information Retrieval – Data Structures & Algorithms, Editorial Prentice Hall, 1992
SemanticWeb.Org. 2004 http://www.semantic web.org/introduction.html
Luis Alberto Esteban Villamizar Un punto intermedio entre la actual web y la futura web semántica. http://www.cidlisuis.org/aedo/RGTIN2V1/RGTI_02.pdf
Dieter Fensel and Fvrank van Hardmeled and other. OIL: An Ontology Infraestructure form semantic Web. IEEE Intelligent System, March/April 2001, vol 16 nr 2.
The TAO of Topic Maps: Finding the Way in the Age of Infoglut http://www.ontopia.net/topicmaps/materials/tao.pdf
http://www.w3.org/TR/1999/REC-rdf-syntax-19990222
XML Topic Maps (XTM) 1.0 Specification http://www.topicmaps.org/xtm/1.0/xtm1-20010806.html
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
Atribución-NoComercial-SinDerivadas 2.5 Colombia
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spa.fl_str_mv Bucaramanga (Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Pregrado Ingeniería de Sistemas
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/1333/1/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/1333/2/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf.jpg
bitstream.checksum.fl_str_mv 06f979e2bdf562839f170a03cbf4b879
6636c7a590518de3d6ed09c5c6437e5b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814278024688828416
spelling Nayesca González, Cristinac0a0b05c-8b13-4ce7-9ca3-04a1cd7276da-1Ortiz Gómez, Rafael Eduardoee7eff5c-4abb-4703-b077-2751bbb184b4-1Morillo Ordoñez, Manuel Jhobanny220a9844-a4ce-4390-beb4-486aa6b02021-1Grupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones Clínicas2020-06-26T17:56:27Z2020-06-26T17:56:27Z2005http://hdl.handle.net/20.500.12749/1333instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEn la actualidad existen grandes problemas para la búsqueda y la recuperación de la información en la Web, y no es nada fácil obtener rápido los resultados deseados debido a que existen grandes volúmenes de datos. En la Web se esta viviendo una súper-abundancia de cantidad de la información publicada. La mayoría de la información en Internet no tiene estructura ni semántica por eso es necesario adicionarle una estructura. También hay que buscar formas que permitan una descripción más precisa de los datos en la Web y que permitan la implementación de la estructura de la información por medio de lenguajes de representación de ontologías. Para motrar una posible solucion al problema de la busqueda de información, en este proyecto se desarrolla un prototipo de Recuperación de Información basado en el estándar de XML: Topic Maps, aplicándolo a los proyectos de grado de la facultad de ingeniería de sistemas. Este proyecto comenzo con un estudio sobre como funciona la búsqueda en Internet, luego se desarrollo un analisis más profundo sobre como funciona el Topic maps y como usar esta tecnologia para la busqueda en la web; se observo que no existe una estructura definida dentro de las pagínas web que se pueden encontrar, para la busqueda es importante entender la semántica. En esta propuesta se muestra el desarrollo de un prototipo de un sistema que utiliza la tecnología Topic Maps para la busqueda de información tomando como muestra una porcion de los proyectos de grado de la facultad de la Universidad Autónoma de Bucaramanga, en donde se muestra toda la documentación necesaria para poder cumplir con el estándar de Tópic maps. Este documento esta compuesto por cuatro secciones: La primera es el marco teórico en donde se encuentra toda la información teórica para poder tener el conocimiento para el desarrollo del proyecto. La segunda es el diseño de la aplicación por medio de Diagramas de caso de uso, se observa como se aplica la información estudiada para poder llevar a cabo el prototipo del sistema de búsqueda por medio de Topic Map. La tercera sección contiene el desarrollo de la aplicación donde se detalla cuáles son los pasos para el desarrollo de este tipo de aplicaciones. Por último en la cuarta sección se encuentran las conclusiones obtenidas después de la realización de este proyecto.INTRODUCCION 12 1. MARCO TEÓRICO 14 1.1 RECUPERACIÓN DE INFORMACIÓN 14 1.1.1 Aspectos fundamentales de la Recuperación de información 15 1.1.2 Dimensiones en la Recuperación de Información 15 1.1.3 Proceso de la Recuperación de Información 15 1.1.4 Técnicas de análisis del contenido textual para la recuperación de información 17 1.1.4.1 La técnica de realimentación 18 1.1.5 Medidas para la Evaluación de la Recuperación de Información (Rendimiento de recuperación) 19 1.1.5.1 Precisión promedio 20 1.1.5.2 R-precision 20 1.1.5.3 Histogramas 20 1.1.5.4 Medidas de efectividad alternativas 20 1.1.5.5 Media harmónica 20 1.1.5.6 Medida E 21 1.1.5.7 Medidas de efectividad orientadas al usuario 21 1.1.5.7 Medidas de efectividad orientadas al usuario 21 1.1.5.8 Problemas de recuperación de información 22 1.1.5.9 Soluciones para resolver los problemas de recuperación de información 23 1.2 WEB SEMÁNTICA Y ONTOLOGIAS 23 1.2.1 Ventajas de la Web Semántica 25 1.2.2 Desventajas de la Web Semántica 25 1.3 XML TOPIC MAPS UN LENGUAJE DE REPRESENTACIÓN DE ONTOLOGIAS 26 1.3.1 RDF otro lenguaje de representación de ontologías 26 1.3.1.1 Similaridades Entre Topic Maps y RDF 27 1.3.1.2 Raíces diferentes 28 1.3.2 Topic Maps 28 1.4 ESTRUCTURA DE UN TOPIC MAPS 30 1.5 PROCESO DE CREACIÓN DE UN TOPIC MAPS 31 1.5.1 Extracción de información 31 1.5.1.1 ARANEUS 31 1.5.2 Extracción de tópicos 32 1.5.2.1 Palabras insignificantes “stop words” 33 1.5.3 Creación de topic maps 37 1.5.4 Manejo de Topic Maps 37 1.5.4.1 TM4J 38 1.6 BÚSQUEDA USANDO TOPIC MAPS 38 1.6.1 Técnicas de navegación en la información 38 1.6.1.1 Navegación Jerárquica 38 1.6.1.2 Búsqueda 39 1.6.2 Usando Topic Maps para navegar en la información 40 1.6.2.1 Navegación Asociativa 40 1.7 TESAUROS 43 1.7.1 Elementos de un tesauro 44 1.7.2 Tipología 44 1.7.3 Relaciones entre los términos de un tesauro 45 1.7.3.1 Relaciones de equivalencia 45 1.7.3.2 Relaciones jerárquicas 45 1.7.3.3 Relaciones asociativas 46 1.8 SQL (STRUCTURED QUERY LANGUAGE) 46 1.9 TMQL 47 2 DISEÑO DE LA APLICACIÓN 48 2.1 DIAGRAMA DE CASO DE USO DE CONTEXTO 48 2.2 DIAGRAMA DE CASO DE USO DE CLASES 49 2.3 DIAGRAMA DE CASOS DE USO 49 3 DESARROLLO DE LA APLICACIÓN 51 3.1 ¿COMO SE OBTIENEN LOS TÓPICOS? 51 3.2 ¿COMO SE OBTIENE LOS TOPIC MAPS? 54 3.3 HERRAMIENTAS 57 3.4 VENTAJAS DE USO DE TM4J 58 3.5 IMPLEMENTACIÓN DEL PROTOTIPO RECUPERACIÓN TOPIC MAPS 58 4 CONCLUSIONES 60 BIBLIOGRAFÍA 61PregradoAt present, there are great problems for the search and retrieval of information on the Web, and it is not easy to obtain the desired results quickly due to the large volumes of data. The Web is experiencing a super-abundance of quantity of published information. Most of the information on the Internet has no structure or semantics, so it is necessary to add a structure. It is also necessary to look for ways that allow a more precise description of the data on the Web and that allow the implementation of the information structure by means of ontology representation languages. In order to motivate a possible solution to the information search problem, in this project an Information Retrieval prototype based on the XML standard: Topic Maps is developed, applying it to the degree projects of the systems engineering faculty. This project began with a study on how Internet search works, then a more in-depth analysis was developed on how Topic maps works and how to use this technology for searching the web; It was observed that there is no defined structure within the web pages that can be found, for the search it is important to understand the semantics. This proposal shows the development of a prototype of a system that uses Topic Maps technology to search for information, taking as a sample a portion of the degree projects of the Faculty of the Autonomous University of Bucaramanga, where all the documentation necessary to comply with the standard of Topic maps. This document is made up of four sections: The first is the theoretical framework where all the theoretical information is found to be able to have the knowledge for the development of the project. The second is the design of the application through use case diagrams, it is observed how the studied information is applied in order to carry out the prototype of the search system through Topic Map. The third section contains the development of the application where the steps for the development of this type of applications are detailed. Finally, in the fourth section are the conclusions obtained after carrying out this project.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaModelos semánticos en recuperación de información: Usando topic mapsSemantic models in information retrieval: Using topic mapsIngeniero de SistemasBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/redcol/resource_type/TPInformation storage systemsInformation retrieval systemsWorld Wide WebNetwork information serviceConceptual mappingSystems EngineeringInvestigationsAnalysisInformation retrievalUse topic mapsApplication designSemantic web and ontologiesSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónWorld Wide WebServicio de información sobre redesMapeo conceptualIngeniería de sistemasInvestigacionesAnálisisRecuperación de informaciónUso topic mapsDiseño de aplicaciónWeb semántica y ontologíasOrtiz Gómez, Rafael Eduardo, Morillo Ordoñez, Manuel Jhobanny (2005). Modelos semánticos en recuperación de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNABPack, Jack. XML Topic Maps, Editorial Addison-Wesley,2003Baeza Yates Ricardo,William B Frakes. Information Retrieval – Data Structures & Algorithms, Editorial Prentice Hall, 1992SemanticWeb.Org. 2004 http://www.semantic web.org/introduction.htmlLuis Alberto Esteban Villamizar Un punto intermedio entre la actual web y la futura web semántica. http://www.cidlisuis.org/aedo/RGTIN2V1/RGTI_02.pdfDieter Fensel and Fvrank van Hardmeled and other. OIL: An Ontology Infraestructure form semantic Web. IEEE Intelligent System, March/April 2001, vol 16 nr 2.The TAO of Topic Maps: Finding the Way in the Age of Infoglut http://www.ontopia.net/topicmaps/materials/tao.pdfhttp://www.w3.org/TR/1999/REC-rdf-syntax-19990222XML Topic Maps (XTM) 1.0 Specification http://www.topicmaps.org/xtm/1.0/xtm1-20010806.htmlORIGINAL2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdf2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdfTesisapplication/pdf3782180https://repository.unab.edu.co/bitstream/20.500.12749/1333/1/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf06f979e2bdf562839f170a03cbf4b879MD51open accessTHUMBNAIL2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdf.jpg2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdf.jpgIM Thumbnailimage/jpeg5151https://repository.unab.edu.co/bitstream/20.500.12749/1333/2/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf.jpg6636c7a590518de3d6ed09c5c6437e5bMD52open access20.500.12749/1333oai:repository.unab.edu.co:20.500.12749/13332024-01-21 13:17:50.358open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co