Modelos semánticos en recuperación de información: Usando topic maps
En la actualidad existen grandes problemas para la búsqueda y la recuperación de la información en la Web, y no es nada fácil obtener rápido los resultados deseados debido a que existen grandes volúmenes de datos. En la Web se esta viviendo una súper-abundancia de cantidad de la información publicad...
- Autores:
-
Ortiz Gómez, Rafael Eduardo
Morillo Ordoñez, Manuel Jhobanny
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2005
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/1333
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/1333
- Palabra clave:
- Information storage systems
Information retrieval systems
World Wide Web
Network information service
Conceptual mapping
Systems Engineering
Investigations
Analysis
Information retrieval
Use topic maps
Application design
Semantic web and ontologies
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World Wide Web
Servicio de información sobre redes
Mapeo conceptual
Ingeniería de sistemas
Investigaciones
Análisis
Recuperación de información
Uso topic maps
Diseño de aplicación
Web semántica y ontologías
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_a27c88fdfb5914a96dd3cf47440485ae |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/1333 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Modelos semánticos en recuperación de información: Usando topic maps |
dc.title.translated.eng.fl_str_mv |
Semantic models in information retrieval: Using topic maps |
title |
Modelos semánticos en recuperación de información: Usando topic maps |
spellingShingle |
Modelos semánticos en recuperación de información: Usando topic maps Information storage systems Information retrieval systems World Wide Web Network information service Conceptual mapping Systems Engineering Investigations Analysis Information retrieval Use topic maps Application design Semantic web and ontologies Sistemas de almacenamiento de información Sistemas de recuperación de información World Wide Web Servicio de información sobre redes Mapeo conceptual Ingeniería de sistemas Investigaciones Análisis Recuperación de información Uso topic maps Diseño de aplicación Web semántica y ontologías |
title_short |
Modelos semánticos en recuperación de información: Usando topic maps |
title_full |
Modelos semánticos en recuperación de información: Usando topic maps |
title_fullStr |
Modelos semánticos en recuperación de información: Usando topic maps |
title_full_unstemmed |
Modelos semánticos en recuperación de información: Usando topic maps |
title_sort |
Modelos semánticos en recuperación de información: Usando topic maps |
dc.creator.fl_str_mv |
Ortiz Gómez, Rafael Eduardo Morillo Ordoñez, Manuel Jhobanny |
dc.contributor.advisor.spa.fl_str_mv |
Nayesca González, Cristina |
dc.contributor.author.spa.fl_str_mv |
Ortiz Gómez, Rafael Eduardo Morillo Ordoñez, Manuel Jhobanny |
dc.contributor.researchgroup.spa.fl_str_mv |
Grupo de Investigación Tecnologías de Información - GTI Grupo de Investigaciones Clínicas |
dc.subject.keywords.eng.fl_str_mv |
Information storage systems Information retrieval systems World Wide Web Network information service Conceptual mapping Systems Engineering Investigations Analysis Information retrieval Use topic maps Application design Semantic web and ontologies |
topic |
Information storage systems Information retrieval systems World Wide Web Network information service Conceptual mapping Systems Engineering Investigations Analysis Information retrieval Use topic maps Application design Semantic web and ontologies Sistemas de almacenamiento de información Sistemas de recuperación de información World Wide Web Servicio de información sobre redes Mapeo conceptual Ingeniería de sistemas Investigaciones Análisis Recuperación de información Uso topic maps Diseño de aplicación Web semántica y ontologías |
dc.subject.lemb.spa.fl_str_mv |
Sistemas de almacenamiento de información Sistemas de recuperación de información World Wide Web Servicio de información sobre redes Mapeo conceptual Ingeniería de sistemas Investigaciones Análisis |
dc.subject.proposal.none.fl_str_mv |
Recuperación de información Uso topic maps Diseño de aplicación Web semántica y ontologías |
description |
En la actualidad existen grandes problemas para la búsqueda y la recuperación de la información en la Web, y no es nada fácil obtener rápido los resultados deseados debido a que existen grandes volúmenes de datos. En la Web se esta viviendo una súper-abundancia de cantidad de la información publicada. La mayoría de la información en Internet no tiene estructura ni semántica por eso es necesario adicionarle una estructura. También hay que buscar formas que permitan una descripción más precisa de los datos en la Web y que permitan la implementación de la estructura de la información por medio de lenguajes de representación de ontologías. Para motrar una posible solucion al problema de la busqueda de información, en este proyecto se desarrolla un prototipo de Recuperación de Información basado en el estándar de XML: Topic Maps, aplicándolo a los proyectos de grado de la facultad de ingeniería de sistemas. Este proyecto comenzo con un estudio sobre como funciona la búsqueda en Internet, luego se desarrollo un analisis más profundo sobre como funciona el Topic maps y como usar esta tecnologia para la busqueda en la web; se observo que no existe una estructura definida dentro de las pagínas web que se pueden encontrar, para la busqueda es importante entender la semántica. En esta propuesta se muestra el desarrollo de un prototipo de un sistema que utiliza la tecnología Topic Maps para la busqueda de información tomando como muestra una porcion de los proyectos de grado de la facultad de la Universidad Autónoma de Bucaramanga, en donde se muestra toda la documentación necesaria para poder cumplir con el estándar de Tópic maps. Este documento esta compuesto por cuatro secciones: La primera es el marco teórico en donde se encuentra toda la información teórica para poder tener el conocimiento para el desarrollo del proyecto. La segunda es el diseño de la aplicación por medio de Diagramas de caso de uso, se observa como se aplica la información estudiada para poder llevar a cabo el prototipo del sistema de búsqueda por medio de Topic Map. La tercera sección contiene el desarrollo de la aplicación donde se detalla cuáles son los pasos para el desarrollo de este tipo de aplicaciones. Por último en la cuarta sección se encuentran las conclusiones obtenidas después de la realización de este proyecto. |
publishDate |
2005 |
dc.date.issued.none.fl_str_mv |
2005 |
dc.date.accessioned.none.fl_str_mv |
2020-06-26T17:56:27Z |
dc.date.available.none.fl_str_mv |
2020-06-26T17:56:27Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.local.spa.fl_str_mv |
Trabajo de Grado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/1333 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
url |
http://hdl.handle.net/20.500.12749/1333 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Ortiz Gómez, Rafael Eduardo, Morillo Ordoñez, Manuel Jhobanny (2005). Modelos semánticos en recuperación de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB Pack, Jack. XML Topic Maps, Editorial Addison-Wesley,2003 Baeza Yates Ricardo,William B Frakes. Information Retrieval – Data Structures & Algorithms, Editorial Prentice Hall, 1992 SemanticWeb.Org. 2004 http://www.semantic web.org/introduction.html Luis Alberto Esteban Villamizar Un punto intermedio entre la actual web y la futura web semántica. http://www.cidlisuis.org/aedo/RGTIN2V1/RGTI_02.pdf Dieter Fensel and Fvrank van Hardmeled and other. OIL: An Ontology Infraestructure form semantic Web. IEEE Intelligent System, March/April 2001, vol 16 nr 2. The TAO of Topic Maps: Finding the Way in the Age of Infoglut http://www.ontopia.net/topicmaps/materials/tao.pdf http://www.w3.org/TR/1999/REC-rdf-syntax-19990222 XML Topic Maps (XTM) 1.0 Specification http://www.topicmaps.org/xtm/1.0/xtm1-20010806.html |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 2.5 Colombia |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spa.fl_str_mv |
Bucaramanga (Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Pregrado Ingeniería de Sistemas |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/1333/1/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf https://repository.unab.edu.co/bitstream/20.500.12749/1333/2/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf.jpg |
bitstream.checksum.fl_str_mv |
06f979e2bdf562839f170a03cbf4b879 6636c7a590518de3d6ed09c5c6437e5b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814278024688828416 |
spelling |
Nayesca González, Cristinac0a0b05c-8b13-4ce7-9ca3-04a1cd7276da-1Ortiz Gómez, Rafael Eduardoee7eff5c-4abb-4703-b077-2751bbb184b4-1Morillo Ordoñez, Manuel Jhobanny220a9844-a4ce-4390-beb4-486aa6b02021-1Grupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones Clínicas2020-06-26T17:56:27Z2020-06-26T17:56:27Z2005http://hdl.handle.net/20.500.12749/1333instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEn la actualidad existen grandes problemas para la búsqueda y la recuperación de la información en la Web, y no es nada fácil obtener rápido los resultados deseados debido a que existen grandes volúmenes de datos. En la Web se esta viviendo una súper-abundancia de cantidad de la información publicada. La mayoría de la información en Internet no tiene estructura ni semántica por eso es necesario adicionarle una estructura. También hay que buscar formas que permitan una descripción más precisa de los datos en la Web y que permitan la implementación de la estructura de la información por medio de lenguajes de representación de ontologías. Para motrar una posible solucion al problema de la busqueda de información, en este proyecto se desarrolla un prototipo de Recuperación de Información basado en el estándar de XML: Topic Maps, aplicándolo a los proyectos de grado de la facultad de ingeniería de sistemas. Este proyecto comenzo con un estudio sobre como funciona la búsqueda en Internet, luego se desarrollo un analisis más profundo sobre como funciona el Topic maps y como usar esta tecnologia para la busqueda en la web; se observo que no existe una estructura definida dentro de las pagínas web que se pueden encontrar, para la busqueda es importante entender la semántica. En esta propuesta se muestra el desarrollo de un prototipo de un sistema que utiliza la tecnología Topic Maps para la busqueda de información tomando como muestra una porcion de los proyectos de grado de la facultad de la Universidad Autónoma de Bucaramanga, en donde se muestra toda la documentación necesaria para poder cumplir con el estándar de Tópic maps. Este documento esta compuesto por cuatro secciones: La primera es el marco teórico en donde se encuentra toda la información teórica para poder tener el conocimiento para el desarrollo del proyecto. La segunda es el diseño de la aplicación por medio de Diagramas de caso de uso, se observa como se aplica la información estudiada para poder llevar a cabo el prototipo del sistema de búsqueda por medio de Topic Map. La tercera sección contiene el desarrollo de la aplicación donde se detalla cuáles son los pasos para el desarrollo de este tipo de aplicaciones. Por último en la cuarta sección se encuentran las conclusiones obtenidas después de la realización de este proyecto.INTRODUCCION 12 1. MARCO TEÓRICO 14 1.1 RECUPERACIÓN DE INFORMACIÓN 14 1.1.1 Aspectos fundamentales de la Recuperación de información 15 1.1.2 Dimensiones en la Recuperación de Información 15 1.1.3 Proceso de la Recuperación de Información 15 1.1.4 Técnicas de análisis del contenido textual para la recuperación de información 17 1.1.4.1 La técnica de realimentación 18 1.1.5 Medidas para la Evaluación de la Recuperación de Información (Rendimiento de recuperación) 19 1.1.5.1 Precisión promedio 20 1.1.5.2 R-precision 20 1.1.5.3 Histogramas 20 1.1.5.4 Medidas de efectividad alternativas 20 1.1.5.5 Media harmónica 20 1.1.5.6 Medida E 21 1.1.5.7 Medidas de efectividad orientadas al usuario 21 1.1.5.7 Medidas de efectividad orientadas al usuario 21 1.1.5.8 Problemas de recuperación de información 22 1.1.5.9 Soluciones para resolver los problemas de recuperación de información 23 1.2 WEB SEMÁNTICA Y ONTOLOGIAS 23 1.2.1 Ventajas de la Web Semántica 25 1.2.2 Desventajas de la Web Semántica 25 1.3 XML TOPIC MAPS UN LENGUAJE DE REPRESENTACIÓN DE ONTOLOGIAS 26 1.3.1 RDF otro lenguaje de representación de ontologías 26 1.3.1.1 Similaridades Entre Topic Maps y RDF 27 1.3.1.2 Raíces diferentes 28 1.3.2 Topic Maps 28 1.4 ESTRUCTURA DE UN TOPIC MAPS 30 1.5 PROCESO DE CREACIÓN DE UN TOPIC MAPS 31 1.5.1 Extracción de información 31 1.5.1.1 ARANEUS 31 1.5.2 Extracción de tópicos 32 1.5.2.1 Palabras insignificantes “stop words” 33 1.5.3 Creación de topic maps 37 1.5.4 Manejo de Topic Maps 37 1.5.4.1 TM4J 38 1.6 BÚSQUEDA USANDO TOPIC MAPS 38 1.6.1 Técnicas de navegación en la información 38 1.6.1.1 Navegación Jerárquica 38 1.6.1.2 Búsqueda 39 1.6.2 Usando Topic Maps para navegar en la información 40 1.6.2.1 Navegación Asociativa 40 1.7 TESAUROS 43 1.7.1 Elementos de un tesauro 44 1.7.2 Tipología 44 1.7.3 Relaciones entre los términos de un tesauro 45 1.7.3.1 Relaciones de equivalencia 45 1.7.3.2 Relaciones jerárquicas 45 1.7.3.3 Relaciones asociativas 46 1.8 SQL (STRUCTURED QUERY LANGUAGE) 46 1.9 TMQL 47 2 DISEÑO DE LA APLICACIÓN 48 2.1 DIAGRAMA DE CASO DE USO DE CONTEXTO 48 2.2 DIAGRAMA DE CASO DE USO DE CLASES 49 2.3 DIAGRAMA DE CASOS DE USO 49 3 DESARROLLO DE LA APLICACIÓN 51 3.1 ¿COMO SE OBTIENEN LOS TÓPICOS? 51 3.2 ¿COMO SE OBTIENE LOS TOPIC MAPS? 54 3.3 HERRAMIENTAS 57 3.4 VENTAJAS DE USO DE TM4J 58 3.5 IMPLEMENTACIÓN DEL PROTOTIPO RECUPERACIÓN TOPIC MAPS 58 4 CONCLUSIONES 60 BIBLIOGRAFÍA 61PregradoAt present, there are great problems for the search and retrieval of information on the Web, and it is not easy to obtain the desired results quickly due to the large volumes of data. The Web is experiencing a super-abundance of quantity of published information. Most of the information on the Internet has no structure or semantics, so it is necessary to add a structure. It is also necessary to look for ways that allow a more precise description of the data on the Web and that allow the implementation of the information structure by means of ontology representation languages. In order to motivate a possible solution to the information search problem, in this project an Information Retrieval prototype based on the XML standard: Topic Maps is developed, applying it to the degree projects of the systems engineering faculty. This project began with a study on how Internet search works, then a more in-depth analysis was developed on how Topic maps works and how to use this technology for searching the web; It was observed that there is no defined structure within the web pages that can be found, for the search it is important to understand the semantics. This proposal shows the development of a prototype of a system that uses Topic Maps technology to search for information, taking as a sample a portion of the degree projects of the Faculty of the Autonomous University of Bucaramanga, where all the documentation necessary to comply with the standard of Topic maps. This document is made up of four sections: The first is the theoretical framework where all the theoretical information is found to be able to have the knowledge for the development of the project. The second is the design of the application through use case diagrams, it is observed how the studied information is applied in order to carry out the prototype of the search system through Topic Map. The third section contains the development of the application where the steps for the development of this type of applications are detailed. Finally, in the fourth section are the conclusions obtained after carrying out this project.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaModelos semánticos en recuperación de información: Usando topic mapsSemantic models in information retrieval: Using topic mapsIngeniero de SistemasBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/redcol/resource_type/TPInformation storage systemsInformation retrieval systemsWorld Wide WebNetwork information serviceConceptual mappingSystems EngineeringInvestigationsAnalysisInformation retrievalUse topic mapsApplication designSemantic web and ontologiesSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónWorld Wide WebServicio de información sobre redesMapeo conceptualIngeniería de sistemasInvestigacionesAnálisisRecuperación de informaciónUso topic mapsDiseño de aplicaciónWeb semántica y ontologíasOrtiz Gómez, Rafael Eduardo, Morillo Ordoñez, Manuel Jhobanny (2005). Modelos semánticos en recuperación de información. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNABPack, Jack. XML Topic Maps, Editorial Addison-Wesley,2003Baeza Yates Ricardo,William B Frakes. Information Retrieval – Data Structures & Algorithms, Editorial Prentice Hall, 1992SemanticWeb.Org. 2004 http://www.semantic web.org/introduction.htmlLuis Alberto Esteban Villamizar Un punto intermedio entre la actual web y la futura web semántica. http://www.cidlisuis.org/aedo/RGTIN2V1/RGTI_02.pdfDieter Fensel and Fvrank van Hardmeled and other. OIL: An Ontology Infraestructure form semantic Web. IEEE Intelligent System, March/April 2001, vol 16 nr 2.The TAO of Topic Maps: Finding the Way in the Age of Infoglut http://www.ontopia.net/topicmaps/materials/tao.pdfhttp://www.w3.org/TR/1999/REC-rdf-syntax-19990222XML Topic Maps (XTM) 1.0 Specification http://www.topicmaps.org/xtm/1.0/xtm1-20010806.htmlORIGINAL2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdf2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdfTesisapplication/pdf3782180https://repository.unab.edu.co/bitstream/20.500.12749/1333/1/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf06f979e2bdf562839f170a03cbf4b879MD51open accessTHUMBNAIL2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdf.jpg2005_Tesis_Rafael_Eduardo_Ortiz_Gómez.pdf.jpgIM Thumbnailimage/jpeg5151https://repository.unab.edu.co/bitstream/20.500.12749/1333/2/2005_Tesis_Rafael_Eduardo_Ortiz_G%c3%b3mez.pdf.jpg6636c7a590518de3d6ed09c5c6437e5bMD52open access20.500.12749/1333oai:repository.unab.edu.co:20.500.12749/13332024-01-21 13:17:50.358open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co |