Prototipo de un sistema inteligente para recuperación de información en la Web
En este trabajo se propone un modelo para consultar y decidir qué documentos satisfacen los deseos del usuario en consultas generalizadas en Internet. El modelo está constituido por tres partes esenciales, a saber: La teoría sicolingüística bajo la cual se plantean los modelos mentales de un individ...
- Autores:
-
Barraza Verdesoto, Edgardo Samuel
- Tipo de recurso:
- Fecha de publicación:
- 2003
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/3329
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/3329
- Palabra clave:
- Information storage systems
Information retrieval systems
Network information service
Search engines
Information search strategies
Systems engineering
Computer science
Investigations
Analysis
Mental models
Conceptual features
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World wide web
Servicio de información sobre redes
Motores de búsqueda
Estrategias de búsqueda de información
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Modelos mentales
Software
Rasgos conceptuales
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_f1470476110def1c8623f49f7de94648 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/3329 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Prototipo de un sistema inteligente para recuperación de información en la Web |
dc.title.translated.eng.fl_str_mv |
Prototype of an intelligent system for information retrieval on the Web |
title |
Prototipo de un sistema inteligente para recuperación de información en la Web |
spellingShingle |
Prototipo de un sistema inteligente para recuperación de información en la Web Information storage systems Information retrieval systems Network information service Search engines Information search strategies Systems engineering Computer science Investigations Analysis Mental models Conceptual features Sistemas de almacenamiento de información Sistemas de recuperación de información World wide web Servicio de información sobre redes Motores de búsqueda Estrategias de búsqueda de información Ingeniería de sistemas Ciencias computacionales Investigaciones Análisis Modelos mentales Software Rasgos conceptuales |
title_short |
Prototipo de un sistema inteligente para recuperación de información en la Web |
title_full |
Prototipo de un sistema inteligente para recuperación de información en la Web |
title_fullStr |
Prototipo de un sistema inteligente para recuperación de información en la Web |
title_full_unstemmed |
Prototipo de un sistema inteligente para recuperación de información en la Web |
title_sort |
Prototipo de un sistema inteligente para recuperación de información en la Web |
dc.creator.fl_str_mv |
Barraza Verdesoto, Edgardo Samuel |
dc.contributor.author.spa.fl_str_mv |
Barraza Verdesoto, Edgardo Samuel |
dc.contributor.cvlac.*.fl_str_mv |
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000183288 |
dc.contributor.googlescholar.*.fl_str_mv |
https://scholar.google.es/citations?hl=es&user=vxco8nwAAAAJ |
dc.contributor.researchgate.*.fl_str_mv |
https://www.researchgate.net/profile/Edgardo_Barraza_Verdesoto |
dc.contributor.corporatename.spa.fl_str_mv |
Instituto Tecnológico y de Estudios Superiores de Monterrey México (ITESM) |
dc.subject.keywords.eng.fl_str_mv |
Information storage systems Information retrieval systems Network information service Search engines Information search strategies Systems engineering Computer science Investigations Analysis Mental models Conceptual features |
topic |
Information storage systems Information retrieval systems Network information service Search engines Information search strategies Systems engineering Computer science Investigations Analysis Mental models Conceptual features Sistemas de almacenamiento de información Sistemas de recuperación de información World wide web Servicio de información sobre redes Motores de búsqueda Estrategias de búsqueda de información Ingeniería de sistemas Ciencias computacionales Investigaciones Análisis Modelos mentales Software Rasgos conceptuales |
dc.subject.lemb.spa.fl_str_mv |
Sistemas de almacenamiento de información Sistemas de recuperación de información World wide web Servicio de información sobre redes Motores de búsqueda Estrategias de búsqueda de información Ingeniería de sistemas Ciencias computacionales Investigaciones Análisis |
dc.subject.proposal.none.fl_str_mv |
Modelos mentales Software Rasgos conceptuales |
description |
En este trabajo se propone un modelo para consultar y decidir qué documentos satisfacen los deseos del usuario en consultas generalizadas en Internet. El modelo está constituido por tres partes esenciales, a saber: La teoría sicolingüística bajo la cual se plantean los modelos mentales de un individuo, el modelo propuesto para realizar búsqueda y, por último, la explicación del prototipo de software desarrollado que apoya el modelo. Los últimos capítulos son reservados para analizar el desempeño del modelo y del prototipo. Los investigadores sicolingüistas durante los últimos años han desarrollado varias teorías que intentan describir la forma cómo el ser humano organiza en su mente las abstracciones del mundo real y cómo se interpreta el lenguaje escrito mentalmente. La propuesta generalizada ha sido la Teoría De Rasgos Conceptuales, la cual será tratada a fondo en el primer capítulo. Como segundo punto, se propone una metodología y un modelo que servirán a un agente para decidir acerca de la relevancia de un documento para el usuario. En este caso la semántica apunta hacia la revisión de los párrafos como unidad de interpretación del texto, y es bajo este esquema que se propone un método de interpretación del documento para decidir si el texto auscultado contiene o no los conceptos propuestos por el usuario. |
publishDate |
2003 |
dc.date.issued.none.fl_str_mv |
2003 |
dc.date.accessioned.none.fl_str_mv |
2020-06-26T21:32:20Z |
dc.date.available.none.fl_str_mv |
2020-06-26T21:32:20Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.local.spa.fl_str_mv |
Tesis |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/3329 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
url |
http://hdl.handle.net/20.500.12749/3329 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Barraza Verdesoto, Edgardo Samuel (2003). Prototipo de un sistema inteligente para recuperación de información en la Web. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM [Demazeau, 1990] Decentralized Artificial Intelligence Yves Demazeau & Jean-Pierre Müller in Decentralized A.I., Y.Demazeau & J.P. Müller Eds, Elsevier 1990. [Finin, 1994] KQML as an Agent Communication Language. Finin, T., Fritzson, R., McKay, D. and McEntire, R. Proceedings of the Third International Conference on Information and Knowledge Management (CIKM'94), ACM Press [Wooldridge, 1997] Agent-based software engineering. Wooldridge, M. IEEE Transactions on Software Engineering, Febrero 1997. [Berko Y Bernstein, 1999] Psicolingüística. Jean Berko Gleason, Nan Bernstein Ratner. Mc GrawHill, 1999. [Heider 1972] Universal in Color Naming and Memory. Journal Of Experimental Psychology, 93, 10-20. Heider E. R. [Fowles Y Glanz 1977] Competente and Talent in Verbal Riddle Comprehension. Journal of Child Language, 4, 433-452. Fowles B., & Glanz, E. [Collins Y Quillian 1969] Retrieval Time from Semantic Memory. Journal of Verbal Learning and Verbal Behavior, 8, 240-248. Collins A. M. & Quillian M. R. [Smith 1974] Structure and Process in Semantic Memory: A Featural Model for Semantic Decisions. Psychological Review, 81, 214-241. Smith E., Shoben, E.J. & Rips, L. J. [Collins Y Loftus 1975] A Spreading Activation Theory of Semantic Processing. Psychological Review, 82, 407-428. [First Monday, 2000] Information seeking on the Web: An integrated Model of Browsing and Searching. Choo, Ch. W., Turnbull, D. First-Monday peer-reviewed journal on the Internet. http://www.firstmonday.dk/issues/issue5_2/choo/. [Williamson, Decker y Sycara 1996] Unified Information and Control Flow in Hierarchical Task Network, The Robotics Institute, Carnegie-Mellon University, Marzo 20 de 1996. Williamson M., Decker K .and Sycara K. [Lakoff, 1987] Women, fire and dangerous things. What categories reveal about the mind. Chicago: University of Chicago Press, Lakoff G. [Ordóñez 1999] Como leer un libro, Técnicas para el desarrollo y habilidades en la lectura. Olegario Ordóñez D., Editorial Esquilo, 1999. [Colman, Busby Y Ross, 1997] Estructuras de Matemáticas Discretas para la ciencia de la computación, Colman B., Busby R. C., Ross. S. C. Editorial Prentice Hall, 1997. [McKay, 1979] Lexical insertion, inflection, and derivation: Creative processes in word production, McKay D., Journal of psycholinguistic Research, 8, 477-498 [Gelman Y Coley, 1991] Language and Categorization: The acquisition of natural kind terms. Gelman S. A. & Coley J. D., In S.A. Gelman &J.P. Byrns (Editores). Perspectives on language and Thought: Interrelations in development (pp 146-196) Cambridge: Cambridge University Press. [Fenghua, Johnsten, Raghavan, Taylor 2001] Enhancing Internet Search Engines to Achieve Concept-based Retrieval, Fenghua L. & Johnsten T. & Raghavan V. & Taylor D, 2001. [Menczer, 2002] Scalable Search Engines via Adaptive Topic-Driven Crawlers, Filippo Menczer, Department of Management Sciences, The University of Iowa, Iowa City, IA 52242, http://dollar.biz.uiowa.edu/~fil/. |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 2.5 Colombia |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spa.fl_str_mv |
Bucaramanga (Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Maestría en Ciencias Computacionales |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/3329/1/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf https://repository.unab.edu.co/bitstream/20.500.12749/3329/2/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpg |
bitstream.checksum.fl_str_mv |
921915cf5052c04b0dbc5e8aa1a4c8ef e780917f93d149e7efdc786feca487a0 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814277262266073088 |
spelling |
Barraza Verdesoto, Edgardo Samuel2f09cf04-5c51-4550-a296-116e61990cf8https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000183288https://scholar.google.es/citations?hl=es&user=vxco8nwAAAAJhttps://www.researchgate.net/profile/Edgardo_Barraza_VerdesotoInstituto Tecnológico y de Estudios Superiores de Monterrey México (ITESM)2020-06-26T21:32:20Z2020-06-26T21:32:20Z2003http://hdl.handle.net/20.500.12749/3329instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEn este trabajo se propone un modelo para consultar y decidir qué documentos satisfacen los deseos del usuario en consultas generalizadas en Internet. El modelo está constituido por tres partes esenciales, a saber: La teoría sicolingüística bajo la cual se plantean los modelos mentales de un individuo, el modelo propuesto para realizar búsqueda y, por último, la explicación del prototipo de software desarrollado que apoya el modelo. Los últimos capítulos son reservados para analizar el desempeño del modelo y del prototipo. Los investigadores sicolingüistas durante los últimos años han desarrollado varias teorías que intentan describir la forma cómo el ser humano organiza en su mente las abstracciones del mundo real y cómo se interpreta el lenguaje escrito mentalmente. La propuesta generalizada ha sido la Teoría De Rasgos Conceptuales, la cual será tratada a fondo en el primer capítulo. Como segundo punto, se propone una metodología y un modelo que servirán a un agente para decidir acerca de la relevancia de un documento para el usuario. En este caso la semántica apunta hacia la revisión de los párrafos como unidad de interpretación del texto, y es bajo este esquema que se propone un método de interpretación del documento para decidir si el texto auscultado contiene o no los conceptos propuestos por el usuario.Instituto Tecnológico de Estudios Superiores de Monterrey ITESMINTRODUCCIÓN 1 1. PALABRAS Y SIGNIFICADO 3 1.1. PALABRAS Y PRIMITIVOS LÉXICOS 4 1.1.1 Factores que influyen en el acceso y organización de las palabras 6 1.1.2 Modelos de Acceso Léxico 9 1.2 SIGNIFICADO 12 1.2.1 Primitivos Conceptuales 13 1.2.2 Teorías 14 1.2.3 Organización Conceptual 18 2. EL PÁRRAFO Y EL TEXTO 23 2.1 MECANISMOS PARA IDENTIFICAR LA IDEA PRINCIPAL EN UN PÁRRAFO 24 2.2 DEL PÁRRAFO AL TEXTO 25 3. EL MODELO DE PARTICIÓN DE CONCEPTOS COMO ESTRATEGIA PARA BUSCAR DOCUMENTOS EN INTERNET 27 3.1. BUSCANDO INFORMACIÓN EN WEB 28 3.1.1. Estrategias De Búsqueda Existentes En La Web A Través De Los Motores De Búsqueda Estándar 31 3.2. EL MODELO PROPUESTO 32 3.2.1. Los Documentos Buscados 33 3.2.2. El Usuario y Las Herramientas de Búsqueda 34 3.2.3. La Formulación del Deseo Del Usuario 37 3.2.4. Conceptos y Rasgos Conceptuales 41 3.2.5. La Partición de Conceptos 43 3.2.6. Construcción de la Partición de Conceptos basado en el Deseo del Usuario 46 4. ALGORITMO DE DECISIÓN DE UN AGENTE QUE BUSCA DOCUMENTOS EN INTERNET BASADO EN UNA PARTICIÓN DE CONCEPTOS 51 4.1. MODELO DE DECISIÓN 53 SOLICITUD DE DOCUMENTOS A INTERNET 60 5. PROTOTIPO DE UN BUSCADOR DE DOCUMENTOS BASADO EN LA TEORÍA DE RASGOS CONCEPTUALES 61 6. COMPARACIÓN CON OTROS TRABAJOS SIMILARES 87 6.1. MODELOS DE BÚSQUEDA BASADOS EN ESTRUCTURAS CONCEPTUALES 87 6.2. UNA APLICACIÓN DE BUSQUEDA BASADA EN CONCEPTOS 88 6.3. COMPARACIONES 90 7. CURVAS DE PRECISION Y RECALL COMPARADAS CON LAS DEL MOTOR DE BÚSQUEDA DE YAHOO 93 7.1. EL MODELO DE RASGOS CONCEPTUALES COMO ESTRATEGIA DE BUSQUEDA EN INTERNET. 93 7.2. RECALL Y PRECISION. 94 7.3. EL PROTOTIPO Y LOS EXPERIMENTOS 95 7.4. LAS PARTICIONES DE CONCEPTOS EN LAS PRUEBAS 97 7.5. ANALISIS DE RESULTADOS 97 8. CONCLUSIONES 102 REFERENCIAS Y BIBLIOGRAFÍA 103 ANEXOS 106MaestríaIn this work a model is proposed to consult and decide which documents satisfy the wishes of the user in general inquiries on the Internet. He The model is made up of three essential parts, namely: The theory psycholinguistics under which the mental models of an individual, the proposed model for searching and, finally, the explanation of the prototype developed software that supports the model. The last chapters are reserved for analyzing model and prototype performance. Psycholinguistic researchers in recent years have developed several theories that attempt to describe the way humans organize in their minds the abstractions of the real world and how written language is interpreted mentally. The generalized proposal has been the Theory Of Traits Conceptual, which will be treated in depth in the first chapter. As a second point, a methodology and a model are proposed that will serve a agent to decide about the relevance of a document to the user. In In this case, the semantics points towards the revision of the paragraphs as a unit of interpretation of the text, and it is under this scheme that a method of interpretation of the document to decide whether or not the monitored text contains the concepts proposed by the user.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaPrototipo de un sistema inteligente para recuperación de información en la WebPrototype of an intelligent system for information retrieval on the WebMagíster en Ciencias ComputacionalesBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaMaestría en Ciencias Computacionalesinfo:eu-repo/semantics/masterThesisTesishttp://purl.org/redcol/resource_type/TMInformation storage systemsInformation retrieval systemsNetwork information serviceSearch enginesInformation search strategiesSystems engineeringComputer scienceInvestigationsAnalysisMental modelsConceptual featuresSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónWorld wide webServicio de información sobre redesMotores de búsquedaEstrategias de búsqueda de informaciónIngeniería de sistemasCiencias computacionalesInvestigacionesAnálisisModelos mentalesSoftwareRasgos conceptualesBarraza Verdesoto, Edgardo Samuel (2003). Prototipo de un sistema inteligente para recuperación de información en la Web. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM[Demazeau, 1990] Decentralized Artificial Intelligence Yves Demazeau & Jean-Pierre Müller in Decentralized A.I., Y.Demazeau & J.P. Müller Eds, Elsevier 1990.[Finin, 1994] KQML as an Agent Communication Language. Finin, T., Fritzson, R., McKay, D. and McEntire, R. Proceedings of the Third International Conference on Information and Knowledge Management (CIKM'94), ACM Press[Wooldridge, 1997] Agent-based software engineering. Wooldridge, M. IEEE Transactions on Software Engineering, Febrero 1997.[Berko Y Bernstein, 1999] Psicolingüística. Jean Berko Gleason, Nan Bernstein Ratner. Mc GrawHill, 1999.[Heider 1972] Universal in Color Naming and Memory. Journal Of Experimental Psychology, 93, 10-20. Heider E. R.[Fowles Y Glanz 1977] Competente and Talent in Verbal Riddle Comprehension. Journal of Child Language, 4, 433-452. Fowles B., & Glanz, E.[Collins Y Quillian 1969] Retrieval Time from Semantic Memory. Journal of Verbal Learning and Verbal Behavior, 8, 240-248. Collins A. M. & Quillian M. R.[Smith 1974] Structure and Process in Semantic Memory: A Featural Model for Semantic Decisions. Psychological Review, 81, 214-241. Smith E., Shoben, E.J. & Rips, L. J.[Collins Y Loftus 1975] A Spreading Activation Theory of Semantic Processing. Psychological Review, 82, 407-428.[First Monday, 2000] Information seeking on the Web: An integrated Model of Browsing and Searching. Choo, Ch. W., Turnbull, D. First-Monday peer-reviewed journal on the Internet. http://www.firstmonday.dk/issues/issue5_2/choo/.[Williamson, Decker y Sycara 1996] Unified Information and Control Flow in Hierarchical Task Network, The Robotics Institute, Carnegie-Mellon University, Marzo 20 de 1996. Williamson M., Decker K .and Sycara K.[Lakoff, 1987] Women, fire and dangerous things. What categories reveal about the mind. Chicago: University of Chicago Press, Lakoff G.[Ordóñez 1999] Como leer un libro, Técnicas para el desarrollo y habilidades en la lectura. Olegario Ordóñez D., Editorial Esquilo, 1999.[Colman, Busby Y Ross, 1997] Estructuras de Matemáticas Discretas para la ciencia de la computación, Colman B., Busby R. C., Ross. S. C. Editorial Prentice Hall, 1997.[McKay, 1979] Lexical insertion, inflection, and derivation: Creative processes in word production, McKay D., Journal of psycholinguistic Research, 8, 477-498[Gelman Y Coley, 1991] Language and Categorization: The acquisition of natural kind terms. Gelman S. A. & Coley J. D., In S.A. Gelman &J.P. Byrns (Editores). Perspectives on language and Thought: Interrelations in development (pp 146-196) Cambridge: Cambridge University Press.[Fenghua, Johnsten, Raghavan, Taylor 2001] Enhancing Internet Search Engines to Achieve Concept-based Retrieval, Fenghua L. & Johnsten T. & Raghavan V. & Taylor D, 2001.[Menczer, 2002] Scalable Search Engines via Adaptive Topic-Driven Crawlers, Filippo Menczer, Department of Management Sciences, The University of Iowa, Iowa City, IA 52242, http://dollar.biz.uiowa.edu/~fil/.ORIGINAL2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdfTesisapplication/pdf939339https://repository.unab.edu.co/bitstream/20.500.12749/3329/1/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf921915cf5052c04b0dbc5e8aa1a4c8efMD51open accessTHUMBNAIL2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpg2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpgIM Thumbnailimage/jpeg5198https://repository.unab.edu.co/bitstream/20.500.12749/3329/2/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpge780917f93d149e7efdc786feca487a0MD52open access20.500.12749/3329oai:repository.unab.edu.co:20.500.12749/33292023-07-27 15:21:55.613open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co |