Prototipo de un sistema inteligente para recuperación de información en la Web

En este trabajo se propone un modelo para consultar y decidir qué documentos satisfacen los deseos del usuario en consultas generalizadas en Internet. El modelo está constituido por tres partes esenciales, a saber: La teoría sicolingüística bajo la cual se plantean los modelos mentales de un individ...

Full description

Autores:
Barraza Verdesoto, Edgardo Samuel
Tipo de recurso:
Fecha de publicación:
2003
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/3329
Acceso en línea:
http://hdl.handle.net/20.500.12749/3329
Palabra clave:
Information storage systems
Information retrieval systems
Network information service
Search engines
Information search strategies
Systems engineering
Computer science
Investigations
Analysis
Mental models
Conceptual features
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World wide web
Servicio de información sobre redes
Motores de búsqueda
Estrategias de búsqueda de información
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Modelos mentales
Software
Rasgos conceptuales
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_f1470476110def1c8623f49f7de94648
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/3329
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Prototipo de un sistema inteligente para recuperación de información en la Web
dc.title.translated.eng.fl_str_mv Prototype of an intelligent system for information retrieval on the Web
title Prototipo de un sistema inteligente para recuperación de información en la Web
spellingShingle Prototipo de un sistema inteligente para recuperación de información en la Web
Information storage systems
Information retrieval systems
Network information service
Search engines
Information search strategies
Systems engineering
Computer science
Investigations
Analysis
Mental models
Conceptual features
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World wide web
Servicio de información sobre redes
Motores de búsqueda
Estrategias de búsqueda de información
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Modelos mentales
Software
Rasgos conceptuales
title_short Prototipo de un sistema inteligente para recuperación de información en la Web
title_full Prototipo de un sistema inteligente para recuperación de información en la Web
title_fullStr Prototipo de un sistema inteligente para recuperación de información en la Web
title_full_unstemmed Prototipo de un sistema inteligente para recuperación de información en la Web
title_sort Prototipo de un sistema inteligente para recuperación de información en la Web
dc.creator.fl_str_mv Barraza Verdesoto, Edgardo Samuel
dc.contributor.author.spa.fl_str_mv Barraza Verdesoto, Edgardo Samuel
dc.contributor.cvlac.*.fl_str_mv https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000183288
dc.contributor.googlescholar.*.fl_str_mv https://scholar.google.es/citations?hl=es&user=vxco8nwAAAAJ
dc.contributor.researchgate.*.fl_str_mv https://www.researchgate.net/profile/Edgardo_Barraza_Verdesoto
dc.contributor.corporatename.spa.fl_str_mv Instituto Tecnológico y de Estudios Superiores de Monterrey México (ITESM)
dc.subject.keywords.eng.fl_str_mv Information storage systems
Information retrieval systems
Network information service
Search engines
Information search strategies
Systems engineering
Computer science
Investigations
Analysis
Mental models
Conceptual features
topic Information storage systems
Information retrieval systems
Network information service
Search engines
Information search strategies
Systems engineering
Computer science
Investigations
Analysis
Mental models
Conceptual features
Sistemas de almacenamiento de información
Sistemas de recuperación de información
World wide web
Servicio de información sobre redes
Motores de búsqueda
Estrategias de búsqueda de información
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
Modelos mentales
Software
Rasgos conceptuales
dc.subject.lemb.spa.fl_str_mv Sistemas de almacenamiento de información
Sistemas de recuperación de información
World wide web
Servicio de información sobre redes
Motores de búsqueda
Estrategias de búsqueda de información
Ingeniería de sistemas
Ciencias computacionales
Investigaciones
Análisis
dc.subject.proposal.none.fl_str_mv Modelos mentales
Software
Rasgos conceptuales
description En este trabajo se propone un modelo para consultar y decidir qué documentos satisfacen los deseos del usuario en consultas generalizadas en Internet. El modelo está constituido por tres partes esenciales, a saber: La teoría sicolingüística bajo la cual se plantean los modelos mentales de un individuo, el modelo propuesto para realizar búsqueda y, por último, la explicación del prototipo de software desarrollado que apoya el modelo. Los últimos capítulos son reservados para analizar el desempeño del modelo y del prototipo. Los investigadores sicolingüistas durante los últimos años han desarrollado varias teorías que intentan describir la forma cómo el ser humano organiza en su mente las abstracciones del mundo real y cómo se interpreta el lenguaje escrito mentalmente. La propuesta generalizada ha sido la Teoría De Rasgos Conceptuales, la cual será tratada a fondo en el primer capítulo. Como segundo punto, se propone una metodología y un modelo que servirán a un agente para decidir acerca de la relevancia de un documento para el usuario. En este caso la semántica apunta hacia la revisión de los párrafos como unidad de interpretación del texto, y es bajo este esquema que se propone un método de interpretación del documento para decidir si el texto auscultado contiene o no los conceptos propuestos por el usuario.
publishDate 2003
dc.date.issued.none.fl_str_mv 2003
dc.date.accessioned.none.fl_str_mv 2020-06-26T21:32:20Z
dc.date.available.none.fl_str_mv 2020-06-26T21:32:20Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.local.spa.fl_str_mv Tesis
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TM
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/3329
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
url http://hdl.handle.net/20.500.12749/3329
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Barraza Verdesoto, Edgardo Samuel (2003). Prototipo de un sistema inteligente para recuperación de información en la Web. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM
[Demazeau, 1990] Decentralized Artificial Intelligence Yves Demazeau & Jean-Pierre Müller in Decentralized A.I., Y.Demazeau & J.P. Müller Eds, Elsevier 1990.
[Finin, 1994] KQML as an Agent Communication Language. Finin, T., Fritzson, R., McKay, D. and McEntire, R. Proceedings of the Third International Conference on Information and Knowledge Management (CIKM'94), ACM Press
[Wooldridge, 1997] Agent-based software engineering. Wooldridge, M. IEEE Transactions on Software Engineering, Febrero 1997.
[Berko Y Bernstein, 1999] Psicolingüística. Jean Berko Gleason, Nan Bernstein Ratner. Mc GrawHill, 1999.
[Heider 1972] Universal in Color Naming and Memory. Journal Of Experimental Psychology, 93, 10-20. Heider E. R.
[Fowles Y Glanz 1977] Competente and Talent in Verbal Riddle Comprehension. Journal of Child Language, 4, 433-452. Fowles B., & Glanz, E.
[Collins Y Quillian 1969] Retrieval Time from Semantic Memory. Journal of Verbal Learning and Verbal Behavior, 8, 240-248. Collins A. M. & Quillian M. R.
[Smith 1974] Structure and Process in Semantic Memory: A Featural Model for Semantic Decisions. Psychological Review, 81, 214-241. Smith E., Shoben, E.J. & Rips, L. J.
[Collins Y Loftus 1975] A Spreading Activation Theory of Semantic Processing. Psychological Review, 82, 407-428.
[First Monday, 2000] Information seeking on the Web: An integrated Model of Browsing and Searching. Choo, Ch. W., Turnbull, D. First-Monday peer-reviewed journal on the Internet. http://www.firstmonday.dk/issues/issue5_2/choo/.
[Williamson, Decker y Sycara 1996] Unified Information and Control Flow in Hierarchical Task Network, The Robotics Institute, Carnegie-Mellon University, Marzo 20 de 1996. Williamson M., Decker K .and Sycara K.
[Lakoff, 1987] Women, fire and dangerous things. What categories reveal about the mind. Chicago: University of Chicago Press, Lakoff G.
[Ordóñez 1999] Como leer un libro, Técnicas para el desarrollo y habilidades en la lectura. Olegario Ordóñez D., Editorial Esquilo, 1999.
[Colman, Busby Y Ross, 1997] Estructuras de Matemáticas Discretas para la ciencia de la computación, Colman B., Busby R. C., Ross. S. C. Editorial Prentice Hall, 1997.
[McKay, 1979] Lexical insertion, inflection, and derivation: Creative processes in word production, McKay D., Journal of psycholinguistic Research, 8, 477-498
[Gelman Y Coley, 1991] Language and Categorization: The acquisition of natural kind terms. Gelman S. A. & Coley J. D., In S.A. Gelman &J.P. Byrns (Editores). Perspectives on language and Thought: Interrelations in development (pp 146-196) Cambridge: Cambridge University Press.
[Fenghua, Johnsten, Raghavan, Taylor 2001] Enhancing Internet Search Engines to Achieve Concept-based Retrieval, Fenghua L. & Johnsten T. & Raghavan V. & Taylor D, 2001.
[Menczer, 2002] Scalable Search Engines via Adaptive Topic-Driven Crawlers, Filippo Menczer, Department of Management Sciences, The University of Iowa, Iowa City, IA 52242, http://dollar.biz.uiowa.edu/~fil/.
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
Atribución-NoComercial-SinDerivadas 2.5 Colombia
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spa.fl_str_mv Bucaramanga (Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Maestría en Ciencias Computacionales
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/3329/1/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/3329/2/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpg
bitstream.checksum.fl_str_mv 921915cf5052c04b0dbc5e8aa1a4c8ef
e780917f93d149e7efdc786feca487a0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1808410542992261120
spelling Barraza Verdesoto, Edgardo Samuel2f09cf04-5c51-4550-a296-116e61990cf8https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000183288https://scholar.google.es/citations?hl=es&user=vxco8nwAAAAJhttps://www.researchgate.net/profile/Edgardo_Barraza_VerdesotoInstituto Tecnológico y de Estudios Superiores de Monterrey México (ITESM)2020-06-26T21:32:20Z2020-06-26T21:32:20Z2003http://hdl.handle.net/20.500.12749/3329instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEn este trabajo se propone un modelo para consultar y decidir qué documentos satisfacen los deseos del usuario en consultas generalizadas en Internet. El modelo está constituido por tres partes esenciales, a saber: La teoría sicolingüística bajo la cual se plantean los modelos mentales de un individuo, el modelo propuesto para realizar búsqueda y, por último, la explicación del prototipo de software desarrollado que apoya el modelo. Los últimos capítulos son reservados para analizar el desempeño del modelo y del prototipo. Los investigadores sicolingüistas durante los últimos años han desarrollado varias teorías que intentan describir la forma cómo el ser humano organiza en su mente las abstracciones del mundo real y cómo se interpreta el lenguaje escrito mentalmente. La propuesta generalizada ha sido la Teoría De Rasgos Conceptuales, la cual será tratada a fondo en el primer capítulo. Como segundo punto, se propone una metodología y un modelo que servirán a un agente para decidir acerca de la relevancia de un documento para el usuario. En este caso la semántica apunta hacia la revisión de los párrafos como unidad de interpretación del texto, y es bajo este esquema que se propone un método de interpretación del documento para decidir si el texto auscultado contiene o no los conceptos propuestos por el usuario.Instituto Tecnológico de Estudios Superiores de Monterrey ITESMINTRODUCCIÓN 1 1. PALABRAS Y SIGNIFICADO 3 1.1. PALABRAS Y PRIMITIVOS LÉXICOS 4 1.1.1 Factores que influyen en el acceso y organización de las palabras 6 1.1.2 Modelos de Acceso Léxico 9 1.2 SIGNIFICADO 12 1.2.1 Primitivos Conceptuales 13 1.2.2 Teorías 14 1.2.3 Organización Conceptual 18 2. EL PÁRRAFO Y EL TEXTO 23 2.1 MECANISMOS PARA IDENTIFICAR LA IDEA PRINCIPAL EN UN PÁRRAFO 24 2.2 DEL PÁRRAFO AL TEXTO 25 3. EL MODELO DE PARTICIÓN DE CONCEPTOS COMO ESTRATEGIA PARA BUSCAR DOCUMENTOS EN INTERNET 27 3.1. BUSCANDO INFORMACIÓN EN WEB 28 3.1.1. Estrategias De Búsqueda Existentes En La Web A Través De Los Motores De Búsqueda Estándar 31 3.2. EL MODELO PROPUESTO 32 3.2.1. Los Documentos Buscados 33 3.2.2. El Usuario y Las Herramientas de Búsqueda 34 3.2.3. La Formulación del Deseo Del Usuario 37 3.2.4. Conceptos y Rasgos Conceptuales 41 3.2.5. La Partición de Conceptos 43 3.2.6. Construcción de la Partición de Conceptos basado en el Deseo del Usuario 46 4. ALGORITMO DE DECISIÓN DE UN AGENTE QUE BUSCA DOCUMENTOS EN INTERNET BASADO EN UNA PARTICIÓN DE CONCEPTOS 51 4.1. MODELO DE DECISIÓN 53 SOLICITUD DE DOCUMENTOS A INTERNET 60 5. PROTOTIPO DE UN BUSCADOR DE DOCUMENTOS BASADO EN LA TEORÍA DE RASGOS CONCEPTUALES 61 6. COMPARACIÓN CON OTROS TRABAJOS SIMILARES 87 6.1. MODELOS DE BÚSQUEDA BASADOS EN ESTRUCTURAS CONCEPTUALES 87 6.2. UNA APLICACIÓN DE BUSQUEDA BASADA EN CONCEPTOS 88 6.3. COMPARACIONES 90 7. CURVAS DE PRECISION Y RECALL COMPARADAS CON LAS DEL MOTOR DE BÚSQUEDA DE YAHOO 93 7.1. EL MODELO DE RASGOS CONCEPTUALES COMO ESTRATEGIA DE BUSQUEDA EN INTERNET. 93 7.2. RECALL Y PRECISION. 94 7.3. EL PROTOTIPO Y LOS EXPERIMENTOS 95 7.4. LAS PARTICIONES DE CONCEPTOS EN LAS PRUEBAS 97 7.5. ANALISIS DE RESULTADOS 97 8. CONCLUSIONES 102 REFERENCIAS Y BIBLIOGRAFÍA 103 ANEXOS 106MaestríaIn this work a model is proposed to consult and decide which documents satisfy the wishes of the user in general inquiries on the Internet. He The model is made up of three essential parts, namely: The theory psycholinguistics under which the mental models of an individual, the proposed model for searching and, finally, the explanation of the prototype developed software that supports the model. The last chapters are reserved for analyzing model and prototype performance. Psycholinguistic researchers in recent years have developed several theories that attempt to describe the way humans organize in their minds the abstractions of the real world and how written language is interpreted mentally. The generalized proposal has been the Theory Of Traits Conceptual, which will be treated in depth in the first chapter. As a second point, a methodology and a model are proposed that will serve a agent to decide about the relevance of a document to the user. In In this case, the semantics points towards the revision of the paragraphs as a unit of interpretation of the text, and it is under this scheme that a method of interpretation of the document to decide whether or not the monitored text contains the concepts proposed by the user.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaPrototipo de un sistema inteligente para recuperación de información en la WebPrototype of an intelligent system for information retrieval on the WebMagíster en Ciencias ComputacionalesBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaMaestría en Ciencias Computacionalesinfo:eu-repo/semantics/masterThesisTesishttp://purl.org/redcol/resource_type/TMInformation storage systemsInformation retrieval systemsNetwork information serviceSearch enginesInformation search strategiesSystems engineeringComputer scienceInvestigationsAnalysisMental modelsConceptual featuresSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónWorld wide webServicio de información sobre redesMotores de búsquedaEstrategias de búsqueda de informaciónIngeniería de sistemasCiencias computacionalesInvestigacionesAnálisisModelos mentalesSoftwareRasgos conceptualesBarraza Verdesoto, Edgardo Samuel (2003). Prototipo de un sistema inteligente para recuperación de información en la Web. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey ITESM[Demazeau, 1990] Decentralized Artificial Intelligence Yves Demazeau & Jean-Pierre Müller in Decentralized A.I., Y.Demazeau & J.P. Müller Eds, Elsevier 1990.[Finin, 1994] KQML as an Agent Communication Language. Finin, T., Fritzson, R., McKay, D. and McEntire, R. Proceedings of the Third International Conference on Information and Knowledge Management (CIKM'94), ACM Press[Wooldridge, 1997] Agent-based software engineering. Wooldridge, M. IEEE Transactions on Software Engineering, Febrero 1997.[Berko Y Bernstein, 1999] Psicolingüística. Jean Berko Gleason, Nan Bernstein Ratner. Mc GrawHill, 1999.[Heider 1972] Universal in Color Naming and Memory. Journal Of Experimental Psychology, 93, 10-20. Heider E. R.[Fowles Y Glanz 1977] Competente and Talent in Verbal Riddle Comprehension. Journal of Child Language, 4, 433-452. Fowles B., & Glanz, E.[Collins Y Quillian 1969] Retrieval Time from Semantic Memory. Journal of Verbal Learning and Verbal Behavior, 8, 240-248. Collins A. M. & Quillian M. R.[Smith 1974] Structure and Process in Semantic Memory: A Featural Model for Semantic Decisions. Psychological Review, 81, 214-241. Smith E., Shoben, E.J. & Rips, L. J.[Collins Y Loftus 1975] A Spreading Activation Theory of Semantic Processing. Psychological Review, 82, 407-428.[First Monday, 2000] Information seeking on the Web: An integrated Model of Browsing and Searching. Choo, Ch. W., Turnbull, D. First-Monday peer-reviewed journal on the Internet. http://www.firstmonday.dk/issues/issue5_2/choo/.[Williamson, Decker y Sycara 1996] Unified Information and Control Flow in Hierarchical Task Network, The Robotics Institute, Carnegie-Mellon University, Marzo 20 de 1996. Williamson M., Decker K .and Sycara K.[Lakoff, 1987] Women, fire and dangerous things. What categories reveal about the mind. Chicago: University of Chicago Press, Lakoff G.[Ordóñez 1999] Como leer un libro, Técnicas para el desarrollo y habilidades en la lectura. Olegario Ordóñez D., Editorial Esquilo, 1999.[Colman, Busby Y Ross, 1997] Estructuras de Matemáticas Discretas para la ciencia de la computación, Colman B., Busby R. C., Ross. S. C. Editorial Prentice Hall, 1997.[McKay, 1979] Lexical insertion, inflection, and derivation: Creative processes in word production, McKay D., Journal of psycholinguistic Research, 8, 477-498[Gelman Y Coley, 1991] Language and Categorization: The acquisition of natural kind terms. Gelman S. A. & Coley J. D., In S.A. Gelman &J.P. Byrns (Editores). Perspectives on language and Thought: Interrelations in development (pp 146-196) Cambridge: Cambridge University Press.[Fenghua, Johnsten, Raghavan, Taylor 2001] Enhancing Internet Search Engines to Achieve Concept-based Retrieval, Fenghua L. & Johnsten T. & Raghavan V. & Taylor D, 2001.[Menczer, 2002] Scalable Search Engines via Adaptive Topic-Driven Crawlers, Filippo Menczer, Department of Management Sciences, The University of Iowa, Iowa City, IA 52242, http://dollar.biz.uiowa.edu/~fil/.ORIGINAL2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdfTesisapplication/pdf939339https://repository.unab.edu.co/bitstream/20.500.12749/3329/1/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf921915cf5052c04b0dbc5e8aa1a4c8efMD51open accessTHUMBNAIL2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpg2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpgIM Thumbnailimage/jpeg5198https://repository.unab.edu.co/bitstream/20.500.12749/3329/2/2003_Tesis_Edgardo_Samuel_Barraza_Verdesoto.pdf.jpge780917f93d149e7efdc786feca487a0MD52open access20.500.12749/3329oai:repository.unab.edu.co:20.500.12749/33292023-07-27 15:21:55.613open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co