Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web

El reciente y dramático crecimiento del Internet, es un claro signo de que la computación está entrando en una nueva era. Por esto es necesario empezar a reconocer nuevos conceptos como el filtrado y recuperación de información que nos permiten mostrar los documentos más relevantes de acuerdo con lo...

Full description

Autores:
Amaya Díaz, Javier Enrique
Cañate Celedón, Jair José
Carvajal Pineda, Carlos Fernando
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2002
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/27025
Acceso en línea:
http://hdl.handle.net/20.500.12749/27025
Palabra clave:
Systems engineer
Technological innovations
Selective dissemination
Storage systems
Information retrieval
Information retrieval
Artificial intelligence
Neural networks (Computer science)
Ingeniería de sistemas
Innovaciones tecnológicas
Recuperación de información
Inteligencia artificial
Redes neuronales (Computadores)
Diseminación selectiva
Sistemas de almacenamiento
Recuperación de información
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_37eb363d3539a4eda1d8ce591a9b09f8
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/27025
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
dc.title.translated.spa.fl_str_mv Prototype of content filtering system for the dissemination of information contained on the web
title Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
spellingShingle Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
Systems engineer
Technological innovations
Selective dissemination
Storage systems
Information retrieval
Information retrieval
Artificial intelligence
Neural networks (Computer science)
Ingeniería de sistemas
Innovaciones tecnológicas
Recuperación de información
Inteligencia artificial
Redes neuronales (Computadores)
Diseminación selectiva
Sistemas de almacenamiento
Recuperación de información
title_short Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
title_full Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
title_fullStr Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
title_full_unstemmed Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
title_sort Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la web
dc.creator.fl_str_mv Amaya Díaz, Javier Enrique
Cañate Celedón, Jair José
Carvajal Pineda, Carlos Fernando
dc.contributor.advisor.none.fl_str_mv Pérez Alcázar, José de Jesús
dc.contributor.author.none.fl_str_mv Amaya Díaz, Javier Enrique
Cañate Celedón, Jair José
Carvajal Pineda, Carlos Fernando
dc.contributor.cvlac.spa.fl_str_mv Amaya Díaz, Javier Enrique [0000164326]
dc.subject.keywords.spa.fl_str_mv Systems engineer
Technological innovations
Selective dissemination
Storage systems
Information retrieval
Information retrieval
Artificial intelligence
Neural networks (Computer science)
topic Systems engineer
Technological innovations
Selective dissemination
Storage systems
Information retrieval
Information retrieval
Artificial intelligence
Neural networks (Computer science)
Ingeniería de sistemas
Innovaciones tecnológicas
Recuperación de información
Inteligencia artificial
Redes neuronales (Computadores)
Diseminación selectiva
Sistemas de almacenamiento
Recuperación de información
dc.subject.lemb.spa.fl_str_mv Ingeniería de sistemas
Innovaciones tecnológicas
Recuperación de información
Inteligencia artificial
Redes neuronales (Computadores)
dc.subject.proposal.spa.fl_str_mv Diseminación selectiva
Sistemas de almacenamiento
Recuperación de información
description El reciente y dramático crecimiento del Internet, es un claro signo de que la computación está entrando en una nueva era. Por esto es necesario empezar a reconocer nuevos conceptos como el filtrado y recuperación de información que nos permiten mostrar los documentos más relevantes de acuerdo con los perfiles de sus usuarios. Existen diversos modelos para dicha labor, entre los que se encuentran los modelos clásicos como el modelo Booleano y Vectorial, los cuales tiene un formalismo simple porque la relevancia de los documentos recuperados se basa simplemente en la igualación parcial de los términos indexados en los documentos y las consultas. Otros modelos como el LSI, (indexación semántico latente), toma un paso adelante y además de trabajar con términos indexados, trabaja con “conceptos”, es decir, recupera documentos cuyos términos indexados no se encuentran en la consulta del usuario pero que también son relevantes. El modelo de redes neuronales tiene una función similar pero trabaja algoritmos de aprendizaje.
publishDate 2002
dc.date.issued.none.fl_str_mv 2002-01-20
dc.date.accessioned.none.fl_str_mv 2024-10-21T14:36:13Z
dc.date.available.none.fl_str_mv 2024-10-21T14:36:13Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv Trabajo de Grado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/27025
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/27025
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
repourl:https://repository.unab.edu.co
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv ARMSTRONG, R., FRIETAG, D., JOACHIMS, T. y MITCHELL, T„ WebWatcher: a learning apprentice for the world wide web. En Proceedings of the 1995 AAAI Spring Symposium of Information Gathering from Heterogeneous, Distributed Environments, Stanford, CA, 1995. AAAI Press. [
BAEZA Yates, Ricardo A. String Searching Algorithms. En FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. UpperSaddle River, New Jersey: Prentice Hall PTR, 1992.
BAEZA YATES, Ricardo y FRAKES, William B. Information Retrieval Data Structures & Algorithms. Prentice Hall PTR, Upper Saddle River, New Jersey. 1992.
BAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addisson WesleyACM Press. 1992.
BAKEL, Bas van. Modern classical document indexing: a linguistic contribution to knowledge-based IR. En Annual International ACM-SIGIR Conference on 12R research and Development in Information Retrieval (SIGIR’98) 1998. Melborne, AU. Proceedings. New York ACM Press, 1998. p.333-334.
BELKIN Nicholas J. y CROFT W. Bruce. Information filtering and information retrieval: Two sides of the same coin? Communications of the ACM, 35(12):29-38. Diciembre 1992.
BHARAT, K. y HENZINGER, M. Improved algorithms for topic distillation in a hyperlinked environment. In Proc. 21st International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 104-111, August 1998.
BOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unified Modeling Languaje. Addison Wesley Longman Inc. Rational Software Corporation. 1999.
CORTHOUST, Jan. The DSI Service of VUBIS-Antwerpen of Antwerp. 1996. http:/143.169.20.1/MAN/SDIE/# corp-au
DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.
FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. UpperSaddle River, New Jersey: Prentice Hall PTR, 1992. p. 102-130.
FRAKES, William B. Stemming Algorithms. En FRAKES, William B. BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992.
GILES, L„ BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Librarles.
KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. Al Magazine. Summer 1997. AAAI Press.
KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997. [
KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997.
KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997.
KRAAIJ, Wessel y POHLMANN, Renée. Viewing stemming as recall enhancement. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR’96), 1996, Zurich, Switzerland. Proceedings. New York: ACM Press, 1996. p.40-48.
MEADOW, Charles T. Text Information Retrieval Systems. Academic Press, 1992
MLADENIC, Dunja y GROBELNIK, Marko. Feature Selection for Classification Based on Text Hierarchy. En: Conference on Automated Learning and Discovery (CONALD-98), 2000, Proceedings. Pittsburg: Carnegie Mellón University, 2000. p.6p. http://www.cs.cmu.edu/afs/cs/user/dunja/www/pww.html
OARD W, Douglas. A conceptual Framework for Text Filtering. University of Maryland, College Park, Mayo, 1996. http://www.enee.umd.edu/medlab/filter/filter.html
PAGE, L. Y BRIN, S.. The Anatomy of a Search Engine. The Seventh International VWVW Conference (WWW’98). Brisbane, Australia, April 14-18, 1998. 129 [23] Pérez, Claudia. Agentes Móviles en Bibliotecas Digitales, [online]. [citado 17 mar., 2001], Disponible de <http://ict.pue.udlap.mx/pubs/claudia/cap1.html>
PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.
RILOFF, Ellen. Little words can make big difference for text classification. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR’95), 1995, Seattle, USA. Proceedings. New York: ACM Press, 1995.
SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).
SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Híll, 1983.
Scott Deerwester, Susan T. Dumais, George W. Fumas, Thomas K. Laundauer, Richard Harshman. Indexing by Latent Semantic Analysis.
WILBUR, J. W. y SIROTKIN, K. The Automatic Identification of Stop Words. Journal of Information Society, v.18, , p.45-55. 1992.
VAN RIJSBERGEN, C. J. Information retrieval. Butterworths
YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellón University, 1997.
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spatial.spa.fl_str_mv Bucaramanga (Santander, Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Pregrado Ingeniería de Sistemas
dc.publisher.programid.none.fl_str_mv ISI-1791
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/27025/1/2002_Amaya_Diaz_Javier.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/27025/2/license.txt
https://repository.unab.edu.co/bitstream/20.500.12749/27025/3/2002_Amaya_Diaz_Javier.pdf.jpg
bitstream.checksum.fl_str_mv 0c0b99dd10ea396fc5358f0333e06c01
3755c0cfdb77e29f2b9125d7a45dd316
7986b199722a7e6408274756e8dd599e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814278409367322624
spelling Pérez Alcázar, José de Jesús38f31005-c259-48e5-845c-ac95c39cc2b9Amaya Díaz, Javier Enriqued0138279-f799-459a-9a1c-c112d0b0f487Cañate Celedón, Jair José0ed7eaf2-4c60-4352-8075-c31b0559c581Carvajal Pineda, Carlos Fernando6cde9629-acf2-4d81-a9c3-804fd4c94ef0Amaya Díaz, Javier Enrique [0000164326]Bucaramanga (Santander, Colombia)UNAB Campus Bucaramanga2024-10-21T14:36:13Z2024-10-21T14:36:13Z2002-01-20http://hdl.handle.net/20.500.12749/27025instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coEl reciente y dramático crecimiento del Internet, es un claro signo de que la computación está entrando en una nueva era. Por esto es necesario empezar a reconocer nuevos conceptos como el filtrado y recuperación de información que nos permiten mostrar los documentos más relevantes de acuerdo con los perfiles de sus usuarios. Existen diversos modelos para dicha labor, entre los que se encuentran los modelos clásicos como el modelo Booleano y Vectorial, los cuales tiene un formalismo simple porque la relevancia de los documentos recuperados se basa simplemente en la igualación parcial de los términos indexados en los documentos y las consultas. Otros modelos como el LSI, (indexación semántico latente), toma un paso adelante y además de trabajar con términos indexados, trabaja con “conceptos”, es decir, recupera documentos cuyos términos indexados no se encuentran en la consulta del usuario pero que también son relevantes. El modelo de redes neuronales tiene una función similar pero trabaja algoritmos de aprendizaje.Introducción 1. Generalidades 5 1.1. Diseminación selectiva de información 5 1.2. Filtrado de información 6 1.2.1. Filtrado social o colaborativo. 6 1.2.1.1. Usuarios de un sistema de filtrado. 7 1.2.2. Filtrado basado en eventos 7 1.2.3 filtrado basado en reputación 10 1.2.4. Técnica de filtrado cognitivo o basado en contenido 12 2. Filtrado y recuperación de información 2.1. Conceptos básicos18 2.1.1. La tarea del usuario 2.1.2. La vista lógica del documento 2.2. El perfil en filtrado por contenido 20 3. Representación del documento 22 3.1. Estructura de almacenamiento de datos 23 3.1.1. Listas o archivos invertidos 23 3.2. Indexación automática 3.2.1. Identificación de términos. 25 3.2.2. Remoción de “stopwords”. 26 3.2.3. Normalización morfológica. 27 3.2.4. Calculo de relevancia. 30 3.2.5. Selección de términos. 4. Modelos de recuperación 34 4.1. Modelos de recuperación 4.2. Características de los modelos clásicos 36 4.2.1. Modelo booleano 36 4.2.2. Modelo vectorial 37 4.2.3. Modelo probabilístico 38 4.3. Modelo vectorial en recuperación de Información 4.4. Modelos algebraicos alternativos 43 4.4.1. Modelo de indexación semántico latente 43 4.4.2. Modelo de redes neuronales 47 4.4.2.1. Definiciones de una red neuronal 49 4.4.2.2. Ventajas que ofrecen las redes neuronale 4.4.2.2.1. Aprendizaje adaptativo 51 4.4.2.2.2. Auto-organización 52 4.4.2.2.3. Tolerancia a fallos. 53 4.4.2.2.4. Operación en tiempo real. 54 4.4.2.2.5. Fácil inserción dentro de la tecnología existente 55 4.4.2.3. Niveles o capas de una red neuronal 57 4.4.2.4. Mecanismos de aprendizaje 58 4.4.2.4.1. Aprendizaje por corrección de error 4.4.2.4.2. Aprendizaje por refuerzo 63 4.4.2.4.3. Aprendizaje estocástico 64 4.4.2.4.4. Aprendizaje no supervisado 65 4.4.2.5. Modelo de redes neuronales para la recuperación de 66 Información 5. Comparación y evaluación de los modelos de 71 Filtrado por contenido 5.1. Pruebas en el modelo booleano 73 5.2. Pruebas en el modelo vectorial 76 5.3. Pruebas en el modelo de redes neuronales 78 5.4. Pruebas en el modelo de indexación 80 Semántico latente 6. Prototipo de sistema de filtrado de 83 Información basada en contenido 6.1. Preanálisis 83 6.1.1. Casos de uso descripción 83 6.1.1.1. Validar usuario 84 6.1.1.2. Suscribirse al sistema 85 6.1.1.3. Activar proceso de filtrado 86 6.1.1.4. Definir perfil 87 6.1.1.5. Consultar información 88 6.2. Análisis. 89 6.2.1. Diagramas de secuencia y colaboración 6.2.2. Diagrama de clases 99 6.2.3. Diccionario de datos para el diagrama de clases 100 6.2.4. Diagrama de actividades 102 6.2.4.1. Usuario 102 6.2.4.2. Método 103 6.2.4.3. Vector espacial 105 6.3. Diseño 106 6.3.1. Diagramas correspondientes a la ingeniería de casos de 106 Uso. 6.3.2 descripción procedimental de objetos. 109 6.3.3. Descripción de pantallas 113 6.3.4. Arquitectura del sistema 117 6.3.5 desarrollo del sistema 120 7. Conclusiones 123 8. Recomendaciones 125 9. Bibliografía 126PregradoThe recent and dramatic growth of the Internet is a clear sign that computing is entering a new era. For this reason, it is necessary to begin to recognize new concepts such as filtering and information retrieval that allow us to display the most relevant documents according to the profiles of their users. There are various models for this task, among which are the classic models such as the Boolean and Vector models, which have a simple formalism because the relevance of the retrieved documents is based simply on the partial matching of the indexed terms in the documents and the queries. Other models such as LSI (latent semantic indexing) take a step forward and, in addition to working with indexed terms, work with “concepts”, that is, retrieve documents whose indexed terms are not found in the user’s query but are also relevant. The neural network model has a similar function but works with learning algorithms.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Prototipo de sistema de filtrado por contenido para la diseminación de información contenida en la webPrototype of content filtering system for the dissemination of information contained on the webIngeniero de SistemasUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de SistemasISI-1791info:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/TPSystems engineerTechnological innovationsSelective disseminationStorage systemsInformation retrievalInformation retrievalArtificial intelligenceNeural networks (Computer science)Ingeniería de sistemasInnovaciones tecnológicasRecuperación de informaciónInteligencia artificialRedes neuronales (Computadores)Diseminación selectivaSistemas de almacenamientoRecuperación de informaciónARMSTRONG, R., FRIETAG, D., JOACHIMS, T. y MITCHELL, T„ WebWatcher: a learning apprentice for the world wide web. En Proceedings of the 1995 AAAI Spring Symposium of Information Gathering from Heterogeneous, Distributed Environments, Stanford, CA, 1995. AAAI Press. [BAEZA Yates, Ricardo A. String Searching Algorithms. En FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. UpperSaddle River, New Jersey: Prentice Hall PTR, 1992.BAEZA YATES, Ricardo y FRAKES, William B. Information Retrieval Data Structures & Algorithms. Prentice Hall PTR, Upper Saddle River, New Jersey. 1992.BAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addisson WesleyACM Press. 1992.BAKEL, Bas van. Modern classical document indexing: a linguistic contribution to knowledge-based IR. En Annual International ACM-SIGIR Conference on 12R research and Development in Information Retrieval (SIGIR’98) 1998. Melborne, AU. Proceedings. New York ACM Press, 1998. p.333-334.BELKIN Nicholas J. y CROFT W. Bruce. Information filtering and information retrieval: Two sides of the same coin? Communications of the ACM, 35(12):29-38. Diciembre 1992.BHARAT, K. y HENZINGER, M. Improved algorithms for topic distillation in a hyperlinked environment. In Proc. 21st International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 104-111, August 1998.BOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unified Modeling Languaje. Addison Wesley Longman Inc. Rational Software Corporation. 1999.CORTHOUST, Jan. The DSI Service of VUBIS-Antwerpen of Antwerp. 1996. http:/143.169.20.1/MAN/SDIE/# corp-auDELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. UpperSaddle River, New Jersey: Prentice Hall PTR, 1992. p. 102-130.FRAKES, William B. Stemming Algorithms. En FRAKES, William B. BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992.GILES, L„ BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Librarles.KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. Al Magazine. Summer 1997. AAAI Press.KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997. [KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997.KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997.KRAAIJ, Wessel y POHLMANN, Renée. Viewing stemming as recall enhancement. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR’96), 1996, Zurich, Switzerland. Proceedings. New York: ACM Press, 1996. p.40-48.MEADOW, Charles T. Text Information Retrieval Systems. Academic Press, 1992MLADENIC, Dunja y GROBELNIK, Marko. Feature Selection for Classification Based on Text Hierarchy. En: Conference on Automated Learning and Discovery (CONALD-98), 2000, Proceedings. Pittsburg: Carnegie Mellón University, 2000. p.6p. http://www.cs.cmu.edu/afs/cs/user/dunja/www/pww.htmlOARD W, Douglas. A conceptual Framework for Text Filtering. University of Maryland, College Park, Mayo, 1996. http://www.enee.umd.edu/medlab/filter/filter.htmlPAGE, L. Y BRIN, S.. The Anatomy of a Search Engine. The Seventh International VWVW Conference (WWW’98). Brisbane, Australia, April 14-18, 1998. 129 [23] Pérez, Claudia. Agentes Móviles en Bibliotecas Digitales, [online]. [citado 17 mar., 2001], Disponible de <http://ict.pue.udlap.mx/pubs/claudia/cap1.html>PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.RILOFF, Ellen. Little words can make big difference for text classification. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR’95), 1995, Seattle, USA. Proceedings. New York: ACM Press, 1995.SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Híll, 1983.Scott Deerwester, Susan T. Dumais, George W. Fumas, Thomas K. Laundauer, Richard Harshman. Indexing by Latent Semantic Analysis.WILBUR, J. W. y SIROTKIN, K. The Automatic Identification of Stop Words. Journal of Information Society, v.18, , p.45-55. 1992.VAN RIJSBERGEN, C. J. Information retrieval. ButterworthsYANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellón University, 1997.ORIGINAL2002_Amaya_Diaz_Javier.pdf2002_Amaya_Diaz_Javier.pdfTesisapplication/pdf23575503https://repository.unab.edu.co/bitstream/20.500.12749/27025/1/2002_Amaya_Diaz_Javier.pdf0c0b99dd10ea396fc5358f0333e06c01MD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/27025/2/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD52open accessTHUMBNAIL2002_Amaya_Diaz_Javier.pdf.jpg2002_Amaya_Diaz_Javier.pdf.jpgIM Thumbnailimage/jpeg7349https://repository.unab.edu.co/bitstream/20.500.12749/27025/3/2002_Amaya_Diaz_Javier.pdf.jpg7986b199722a7e6408274756e8dd599eMD53open access20.500.12749/27025oai:repository.unab.edu.co:20.500.12749/270252024-10-21 22:03:32.764open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg==