Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo

La cantidad de información disponible actualmente, los diferentes medios y formatos de presentación, unidos a la poca disponibilidad de tiempo de los investigadores y personas en particular, hacen necesaria la implementación de modelos automatizados que seleccionen y evalúen la información, logrando...

Full description

Autores:
Calderón Benavides, Maritza Liliana
González Caro, Cristina Nayesca
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2001
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/27034
Acceso en línea:
http://hdl.handle.net/20.500.12749/27034
Palabra clave:
Systems engineer
Technological innovations
Information extraction
Class diagram
Cognitive and collaborative
Hybrid techniques
Electronic data processing
Prototype development
Algorithms
Ingeniería de sistemas
Innovaciones tecnológicas
Procesamiento electrónico de datos
Desarrollo de prototipos
Algoritmos
Extracción de información
Diagrama de clases
Cognitivo y colaborativo
Técnicas híbridas
Rights
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_597efaf0afb46cb076fccc522af2e959
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/27034
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
dc.title.translated.spa.fl_str_mv Prototype of information filtering system to support selective dissemination at the Technical Information Center of the Colombian Petroleum Institute
title Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
spellingShingle Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
Systems engineer
Technological innovations
Information extraction
Class diagram
Cognitive and collaborative
Hybrid techniques
Electronic data processing
Prototype development
Algorithms
Ingeniería de sistemas
Innovaciones tecnológicas
Procesamiento electrónico de datos
Desarrollo de prototipos
Algoritmos
Extracción de información
Diagrama de clases
Cognitivo y colaborativo
Técnicas híbridas
title_short Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
title_full Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
title_fullStr Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
title_full_unstemmed Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
title_sort Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de Petróleo
dc.creator.fl_str_mv Calderón Benavides, Maritza Liliana
González Caro, Cristina Nayesca
dc.contributor.advisor.none.fl_str_mv Pérez Alcázar, José de Jesús
dc.contributor.author.none.fl_str_mv Calderón Benavides, Maritza Liliana
González Caro, Cristina Nayesca
dc.contributor.cvlac.spa.fl_str_mv Calderón Benavides, Maritza Liliana [0000068900]
dc.contributor.googlescholar.spa.fl_str_mv Calderón Benavides, Maritza Liliana [XihGBWoAAAAJ&hl=es]
dc.contributor.orcid.spa.fl_str_mv Calderón Benavides, Maritza Liliana [0000-0001-8658-9036]
dc.contributor.scopus.spa.fl_str_mv Calderón Benavides, Maritza Liliana [15043558200]
dc.contributor.linkedin.spa.fl_str_mv Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]
dc.subject.keywords.spa.fl_str_mv Systems engineer
Technological innovations
Information extraction
Class diagram
Cognitive and collaborative
Hybrid techniques
Electronic data processing
Prototype development
Algorithms
topic Systems engineer
Technological innovations
Information extraction
Class diagram
Cognitive and collaborative
Hybrid techniques
Electronic data processing
Prototype development
Algorithms
Ingeniería de sistemas
Innovaciones tecnológicas
Procesamiento electrónico de datos
Desarrollo de prototipos
Algoritmos
Extracción de información
Diagrama de clases
Cognitivo y colaborativo
Técnicas híbridas
dc.subject.lemb.spa.fl_str_mv Ingeniería de sistemas
Innovaciones tecnológicas
Procesamiento electrónico de datos
Desarrollo de prototipos
Algoritmos
dc.subject.proposal.spa.fl_str_mv Extracción de información
Diagrama de clases
Cognitivo y colaborativo
Técnicas híbridas
description La cantidad de información disponible actualmente, los diferentes medios y formatos de presentación, unidos a la poca disponibilidad de tiempo de los investigadores y personas en particular, hacen necesaria la implementación de modelos automatizados que seleccionen y evalúen la información, logrando no sólo economizar recursos, sino también, obtener resultados útiles y personalizados que optimicen el desarrollo de los procesos basados en ella. El presente documento muestra la investigación realizada, el diseño y desarrollo para un Prototipo de Sistema de Filtrado de Información, creado con el objetivo de facilitar el trabajo que realizan las personas encargadas de buscar, clasificar y distribuir información. El sistema combina dos técnicas de filtrado (Cognitivo y Colaborativo), realiza sus predicciones basado en la fusión de estos dos juicios; estrategia que le permite proporcionar al usuario resultados más exactos y confiables.
publishDate 2001
dc.date.issued.none.fl_str_mv 2001-07-16
dc.date.accessioned.none.fl_str_mv 2024-10-21T15:38:40Z
dc.date.available.none.fl_str_mv 2024-10-21T15:38:40Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv Trabajo de Grado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.hasversion.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/27034
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/27034
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
repourl:https://repository.unab.edu.co
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv [1] ARMSTRONG, R., FRIETAG, D., JOACHIMS, T. y MITCHELL, T„ WebWatcher: a learning apprentice for the world wide web. En Proceedings of the 1995 AAAI Spring Symposium of Information Gathering from Heterogeneous, Distributed Environments, Stanford, CA, 1995. AAAI Press.
[2] BACLACE, Paúl E. Competitive agents for information filtering. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.
[3] BAEZA YATES, R. and RIBEIRO-NETO, Berthier A. Modern Information Retrieval. Maryland: Addison-Wesley-Longman Publishing co, 1999.
[4] BAEZA Yates, Ricardo A. String Searching Algoríthms. En FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.219-240.
[5] BAEZA YATES, Ricardo y FRAKES, William B. Information Retrieval Data Structures & Algorithms. Prentice Hall PTR, Upper Saddle River, New Jersey. 1992. Paginas 373 - 376.
[6] BAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addisson Wesley ACM Press. 1992.
[7] BAKEL, Bas van. Modern classical document indexing: a linguistic contribution to knowledge-based IR. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'98) 1998. Melborne, AU. Proceedings. New York ACM Press, 1998. p.333-334.
[8] BALABANOVIC, M. y SHOHAM, Y. Fab: Content-Based, Collaborative Recommendation. Communications of the ACM, Vol 40, No. 3, Mar. 1997, pp. 66- 70.
[9] BELKIN, Nicolás y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.
[11] BHARAT, K. y HENZINGER, M. Improved algorithms fortopic distillation in a hyperlinked environment. In Proc. 21st International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 104-111, August 1998.
[12] BOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unifíed Modeling Languaje. Addison Wesley Longman Inc. Rational Software Corporation. 1999.
[13] BOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unifíed Software Development Process. Addison Wesley Longman Inc. Rational Software Corporation. 1999.
[14] BOWEN, T. F, GOPAL, G, HERMAN G, HICKEY T, LLEE, K. C, MANSFIELD, W. H., RAITZ, J y WEIRIBNRIB, A. The datacycle architecture. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.
[15] BRIN, S. and PAGE, L. The anatomy of a large-scale hypertextual Web search engine. Computer Netsorks and ISDN Systems, 30, 1998. p. 107-117.
[16] CONALLEN, Jim. Building Web Aplications with UML. Addison Wesley Longman Inc. 1999.
[17] DA SILVA, llmério R. Y RIBEIRO NETO, Berthier A. Modelagem em Sistemas de recuperacao de Informacao. Jornadas Iberoamericanas de Informática. La Paz. 1996.
DE, Vel O. y NESBITT, S. A. Collaborative Filtering Agent System for Dynamic Virtual Communities on the Web. Working Notes of Learning from Text and the Web. Conferencia Automated Learning and Discovery (CONALD-98), Carnegie Mellón, Univ. Pittsburg, 1998; http://www.cs.cmu.edu/~conald/conald.shtml
[19] DELGADO, J. y ISHII, N. Content + Collaboration = Recommendation. En Papers from the AAAI 1998 Workshop on Recommender Systems, 37-41. Technical Report WS-98-08, Menlo Park, Calif. AAAI Press, 1998.
[20] DELGADO, J., ISHII N. y URA, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. En: Matthias Klush, Gerhard Weiss. Cooperative Agents II, Proceedings/CIA'98 pp. 206-215. LNAI Series Vol.1435, Springer-Verlag, 1998.
[21] DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.
[22] Filtrado Colaborativo. Disponible en http://maxft.udc.ie/chap4.html
[23] FOLDBERG, David, NICHOLAS, David, OKY, Brian M. y TERRY, Douglas. Using collaborative filtering to weave an information tapestry. Communications of theACM. Vol 35. No. 12. Diciembre, 1992.
[24] FOLDBERG, David, NICHOLAS, David, OKY, Brian M. y TERRY, Douglas. Using collaborative filtering to weave an information tapestry. Communications of theACM. Vol 35. No. 12. Diciembre, 1992.
[25] FOLTZ, Peter W. Using latent semantic indexing for information filtering. Conference on Office Information Systems. Paginas 40 - 47. ACM, Abril. 1990. http://www.psych.nmsu.edu/~pfoltz/cois/filterinq-cois.html
[26] FOLTZ, Peter W. y DUMAIS, Susan T. Personalized information delybery: An análisis of information filtering methods. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992. http://www.psych,nmsu.edu/~pfoltz/cacm/cacm.html
[27] FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZAYates, Ricardo A. Information Retrieval: Data Structures & Algorithms. UpperSaddle River, New Jersey: Prentice Hall PTR, 1992. p. 102-130.
[28] FRAKES, William B. Stemming Algorithms. En FRAKES, William B. BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.131-160.
[29] FRAKES, William B. Stemming Algorithms. En FRAKES, William B. BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.27 - 30.
[30] GILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Librarles, pp. 89-98, 1998.
[31] GUINCHAT, C., M. Menou. Introducción general a las Ciencias y Técnicas de la Información y Documentación. Madrid, CSIC-UNESCO, 1992, pp. 371-372.
[32] GUTHRIE, Louise et al. The role of lexicons in natural language processing. Communications of the ACM, v.39, n.1, p.63-72, 1996.
[33] HARMAN, Donna. The DARPA TIPSTER project. ACM SIGIR Forum, 26(2): 26-28. Fall. 1992.
[34] HERNÁNDEZ FIGUEROA, Zenón, PEREZ AGUILAR, José R y SANTANA SUAREZ,
http://protos.dis.ulpqc.es/docencia/seminarios/pln/Extraccion de información/
[35] HIRSCHMAN, Linette. Comparing MUCH - II and MUC - 3: Assessing the difficulty of different task. En proceedings, Third Message Understanding Conference (MUC - 3). Paginas 25 - 30. DARPA, KAUFMANN, Morgan. Mayo. 1991.
[36] HOUSMAN, Edward M. Survey of current system for selective dissemination of information. Technical Report SIG / DSI-1, American Society for Information Science Special Interest Group on DSI. Washintong, DC, Junio. 1969.
[37] Introducción a los sistemas de recuperación de información. <http://www.um.es/gtiweb/fjmm/sarisite/tema1.html>.
[38] JACOBS, Paúl S. y RAU, Lisa F. SCISOR: Extracting information from online news. Communications of the ACM, 33(11): 88-97. Noviembre. 1990.
[39] LUHN, H. P. A business inteligence System. IBM Journal of Research and Development, 2(4): 314 - 319. Octubre 1958.
[40] LUHN, H.P. A statistical aproach to mechanized enconding and searching of literary information. IBM Journal of Research and Development, 1975, 1 (4), p. 309 - 317.
[41] KAERS, Johan. Collaborative Filtering Algorithms in Select. The Select Project Starlab. Octubre 2000. Disponible en www.starlab.org/projects.pers.php3
[42] KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. Al Magazine. Summer 1997. AAAI Press.
[43] KEHNERT, Wendy y SUNDHHEM Beth. A performance evaluation of text Analysis Technologies. Al Magazine. 12(3): 81-94. Fall. 1991.
[44] KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997.
[45] KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997.
[46] KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley&Sons, 1997. 349p.
[47] KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997. Página 71.
[48] KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997. Página 79.
[49] KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997. 282p.
[50] KRAAIJ, Wessel y POHLMANN, Renée. Viewing stemming as recall enhancement. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'96), 1996, Zurich, Switzerland. Proceedings. New York: ACM Press, 1996. p.40-48.
[51] LOEB, Shoshana. Architecting personalized delivery of multimedia information. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.
[52] MARCHIONINI, Gary. Information Seeking in Electronic Enviroments. Cambiridge University Press, Cambridge, 1995.
[53] MLADENIC, Dunja y GROBELNIK, Marko. Feature Selection for Classification Based on Text Hierarchy. En: Conference on Automated Learning and Discovery (CONALD-98), 2000, Proceedings. Pittsburg: Carnegie Mellón University, 2000. p.6p. http://www.cs.cmu.edu/afs/cs/user/dunia/www/pww.html
[55] OARD W, Douglas. A conceptual Framework for Text Filtering. University of Maryland, College Park, Mayo, 1996. http://www.enee.umd.edu/medlab/filter/filter. htm I
[56] PAGE, L. Y BRIN, S.. The Anatomy of a Search Engine. The Seventh International \N\N\N Conference (WWW’98). Brisbane, Australia, April 14-18, 1998.
[57] Pearson Correlation Coefficient (PCC). Nursing 322 Nursing Inquiry: The Research Process Indiana State University School of Nursing. http://web.indstate.edu/nurs/mary/N322/pearsonr.html
[58] PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.
[59] POLLOCK Stephen. A rule - based message filtering Systems. ACM Transactions on Office Information Systems, 6(3): 232 -254. Julio. 1988.
[60] RAM, Ashwin. Natural language understanding for information filtering systems. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.
[61] RESNICK, Paúl, NEOPHYTOS, lacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filtering
of netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175- 186. ACM, Octubre 1994. http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html
[62] RIJSBERGEN, C. van. Information Retrieval. 2ed. London: Butterworths, 1979. 147p.
[63] RILOFF, Ellen. Little words can make big difference for text classification. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'95), 1995, Seattle, USA. Proceedings. New York: ACM Press, 1995. p. 130-136.
[64] ROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p. 16-24.
[65] RUCKER, J. y MARCOS, J.P., Siteseer: Personalized Navigation for the Web, Communications of the ACM. Vol. 40, No. 3. Marzo. 1997, pp. 73-75.
[66] RUMBAUGH, James, BLAHA, Michael, PREMERLANI, William, EDDY, Frederick y LORENSEN, William. Modelado y diseño Orientado a Objetos. Metodología OMT. Prentice Hall. 1995.
[67] SALTON, Gerald y SMITH, María. On the application of syntactic methodologies in automatic text analysis. Ithaca, New York: Department of Computer Science, Cornell University, 1988. (Technical Report).
[68] SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).
[69] SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. Pagina 63.
70] SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. Pagina 66.
[71] SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p.
[72] SALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).
[73] SARWAR, Badrul, KARYPIS, George, KONSTAN, Joseph y RIELD, John. Item - Based Collaborative Filtering Recommendation Algoritms. GroupLens Research Group / Army HPC Research Center. Department of Computer Science and Engineering. University of Minnesota, Minneapolis. http://www10.org/cdrom/papers/519/
[74] SCHÜTZE, Hinrich y SILVERSTEIN. Craig. Projections for efficient document clustering. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97) 1997. Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.60-66.
75] STADNIK, Irene y KASS, Robers. Modeling users’ interest in information filters. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.
[76] STEVENS, Curt. Automating the creation of information filters. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992. htt p://ho I odeck.com/curt/mypapers/CACM-12-92.ps
[77] TAYLOR, Robert S. The process of Asking questions. American Documentaron 13(4): 391 - 396. Octubre. 1962.
[78] TERRY, Douglas B. A tour through tapestry. En Proceedings of the ACM Conference on Organizational Computing Systems (COOCS). Paginas 21 - 30. Noviembre. 1993.
[79] WHITEHALL, T. Personal currents awareness service. A Handbook of Techniques for Manual SDI. Londres, British Library, Research and Development Reports, 1979.
[80] WIENER, Erik D. et al. A Neural Network Approach to Topic Spotting. En Fourth Annual Symposium on Document Analysis and Information Retrieval (SDAIR'95). 1995, Las Vegas. 1995.
http://www.stern.nvu.edu/~aweiqend/Research/Papers/TextCategorization
[81] WILBUR, J. W. y SIROTKIN, K. The Automatic Identification of Stop Words. Journal of Information Society, v.18, , p.45-55. 1992.
[82] WYLE, M. F. y FREY, H. P. Retrieving Higly dynamic, widely distributed information. En Proceeding of the Twelfth Annual International ACMSIGIR Conference on Research and Developmen in Information Retrieval, citado por BELKIN, H.J. y RIJSBERGEN, C. J. Páginas 108 - 115. ACM. Junio. 1989.
[83] YAN, Tak W y GARCIA MOLINA, Héctor. SIFT - A tool for wide-area information dissemination. En Proceedings of the Third International Conference 145 on Parallel and Distributed Information Systems. Paginas 89 - 98. IEEE Computer Society, Septiembre 1994. ftp://db.stanford.edu/pub/yan/1994/dsdi.ps
[84] YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellón University, 1997.
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spatial.spa.fl_str_mv Piedecuesta (Santander, Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Pregrado Ingeniería de Sistemas
dc.publisher.programid.none.fl_str_mv ISI-1791
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/27034/1/2001_Calderon_Benavides_Maritza.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/27034/2/license.txt
https://repository.unab.edu.co/bitstream/20.500.12749/27034/3/2001_Calderon_Benavides_Maritza.pdf.jpg
bitstream.checksum.fl_str_mv c0de9809c0cffbf0f82040e9c22a138e
3755c0cfdb77e29f2b9125d7a45dd316
fc27a68b3dd8c432e97d025ea841011b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814277719093936128
spelling Pérez Alcázar, José de Jesús38f31005-c259-48e5-845c-ac95c39cc2b9Calderón Benavides, Maritza Lilianad9c8fa25-713e-467d-969e-a9ee7fa56a36González Caro, Cristina Nayesca2baa7bd3-e24f-495f-b73c-1b5138bec8e8Calderón Benavides, Maritza Liliana [0000068900]Calderón Benavides, Maritza Liliana [XihGBWoAAAAJ&hl=es]Calderón Benavides, Maritza Liliana [0000-0001-8658-9036]Calderón Benavides, Maritza Liliana [15043558200]Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]Piedecuesta (Santander, Colombia)UNAB Campus Bucaramanga2024-10-21T15:38:40Z2024-10-21T15:38:40Z2001-07-16http://hdl.handle.net/20.500.12749/27034instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABrepourl:https://repository.unab.edu.coLa cantidad de información disponible actualmente, los diferentes medios y formatos de presentación, unidos a la poca disponibilidad de tiempo de los investigadores y personas en particular, hacen necesaria la implementación de modelos automatizados que seleccionen y evalúen la información, logrando no sólo economizar recursos, sino también, obtener resultados útiles y personalizados que optimicen el desarrollo de los procesos basados en ella. El presente documento muestra la investigación realizada, el diseño y desarrollo para un Prototipo de Sistema de Filtrado de Información, creado con el objetivo de facilitar el trabajo que realizan las personas encargadas de buscar, clasificar y distribuir información. El sistema combina dos técnicas de filtrado (Cognitivo y Colaborativo), realiza sus predicciones basado en la fusión de estos dos juicios; estrategia que le permite proporcionar al usuario resultados más exactos y confiables.Introducción 21 1. Generalidades 23 1.1. Recuperación de información 24 1.2. Acceso a base de datos 24 1.3. Extracción de información 25 1.4. Sistemas de alerta 26 1.5. Browsing 26 1.6. Diseminación selectiva de información 27 2. Filtrado de información 28 2.1. Rasgos característicos de un sistema de Filtrado de información 29 2.2. ¿Filtrado ó recuperación de información? 31 2.3. Terminología propia de los sistemas de Filtrado 33 2.4. Desarrollo histórico del filtrado de Información 35 2.5. Técnicas de filtrado 40 2.5.1. Filtrado social ó colaborativo 40 2.5.1.1. Usuarios de un sistema de filtrado 41 2.5.1.2. Implementaciones prácticas del filtrado social ó colaborativo 41 2.5.2. Filtrado basado en contenido ó cognitivo 44 2.5.2.1. Implementaciones prácticas del filtrado basado en Contenido o cognitivo. 45 2.5.3. Filtrado basado en eventos 49 2.5.4. Filtrado basado en reputación 52 2.5.4.1. Descripción de google 55 2.5.5. Técnicas de filtrado híbridas 56 2.5.5.1. Implementaciones prácticas de técnicas híbridas de filtrado De información 57 2.5.6. Importancia de mezclar técnicas 58 2.5.7. Mezcla de las técnicas de filtrado colaborativo y filtrado Basado en contenido en el prototipo de sistema de filtrado De información 60 3. Representación de un documento 66 3.1. Indexación automática 66 3.1.1. Identificación de términos 67 3.1.2. Identificación de términos compuestos 69 3.1.3. Remoción de "stopwords” 70 3.1.4. Normalización morfológica 72 3.1.5. Cálculo de relevancia 75 3.1.5.1. Frecuencia absoluta 76 3.1.5.2. Frecuencia relativa 77 3.1.5.3. Frecuencia inversa de documentos (¡nverse document Frequency - idf). 78 3.1.6. Selección de términos 80 3.1.6.1. Filtrado basado en el “peso” del término 81 3.1.6.2. Selección basada en el peso del término 81 3.1.6.3. Selección por “latent semantic index” 82 3.1.6.4. Selección por análisis de lenguaje natural. 83 4. Modelos utilizados por las técnicas de Filtrado de información 87 4.1. Modelo del vector espacial 87 4.2. Modelos utilizados para el filtrado Colaborativo 91 4.2.1. Descripción del proceso de filtrado colaborativo 91 4.2.1.1. Predicción 92 4.2.1.2. Recomendación 92 4.2.2. Algoritmos de filtrado colaborativo basados en memoria 93 4.2.3. Algoritmos de filtrado colaborativo basados en modelos 94 4.2.4. Algoritmo de filtrado colaborativo basado en usuario 95 4.2.5. Coeficiente de correlación de pearson 95 5. Estructura de almacenamiento 99 5.1. Listas o archivos inverti dos 99 6. Prototipo de sistema de filtrado de Información 102 6.1. Captura de requerimientos 102 6.1.1. Casos de uso. 102 6.1.1.1. Actor 103 6.1.1.2. Relaciones. 103 6.1.2. Casos de uso para el usuario del prototipo de sistema de Filtrado 103 6.2. Análisis 105 6.2.1. Diagrama de clases 105 6.2.2 diagrama de clases para el prototipo de sistema de Filtrado 105 6.2.2.1. Diccionario de datos para el diagrama de clases 108 6.2.3. Diagramas de interacción 109 6.2.3.1. Diagrama de secuencia 109 6.2.3.2. Diagrama de colaboración 110 6.2.4. Diagramas de secuencia y colaboración pare el prototipo De sistema de filtrado 111 6.2.5. Diagramas de actividades 112 6.2.6. Diagramas de actividades y sus descripciones para el Prototipo de sistema de filtrado de información 113 6.2.7. Diagrama de estados 113 6.2.8. Diagrama de estados para el prototipo de sistema de Filtrado 115 6.2.9. Clases - responsabilidades - colaboraciones 115 6.2.9.1. Clase 115 6.9.2.2. Responsabilidad. 117 6.2.9.3. Colaboración. 117 6.2.9.4. Tarjetas crc (clases - responsabilidades - Colaboraciones) 117 6.2.9.5. Tarjetas crc para el prototipo de sistema de filtrado de Información. 118 6.3. Diseño 118 6.3.1. Análisis de clases 118 6.3.1.1. Clase frontera (boundary). 118 6.3.1.2. Clase entidad (entity). 120 6.3.1.3. Clase control. 121 6.3.2. Ingeniería de casos de uso 122 6.3.2.1. Diagramas correspondientes a la ingeniería de casos de Uso 122 6.3.3. Descripción procedimental de objetos 123 6.3.4. Descripción de pantallas 124 6.3.4.1. Ingreso de datos usuario 124 6.3.4.2. Dar de baja usuario 124 6.3.4.3. Acción a realizar 124 6.3.4.4. Últimas recomendaciones 125 6.3.4.5. Calificar documento 125 6.3.4.6. Documentos calificados 125 6.3.4.7. Documentos mejor calificados 125 6.3.4.8. Usuarios destacados 125 6.3.4.9. Solicitud de reporte 126 6.3.4.10 enviar mensaje 126 6.3.4.11. Obtener información documentos 126 6.3.4.12. Pantallas adicionales 126 6.3.5. Arquitectura del sistema 126 6.3.5.1. Java server page (jsp). 127 6.3.5.2. Servlets 128 6.3.5.3. Javabeans 129 6.4. Desarrollo del sistema 129 6.4.1. Filtrado basado en contenido 130 6.4.1.1. Representación de los documentos. 130 6.4.1.2. Peso de las palabras. 131 6.4.1.3. Correlación de perfiles con documentos 131 6.4.2. Filtrado colaborativo 131 6.4.3. Mezcla de las técnicas de filtrado colaborativo y basado En contenido 132 6.4.4. Escala valorativa. 133 7. Conclusiones 134 8. Sugerencias para trabajos futuros 138 Bibliografía 139 Anexos 147PregradoThe amount of information currently available, the different media and presentation formats, together with the limited time available to researchers and individuals in particular, make it necessary to implement automated models that select and evaluate information, achieving not only savings in resources, but also, useful and personalized results that optimize the development of processes based on it. This document shows the research carried out, the design and development for a Prototype of Information Filtering System, created with the objective of facilitating the work carried out by people in charge of searching, classifying and distributing information. The system combines two filtering techniques (Cognitive and Collaborative), making its predictions based on the fusion of these two judgments; a strategy that allows it to provide the user with more accurate and reliable results.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)Atribución-NoComercial-SinDerivadas 2.5 Colombiahttp://purl.org/coar/access_right/c_abf2Prototipo de sistema de filtrado de información para dar apoyo a la diseminación selectiva en el Centro de Información Técnica del Instituto Colombiano de PetróleoPrototype of information filtering system to support selective dissemination at the Technical Information Center of the Colombian Petroleum InstituteIngeniero de SistemasUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de SistemasISI-1791info:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/acceptedVersionhttp://purl.org/redcol/resource_type/TPSystems engineerTechnological innovationsInformation extractionClass diagramCognitive and collaborativeHybrid techniquesElectronic data processingPrototype developmentAlgorithmsIngeniería de sistemasInnovaciones tecnológicasProcesamiento electrónico de datosDesarrollo de prototiposAlgoritmosExtracción de informaciónDiagrama de clasesCognitivo y colaborativoTécnicas híbridas[1] ARMSTRONG, R., FRIETAG, D., JOACHIMS, T. y MITCHELL, T„ WebWatcher: a learning apprentice for the world wide web. En Proceedings of the 1995 AAAI Spring Symposium of Information Gathering from Heterogeneous, Distributed Environments, Stanford, CA, 1995. AAAI Press.[2] BACLACE, Paúl E. Competitive agents for information filtering. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.[3] BAEZA YATES, R. and RIBEIRO-NETO, Berthier A. Modern Information Retrieval. Maryland: Addison-Wesley-Longman Publishing co, 1999.[4] BAEZA Yates, Ricardo A. String Searching Algoríthms. En FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.219-240.[5] BAEZA YATES, Ricardo y FRAKES, William B. Information Retrieval Data Structures & Algorithms. Prentice Hall PTR, Upper Saddle River, New Jersey. 1992. Paginas 373 - 376.[6] BAEZA YATES, Ricardo Y RIBEIRO NETO, Rerthier. Modern Information Retrieval. Addisson Wesley ACM Press. 1992.[7] BAKEL, Bas van. Modern classical document indexing: a linguistic contribution to knowledge-based IR. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'98) 1998. Melborne, AU. Proceedings. New York ACM Press, 1998. p.333-334.[8] BALABANOVIC, M. y SHOHAM, Y. Fab: Content-Based, Collaborative Recommendation. Communications of the ACM, Vol 40, No. 3, Mar. 1997, pp. 66- 70.[9] BELKIN, Nicolás y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.[11] BHARAT, K. y HENZINGER, M. Improved algorithms fortopic distillation in a hyperlinked environment. In Proc. 21st International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 104-111, August 1998.[12] BOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unifíed Modeling Languaje. Addison Wesley Longman Inc. Rational Software Corporation. 1999.[13] BOOCH, Grady, JACOBSON, Ivar Y RUMBAUGH, James. The Unifíed Software Development Process. Addison Wesley Longman Inc. Rational Software Corporation. 1999.[14] BOWEN, T. F, GOPAL, G, HERMAN G, HICKEY T, LLEE, K. C, MANSFIELD, W. H., RAITZ, J y WEIRIBNRIB, A. The datacycle architecture. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.[15] BRIN, S. and PAGE, L. The anatomy of a large-scale hypertextual Web search engine. Computer Netsorks and ISDN Systems, 30, 1998. p. 107-117.[16] CONALLEN, Jim. Building Web Aplications with UML. Addison Wesley Longman Inc. 1999.[17] DA SILVA, llmério R. Y RIBEIRO NETO, Berthier A. Modelagem em Sistemas de recuperacao de Informacao. Jornadas Iberoamericanas de Informática. La Paz. 1996.DE, Vel O. y NESBITT, S. A. Collaborative Filtering Agent System for Dynamic Virtual Communities on the Web. Working Notes of Learning from Text and the Web. Conferencia Automated Learning and Discovery (CONALD-98), Carnegie Mellón, Univ. Pittsburg, 1998; http://www.cs.cmu.edu/~conald/conald.shtml[19] DELGADO, J. y ISHII, N. Content + Collaboration = Recommendation. En Papers from the AAAI 1998 Workshop on Recommender Systems, 37-41. Technical Report WS-98-08, Menlo Park, Calif. AAAI Press, 1998.[20] DELGADO, J., ISHII N. y URA, T. Content-based Collaborative Information Filtering: Actively Learning to Classify and Recommend Documents. En: Matthias Klush, Gerhard Weiss. Cooperative Agents II, Proceedings/CIA'98 pp. 206-215. LNAI Series Vol.1435, Springer-Verlag, 1998.[21] DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.[22] Filtrado Colaborativo. Disponible en http://maxft.udc.ie/chap4.html[23] FOLDBERG, David, NICHOLAS, David, OKY, Brian M. y TERRY, Douglas. Using collaborative filtering to weave an information tapestry. Communications of theACM. Vol 35. No. 12. Diciembre, 1992.[24] FOLDBERG, David, NICHOLAS, David, OKY, Brian M. y TERRY, Douglas. Using collaborative filtering to weave an information tapestry. Communications of theACM. Vol 35. No. 12. Diciembre, 1992.[25] FOLTZ, Peter W. Using latent semantic indexing for information filtering. Conference on Office Information Systems. Paginas 40 - 47. ACM, Abril. 1990. http://www.psych.nmsu.edu/~pfoltz/cois/filterinq-cois.html[26] FOLTZ, Peter W. y DUMAIS, Susan T. Personalized information delybery: An análisis of information filtering methods. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992. http://www.psych,nmsu.edu/~pfoltz/cacm/cacm.html[27] FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZAYates, Ricardo A. Information Retrieval: Data Structures & Algorithms. UpperSaddle River, New Jersey: Prentice Hall PTR, 1992. p. 102-130.[28] FRAKES, William B. Stemming Algorithms. En FRAKES, William B. BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.131-160.[29] FRAKES, William B. Stemming Algorithms. En FRAKES, William B. BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.27 - 30.[30] GILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Librarles, pp. 89-98, 1998.[31] GUINCHAT, C., M. Menou. Introducción general a las Ciencias y Técnicas de la Información y Documentación. Madrid, CSIC-UNESCO, 1992, pp. 371-372.[32] GUTHRIE, Louise et al. The role of lexicons in natural language processing. Communications of the ACM, v.39, n.1, p.63-72, 1996.[33] HARMAN, Donna. The DARPA TIPSTER project. ACM SIGIR Forum, 26(2): 26-28. Fall. 1992.[34] HERNÁNDEZ FIGUEROA, Zenón, PEREZ AGUILAR, José R y SANTANA SUAREZ,http://protos.dis.ulpqc.es/docencia/seminarios/pln/Extraccion de información/[35] HIRSCHMAN, Linette. Comparing MUCH - II and MUC - 3: Assessing the difficulty of different task. En proceedings, Third Message Understanding Conference (MUC - 3). Paginas 25 - 30. DARPA, KAUFMANN, Morgan. Mayo. 1991.[36] HOUSMAN, Edward M. Survey of current system for selective dissemination of information. Technical Report SIG / DSI-1, American Society for Information Science Special Interest Group on DSI. Washintong, DC, Junio. 1969.[37] Introducción a los sistemas de recuperación de información. <http://www.um.es/gtiweb/fjmm/sarisite/tema1.html>.[38] JACOBS, Paúl S. y RAU, Lisa F. SCISOR: Extracting information from online news. Communications of the ACM, 33(11): 88-97. Noviembre. 1990.[39] LUHN, H. P. A business inteligence System. IBM Journal of Research and Development, 2(4): 314 - 319. Octubre 1958.[40] LUHN, H.P. A statistical aproach to mechanized enconding and searching of literary information. IBM Journal of Research and Development, 1975, 1 (4), p. 309 - 317.[41] KAERS, Johan. Collaborative Filtering Algorithms in Select. The Select Project Starlab. Octubre 2000. Disponible en www.starlab.org/projects.pers.php3[42] KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. Al Magazine. Summer 1997. AAAI Press.[43] KEHNERT, Wendy y SUNDHHEM Beth. A performance evaluation of text Analysis Technologies. Al Magazine. 12(3): 81-94. Fall. 1991.[44] KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997.[45] KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997.[46] KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley&Sons, 1997. 349p.[47] KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997. Página 71.[48] KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997. Página 79.[49] KOWALSKI, Gerald. Information Retrieval Systems: Theory and Implementation. Boston: Kluwer Academic Publishers, 1997. 282p.[50] KRAAIJ, Wessel y POHLMANN, Renée. Viewing stemming as recall enhancement. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'96), 1996, Zurich, Switzerland. Proceedings. New York: ACM Press, 1996. p.40-48.[51] LOEB, Shoshana. Architecting personalized delivery of multimedia information. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.[52] MARCHIONINI, Gary. Information Seeking in Electronic Enviroments. Cambiridge University Press, Cambridge, 1995.[53] MLADENIC, Dunja y GROBELNIK, Marko. Feature Selection for Classification Based on Text Hierarchy. En: Conference on Automated Learning and Discovery (CONALD-98), 2000, Proceedings. Pittsburg: Carnegie Mellón University, 2000. p.6p. http://www.cs.cmu.edu/afs/cs/user/dunia/www/pww.html[55] OARD W, Douglas. A conceptual Framework for Text Filtering. University of Maryland, College Park, Mayo, 1996. http://www.enee.umd.edu/medlab/filter/filter. htm I[56] PAGE, L. Y BRIN, S.. The Anatomy of a Search Engine. The Seventh International \N\N\N Conference (WWW’98). Brisbane, Australia, April 14-18, 1998.[57] Pearson Correlation Coefficient (PCC). Nursing 322 Nursing Inquiry: The Research Process Indiana State University School of Nursing. http://web.indstate.edu/nurs/mary/N322/pearsonr.html[58] PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.[59] POLLOCK Stephen. A rule - based message filtering Systems. ACM Transactions on Office Information Systems, 6(3): 232 -254. Julio. 1988.[60] RAM, Ashwin. Natural language understanding for information filtering systems. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.[61] RESNICK, Paúl, NEOPHYTOS, lacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filteringof netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175- 186. ACM, Octubre 1994. http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html[62] RIJSBERGEN, C. van. Information Retrieval. 2ed. London: Butterworths, 1979. 147p.[63] RILOFF, Ellen. Little words can make big difference for text classification. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'95), 1995, Seattle, USA. Proceedings. New York: ACM Press, 1995. p. 130-136.[64] ROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p. 16-24.[65] RUCKER, J. y MARCOS, J.P., Siteseer: Personalized Navigation for the Web, Communications of the ACM. Vol. 40, No. 3. Marzo. 1997, pp. 73-75.[66] RUMBAUGH, James, BLAHA, Michael, PREMERLANI, William, EDDY, Frederick y LORENSEN, William. Modelado y diseño Orientado a Objetos. Metodología OMT. Prentice Hall. 1995.[67] SALTON, Gerald y SMITH, María. On the application of syntactic methodologies in automatic text analysis. Ithaca, New York: Department of Computer Science, Cornell University, 1988. (Technical Report).[68] SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).[69] SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. Pagina 63.70] SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. Pagina 66.[71] SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p.[72] SALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).[73] SARWAR, Badrul, KARYPIS, George, KONSTAN, Joseph y RIELD, John. Item - Based Collaborative Filtering Recommendation Algoritms. GroupLens Research Group / Army HPC Research Center. Department of Computer Science and Engineering. University of Minnesota, Minneapolis. http://www10.org/cdrom/papers/519/[74] SCHÜTZE, Hinrich y SILVERSTEIN. Craig. Projections for efficient document clustering. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97) 1997. Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.60-66.75] STADNIK, Irene y KASS, Robers. Modeling users’ interest in information filters. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992.[76] STEVENS, Curt. Automating the creation of information filters. Communications of the ACM. Vol 35. No. 12. Diciembre, 1992. htt p://ho I odeck.com/curt/mypapers/CACM-12-92.ps[77] TAYLOR, Robert S. The process of Asking questions. American Documentaron 13(4): 391 - 396. Octubre. 1962.[78] TERRY, Douglas B. A tour through tapestry. En Proceedings of the ACM Conference on Organizational Computing Systems (COOCS). Paginas 21 - 30. Noviembre. 1993.[79] WHITEHALL, T. Personal currents awareness service. A Handbook of Techniques for Manual SDI. Londres, British Library, Research and Development Reports, 1979.[80] WIENER, Erik D. et al. A Neural Network Approach to Topic Spotting. En Fourth Annual Symposium on Document Analysis and Information Retrieval (SDAIR'95). 1995, Las Vegas. 1995.http://www.stern.nvu.edu/~aweiqend/Research/Papers/TextCategorization[81] WILBUR, J. W. y SIROTKIN, K. The Automatic Identification of Stop Words. Journal of Information Society, v.18, , p.45-55. 1992.[82] WYLE, M. F. y FREY, H. P. Retrieving Higly dynamic, widely distributed information. En Proceeding of the Twelfth Annual International ACMSIGIR Conference on Research and Developmen in Information Retrieval, citado por BELKIN, H.J. y RIJSBERGEN, C. J. Páginas 108 - 115. ACM. Junio. 1989.[83] YAN, Tak W y GARCIA MOLINA, Héctor. SIFT - A tool for wide-area information dissemination. En Proceedings of the Third International Conference 145 on Parallel and Distributed Information Systems. Paginas 89 - 98. IEEE Computer Society, Septiembre 1994. ftp://db.stanford.edu/pub/yan/1994/dsdi.ps[84] YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellón University, 1997.ORIGINAL2001_Calderon_Benavides_Maritza.pdf2001_Calderon_Benavides_Maritza.pdfTesisapplication/pdf38159822https://repository.unab.edu.co/bitstream/20.500.12749/27034/1/2001_Calderon_Benavides_Maritza.pdfc0de9809c0cffbf0f82040e9c22a138eMD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8829https://repository.unab.edu.co/bitstream/20.500.12749/27034/2/license.txt3755c0cfdb77e29f2b9125d7a45dd316MD52open accessTHUMBNAIL2001_Calderon_Benavides_Maritza.pdf.jpg2001_Calderon_Benavides_Maritza.pdf.jpgIM Thumbnailimage/jpeg8587https://repository.unab.edu.co/bitstream/20.500.12749/27034/3/2001_Calderon_Benavides_Maritza.pdf.jpgfc27a68b3dd8c432e97d025ea841011bMD53open access20.500.12749/27034oai:repository.unab.edu.co:20.500.12749/270342024-10-21 22:01:55.722open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coRUwoTE9TKSBBVVRPUihFUyksIG1hbmlmaWVzdGEobWFuaWZlc3RhbW9zKSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuCgpFbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbi4gRWwgQVVUT1IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBlbiBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVTkFCIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmUuCgpFbCBBVVRPUiBhdXRvcml6YSBhIGxhIFVuaXZlcnNpZGFkIEF1dMOzbm9tYSBkZSBCdWNhcmFtYW5nYSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24uCg==