Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing

En la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinoni...

Full description

Autores:
Duran Valero, Iván Darío
Bernal Rodríguez, Jorge Federico
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2004
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/1351
Acceso en línea:
http://hdl.handle.net/20.500.12749/1351
Palabra clave:
Selective dissemination of information
Information storage systems
Information retrieval systems
Automatic indexing
Systems Engineering
Investigations
Analysis
Information filtering
Topics of interest
Information centers
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Indización automática
Ingeniería de sistemas
Investigaciones
Análisis
Filtrado de información
Temas de interés
Centros de información
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UNAB2_a6fc9f94db3c44769969b86f15e5cb74
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/1351
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
dc.title.translated.eng.fl_str_mv Prototype of content-based information filtering system using Latent Semantic Indexing
title Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
spellingShingle Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
Selective dissemination of information
Information storage systems
Information retrieval systems
Automatic indexing
Systems Engineering
Investigations
Analysis
Information filtering
Topics of interest
Information centers
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Indización automática
Ingeniería de sistemas
Investigaciones
Análisis
Filtrado de información
Temas de interés
Centros de información
title_short Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
title_full Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
title_fullStr Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
title_full_unstemmed Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
title_sort Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
dc.creator.fl_str_mv Duran Valero, Iván Darío
Bernal Rodríguez, Jorge Federico
dc.contributor.advisor.spa.fl_str_mv Calderón Benavides, Maritza Liliana
dc.contributor.author.spa.fl_str_mv Duran Valero, Iván Darío
Bernal Rodríguez, Jorge Federico
dc.contributor.cvlac.spa.fl_str_mv Calderón Benavides, Maritza Liliana [0000068900]
dc.contributor.googlescholar.spa.fl_str_mv Calderón Benavides, Maritza Liliana [XihGBWoAAAAJ]
dc.contributor.orcid.none.fl_str_mv Calderón Benavides, Maritza Liliana [0000-0001-8658-9036]
dc.contributor.scopus.none.fl_str_mv Calderón Benavides, Maritza Liliana [15043558200]
dc.contributor.researchgate.none.fl_str_mv Calderón Benavides, Maritza Liliana [Liliana_Calderon-Benavides]
dc.contributor.researchgroup.spa.fl_str_mv Grupo de Investigación Tecnologías de Información - GTI
Grupo de Investigaciones Clínicas
dc.contributor.apolounab.none.fl_str_mv Calderón Benavides, Maritza Liliana [maritza-liliana-calderón-benavides]
dc.contributor.linkedin.none.fl_str_mv Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]
Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]
dc.subject.keywords.eng.fl_str_mv Selective dissemination of information
Information storage systems
Information retrieval systems
Automatic indexing
Systems Engineering
Investigations
Analysis
Information filtering
Topics of interest
Information centers
topic Selective dissemination of information
Information storage systems
Information retrieval systems
Automatic indexing
Systems Engineering
Investigations
Analysis
Information filtering
Topics of interest
Information centers
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Indización automática
Ingeniería de sistemas
Investigaciones
Análisis
Filtrado de información
Temas de interés
Centros de información
dc.subject.lemb.spa.fl_str_mv Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Indización automática
Ingeniería de sistemas
Investigaciones
Análisis
dc.subject.proposal.spa.fl_str_mv Filtrado de información
Temas de interés
Centros de información
description En la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinonimia, (palabras diferentes pero que tienen el mismo significado) y la polisemia, (palabras iguales pero que tienen diferentes significados), por lo tanto, estos problemas hacen que las búsquedas cambien de sentido y los usuarios obtengan información que no desean. El objetivo de este proyecto de investigación y desarrollo es comprobar el funcionamiento del modelo Latent Semantic Indexing LSI, mediante la implementación y puesta en funcionamiento de dicho modelo, en un Prototipo de Filtrado de Información Basado En Contenido.
publishDate 2004
dc.date.issued.none.fl_str_mv 2004-07
dc.date.accessioned.none.fl_str_mv 2020-06-26T17:56:30Z
dc.date.available.none.fl_str_mv 2020-06-26T17:56:30Z
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.local.spa.fl_str_mv Trabajo de Grado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/1351
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional UNAB
url http://hdl.handle.net/20.500.12749/1351
identifier_str_mv instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Duran Valero, Iván Darío, Bernal Rodríguez, Jorge Federico, Calderón Benavidez, Liliana Maritza (2004). Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB
GOOGLE inc. Perfil de la compañía, todo acerca de Google. <http:\\www.google.com.ar/intl/es/profile.html>. Consultada en abril 2004.
dc.relation.references.none.fl_str_mv AMPUERO Juan. Lengua Española, El léxico español. Estudio semántico. Disponible en: <http://mimosa.pntic.mec.es/~ajuan3/lengua/lex_sem.htm>. Consultada en abril 2004.
ALEJANDRIA, Diseminación Selectiva de Información. Julio de 1999. Disponible en: <http://alejandria.hacer.ula.ve/DSIP.htm>. Consultada en abril 2004.
IRINA, KATZAGIANNAKI Electra, PLEXOUSAKIS Dimitris. Information Dissemination Based in Semantic Relations. Grecia. Disponible en : <http://www.ics.forth.gr/isl/publications/paperlink/caiseforum-kp03.pdf>. Consultada en Marzo 2004.
SANCHEZ Pereira Antonio. La diseminación selectiva de información a través de internet : propuesta de boletín electrónico de información bibliográfica especializada en economía, utilizando la base de datos CLASE. UNAM. Disponible: <http://www.dgbiblio.unam.mx/servicios/dgb/publicdgb/bole/fulltext/volII1/clase.html>. Consultada en febrero 2004.
TAPASWI Murari. SDI Selective Dissemination of Information. National Information Centre For Marine Sciences. India. Disponible en: <http://ioc.unesco.org/oceanteacher/Information/Course2/sdi1.ppt>. Consultada en abril 2004.
PONTE Cachafeiro, E., "Diseño de un servicio de Diseminación Selectiva de Información". Info: Congreso Internacional de Información, Vol. 5, 2004.
FOLTZ Peter. Using Latent Semantic Indexing For Information Filtering. 1990. Disponible en: <http://www-psych.nmsu.edu/~pfoltz/cois/filtering-cois.html>. Consultada en febrerol 2004.
VAN Setten M. Designing Personalised Information Systems. Telematica Instiuut. 2000. Disponible en: <https://doc.telin.nl/dscgi/ds.py/Get/File-12043/Sota.doc>. Consultada en abril 2004.
INGWERSEN Peter. Information Retrieval Interaction. Royal School of Library and Information Science. Denmark. 2002. Disponible en: <http://www.db.dk/pi/iri/files/Ingwersen_IRI_Chapter3.pdf>. Consultada en mayo 2004.
Introducción a los Sistemas de Recuperación de Información. Disponible en: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html. Consultada en enero 2004.
KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre 1997.
BELKIN, Nicolas y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.
CALDERÓN Benavides Maritza Liliana, GONZÁLEZ Caro Cristina Nayesca. Prototipo De Sistema De Filtrado De Información Para Dar Apoyo A La Diseminación Selectiva En El Centro De Información Técnica Del Instituto Colombiano De Petróleos. Universidad Autónoma de Bucaramanga. I.S 1589. 2002.
HERLOCKER J., KONSTAN J., BORCHERS A., and RIEDL J., An algorithmic framework for performing collaborative filtering. In SIGIR´99: Proceedings of the 22 Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999.
RESNICK, Paul, NEOPHYTOS, Iacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filtering of netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175-186. ACM, Octubre 1994. Disponible en: <http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html> Consultada en octubre 2003.
DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.
PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.
GILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Libraries, pp. 89-98, 1998.
KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. AI Magazine. Summer 1997. AAAI Press.
KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997.
KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997.
MEADOW, Charles T. Text Information Retrieval Systems. Academic Press. 1992.
VAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45p.
FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.102-130.
Frakes William, Baeza Yates Ricardo. Information Retrieval Data Strucures & Algorithms. Prentice Hall. 1992.
YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellon University, 1997.
SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).
SALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).
ROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.16-24
SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p.
KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997. 349p.
Dumais Susan .LSI meets TREC: A status report. The First Text REtrieval Conference (TREC1), National Institute of Standards and Technology Special Publication 500-207, pp. 137-152. Disponible en: <http://lsi.argreenhouse.com/lsi/LSIpapers.html>. Consultada en mayo 2004.
YU clara, CUADRADO Jhon, CEGLOWSKY Maciej, PAYNE J. Scout. Patterns in Unstructured Data Discovery, Aggregation, and Visualization. 2002. Disponible en: <http://javelina.cet.middlebury.edu/lsa/out/lsa_definition.htm>. Consultada en febrero 2004.
FOLTZ Peter, DUMAIS Susan. Personalized Information Delivery: An Analysis of Information Filtering Methods. Communications of the ACM, 35(12), 51-60. 1992. Disponible en: < http://www-psych.nmsu.edu/~pfoltz/cacm/cacm.html>. Consultada en abril 2004.
DOMINGUEZ Javier, ALIAS Pujol Frances, SOCORO Joan. Extracción de tópicos independientes para la Clasificación de textos. Disponible en: <http://web.salleurl.edu/~xavis/cat/ursi2003_xsd.pdf.> Consultada en enero 2004.
SANTO Orcero David. La matriz fundamental y la matriz esencial. Concepto y aplicaciones. Mayo 2002. Disponible en: <http://www.orcero.org/irbis/fundamental/node5.html>. Consultada en abril 2004.
DEERWESTER Scott, DUMAIS Susan T., FURNAS George W., LANDAUER Thomas K, HARSHMAN Richard. Indexing by Latent Semantic Analysis.1990. Disponible en: <http://lsi.research.telcordia.com/lsi/papers/JASIS90.pdf.> Consultada en septiembre 2003.
NAKOS George, JOYNER David. Álgebra lineal con aplicaciones. Edi Internacional Thomson Editores. 1998.
BERNSTEIN Abraham, CLEARWATER Scott, PROVOST Foster. The Relational Vector-space Model and Industry Classification. Disponible en: < http://kdl.cs.umass.edu/srl2003_upload/files/bernstein-paper.pdf.> Consultada en enero 2004.
LONGZHUANG Li, YI Shang, and WEI Zhang. Improvement of HITS-based Algorithms on Web Documents. ACM 1-58113-449-5/02/0005 May 2002. Honolulu. Disponible en: <http://www2002.org/CDROM/refereed/643/node5.html>. Consultada en abril 2004.
Unit RR, Part B1: Basic Vector Space Model. Disponible en: <http://ei.cs.vt.edu/~cs5604/cs5604cnRR/RR-b1.html>. Consultada en noviembre 2003.
BAEZA yates, Ricardo Y RIBEIRO NETO, Moder Information Retrieval . Edi. Addison – Wesley. 1999. Pág 76 y ss.
BAEZA Yates Ricardo and RIBEIRO Neto Berthier. Modern Information Retrieval. Cystic Fibrosis Reference Collection. Disponible en: <http://sunsite.dcc.uchile.cl/irbook/cfc.html>. Consultada en abril 2004.
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
dc.rights.creativecommons.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
Atribución-NoComercial-SinDerivadas 2.5 Colombia
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.spa.fl_str_mv Bucaramanga (Colombia)
dc.coverage.campus.spa.fl_str_mv UNAB Campus Bucaramanga
dc.publisher.grantor.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.publisher.faculty.spa.fl_str_mv Facultad Ingeniería
dc.publisher.program.spa.fl_str_mv Pregrado Ingeniería de Sistemas
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/1351/1/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/1351/2/2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zip
https://repository.unab.edu.co/bitstream/20.500.12749/1351/3/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpg
bitstream.checksum.fl_str_mv 26706ce088c3fabbb32484fadba02939
bda66afe0e966595d6d35fcabe763e06
71dc29c2020fbb98d039837c3a1dd0a1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814278153710862336
spelling Calderón Benavides, Maritza Lilianaa478af73-8b10-4632-aff9-2b9977a8b4e2-1Duran Valero, Iván Darío310e52e2-88b1-42c8-bbf3-ddfb63a5fef9-1Bernal Rodríguez, Jorge Federico25fd8711-819c-4233-b2a4-9424fd450330-1Calderón Benavides, Maritza Liliana [0000068900]Calderón Benavides, Maritza Liliana [XihGBWoAAAAJ]Calderón Benavides, Maritza Liliana [0000-0001-8658-9036]Calderón Benavides, Maritza Liliana [15043558200]Calderón Benavides, Maritza Liliana [Liliana_Calderon-Benavides]Grupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones ClínicasCalderón Benavides, Maritza Liliana [maritza-liliana-calderón-benavides]Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]2020-06-26T17:56:30Z2020-06-26T17:56:30Z2004-07http://hdl.handle.net/20.500.12749/1351instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEn la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinonimia, (palabras diferentes pero que tienen el mismo significado) y la polisemia, (palabras iguales pero que tienen diferentes significados), por lo tanto, estos problemas hacen que las búsquedas cambien de sentido y los usuarios obtengan información que no desean. El objetivo de este proyecto de investigación y desarrollo es comprobar el funcionamiento del modelo Latent Semantic Indexing LSI, mediante la implementación y puesta en funcionamiento de dicho modelo, en un Prototipo de Filtrado de Información Basado En Contenido.RESUMEN ABSTRACT INTRODUCCIÓN 1. GENERALIDADES 14 1.1DISEMINACIÓN SELECTIVA DE INFORMACIÓN (DSI). 14 1.2RECUPERACIÓN DE INFORMACIÓN. 15 1.3FILTRADO DE INFORMACIÓN. 16 1.4DIFERENCIAS ENTRE FILTRADO Y RECUPERACIÓN DE INFORMACIÓN. 17 2. TÉCNICAS DE FILTRADO DE INFORMACIÓN. 19 2.1FILTRADO COLABORATIVO O SOCIAL. 20 2.2FILTRADO BASADO EN EVENTOS. 22 2.3FILTRADO BASADO EN REPUTACIÓN. 24 2.4FILTRADO BASADO EN CONTENIDO. 27 3. REPRESENTACIÓN DE DOCUMENTOS. 28 3.1INDEXACIÓN AUTOMÁTICA. 28 3.2ELIMINACIÓN DE STOP-WORDS. 29 3.3MÉTODO DE STEMMING. 30 3.3.1 Algoritmo de Porter 30 3.4IDENTIFICACIÓN DE TÉRMINOS. 32 3.5CALCULO DE RELEVANCIA. 32 3.5.1Frecuencia Absoluta. 33 3.5.2Frecuencia Relativa. 34 3.5.3Frecuencia Inversa de Documentos. 34 3.5.4Calculo de Pesos. 35 4. MÉTODO DE INDEXACIÓN SEMÁNTICA LATENTE (LSI). 37 4.1SINGULAR VALUÉ DESCOMPOSICIÓN. 41 4.2MÉTODO DEL VECTOR ESPACIAL. 43 4.3EVALUACIÓN DEL MÉTODO LSI. 44 4.3.1Recall. 45 4.3.2Precisión. 45 5. IMPLEMENTACIÓN DEL MODELO LATENT SEMANTIC INDEXING LSI 47 5.1 ANÁLISIS Y DISEÑO DEL PROTOTIPO EN UML. 47 5.2 IMPLEMENTACIÓN DEL MODELO LSI. 55 5.2.1 Descripción de la Base de Datos Cistyc Fibrosis CF. 55 5.3 PRUEBAS DEL MODELO. 62 6. CONCLUSIONES. 66 7. RECOMENDACIONES PARA TRABAJOS FUTUROS 68 8. BIBLIOGRAFÍA. 69PregradoAt present, information overload is a problem that becomes more evident every day, due to the large amount of information that is published and transmitted in different formats such as text, image, multimedia, etc. Other problems that affect Internet searches are synonymy, (different words but that have the same meaning) and polysemy, (the same words but that have different meanings), therefore, these problems cause searches to change their meaning and users get information they don't want. The objective of this research and development project is to verify the operation of the Latent Semantic Indexing LSI model, through the implementation and commissioning of said model, in a Content-Based Information Filtering Prototype.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaPrototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic IndexingPrototype of content-based information filtering system using Latent Semantic IndexingIngeniero de SistemasBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/redcol/resource_type/TPSelective dissemination of informationInformation storage systemsInformation retrieval systemsAutomatic indexingSystems EngineeringInvestigationsAnalysisInformation filteringTopics of interestInformation centersDiseminación selectiva de la informaciónSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónIndización automáticaIngeniería de sistemasInvestigacionesAnálisisFiltrado de informaciónTemas de interésCentros de informaciónDuran Valero, Iván Darío, Bernal Rodríguez, Jorge Federico, Calderón Benavidez, Liliana Maritza (2004). Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNABGOOGLE inc. Perfil de la compañía, todo acerca de Google. <http:\\www.google.com.ar/intl/es/profile.html>. Consultada en abril 2004.AMPUERO Juan. Lengua Española, El léxico español. Estudio semántico. Disponible en: <http://mimosa.pntic.mec.es/~ajuan3/lengua/lex_sem.htm>. Consultada en abril 2004.ALEJANDRIA, Diseminación Selectiva de Información. Julio de 1999. Disponible en: <http://alejandria.hacer.ula.ve/DSIP.htm>. Consultada en abril 2004.IRINA, KATZAGIANNAKI Electra, PLEXOUSAKIS Dimitris. Information Dissemination Based in Semantic Relations. Grecia. Disponible en : <http://www.ics.forth.gr/isl/publications/paperlink/caiseforum-kp03.pdf>. Consultada en Marzo 2004.SANCHEZ Pereira Antonio. La diseminación selectiva de información a través de internet : propuesta de boletín electrónico de información bibliográfica especializada en economía, utilizando la base de datos CLASE. UNAM. Disponible: <http://www.dgbiblio.unam.mx/servicios/dgb/publicdgb/bole/fulltext/volII1/clase.html>. Consultada en febrero 2004.TAPASWI Murari. SDI Selective Dissemination of Information. National Information Centre For Marine Sciences. India. Disponible en: <http://ioc.unesco.org/oceanteacher/Information/Course2/sdi1.ppt>. Consultada en abril 2004.PONTE Cachafeiro, E., "Diseño de un servicio de Diseminación Selectiva de Información". Info: Congreso Internacional de Información, Vol. 5, 2004.FOLTZ Peter. Using Latent Semantic Indexing For Information Filtering. 1990. Disponible en: <http://www-psych.nmsu.edu/~pfoltz/cois/filtering-cois.html>. Consultada en febrerol 2004.VAN Setten M. Designing Personalised Information Systems. Telematica Instiuut. 2000. Disponible en: <https://doc.telin.nl/dscgi/ds.py/Get/File-12043/Sota.doc>. Consultada en abril 2004.INGWERSEN Peter. Information Retrieval Interaction. Royal School of Library and Information Science. Denmark. 2002. Disponible en: <http://www.db.dk/pi/iri/files/Ingwersen_IRI_Chapter3.pdf>. Consultada en mayo 2004.Introducción a los Sistemas de Recuperación de Información. Disponible en: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html. Consultada en enero 2004.KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre 1997.BELKIN, Nicolas y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.CALDERÓN Benavides Maritza Liliana, GONZÁLEZ Caro Cristina Nayesca. Prototipo De Sistema De Filtrado De Información Para Dar Apoyo A La Diseminación Selectiva En El Centro De Información Técnica Del Instituto Colombiano De Petróleos. Universidad Autónoma de Bucaramanga. I.S 1589. 2002.HERLOCKER J., KONSTAN J., BORCHERS A., and RIEDL J., An algorithmic framework for performing collaborative filtering. In SIGIR´99: Proceedings of the 22 Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999.RESNICK, Paul, NEOPHYTOS, Iacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filtering of netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175-186. ACM, Octubre 1994. Disponible en: <http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html> Consultada en octubre 2003.DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.GILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Libraries, pp. 89-98, 1998.KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. AI Magazine. Summer 1997. AAAI Press.KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997.KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997.MEADOW, Charles T. Text Information Retrieval Systems. Academic Press. 1992.VAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45p.FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.102-130.Frakes William, Baeza Yates Ricardo. Information Retrieval Data Strucures & Algorithms. Prentice Hall. 1992.YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellon University, 1997.SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).SALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).ROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.16-24SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p.KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997. 349p.Dumais Susan .LSI meets TREC: A status report. The First Text REtrieval Conference (TREC1), National Institute of Standards and Technology Special Publication 500-207, pp. 137-152. Disponible en: <http://lsi.argreenhouse.com/lsi/LSIpapers.html>. Consultada en mayo 2004.YU clara, CUADRADO Jhon, CEGLOWSKY Maciej, PAYNE J. Scout. Patterns in Unstructured Data Discovery, Aggregation, and Visualization. 2002. Disponible en: <http://javelina.cet.middlebury.edu/lsa/out/lsa_definition.htm>. Consultada en febrero 2004.FOLTZ Peter, DUMAIS Susan. Personalized Information Delivery: An Analysis of Information Filtering Methods. Communications of the ACM, 35(12), 51-60. 1992. Disponible en: < http://www-psych.nmsu.edu/~pfoltz/cacm/cacm.html>. Consultada en abril 2004.DOMINGUEZ Javier, ALIAS Pujol Frances, SOCORO Joan. Extracción de tópicos independientes para la Clasificación de textos. Disponible en: <http://web.salleurl.edu/~xavis/cat/ursi2003_xsd.pdf.> Consultada en enero 2004.SANTO Orcero David. La matriz fundamental y la matriz esencial. Concepto y aplicaciones. Mayo 2002. Disponible en: <http://www.orcero.org/irbis/fundamental/node5.html>. Consultada en abril 2004.DEERWESTER Scott, DUMAIS Susan T., FURNAS George W., LANDAUER Thomas K, HARSHMAN Richard. Indexing by Latent Semantic Analysis.1990. Disponible en: <http://lsi.research.telcordia.com/lsi/papers/JASIS90.pdf.> Consultada en septiembre 2003.NAKOS George, JOYNER David. Álgebra lineal con aplicaciones. Edi Internacional Thomson Editores. 1998.BERNSTEIN Abraham, CLEARWATER Scott, PROVOST Foster. The Relational Vector-space Model and Industry Classification. Disponible en: < http://kdl.cs.umass.edu/srl2003_upload/files/bernstein-paper.pdf.> Consultada en enero 2004.LONGZHUANG Li, YI Shang, and WEI Zhang. Improvement of HITS-based Algorithms on Web Documents. ACM 1-58113-449-5/02/0005 May 2002. Honolulu. Disponible en: <http://www2002.org/CDROM/refereed/643/node5.html>. Consultada en abril 2004.Unit RR, Part B1: Basic Vector Space Model. Disponible en: <http://ei.cs.vt.edu/~cs5604/cs5604cnRR/RR-b1.html>. Consultada en noviembre 2003.BAEZA yates, Ricardo Y RIBEIRO NETO, Moder Information Retrieval . Edi. Addison – Wesley. 1999. Pág 76 y ss.BAEZA Yates Ricardo and RIBEIRO Neto Berthier. Modern Information Retrieval. Cystic Fibrosis Reference Collection. Disponible en: <http://sunsite.dcc.uchile.cl/irbook/cfc.html>. Consultada en abril 2004.ORIGINAL2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdfTesisapplication/pdf1838770https://repository.unab.edu.co/bitstream/20.500.12749/1351/1/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf26706ce088c3fabbb32484fadba02939MD51open access2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zip2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zipAnexosapplication/octet-stream2537407https://repository.unab.edu.co/bitstream/20.500.12749/1351/2/2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zipbda66afe0e966595d6d35fcabe763e06MD52open accessTHUMBNAIL2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpg2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpgIM Thumbnailimage/jpeg5026https://repository.unab.edu.co/bitstream/20.500.12749/1351/3/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpg71dc29c2020fbb98d039837c3a1dd0a1MD53open access20.500.12749/1351oai:repository.unab.edu.co:20.500.12749/13512024-01-21 13:14:12.675open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co