Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing
En la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinoni...
- Autores:
-
Duran Valero, Iván Darío
Bernal Rodríguez, Jorge Federico
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2004
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/1351
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/1351
- Palabra clave:
- Selective dissemination of information
Information storage systems
Information retrieval systems
Automatic indexing
Systems Engineering
Investigations
Analysis
Information filtering
Topics of interest
Information centers
Diseminación selectiva de la información
Sistemas de almacenamiento de información
Sistemas de recuperación de información
Indización automática
Ingeniería de sistemas
Investigaciones
Análisis
Filtrado de información
Temas de interés
Centros de información
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id |
UNAB2_a6fc9f94db3c44769969b86f15e5cb74 |
---|---|
oai_identifier_str |
oai:repository.unab.edu.co:20.500.12749/1351 |
network_acronym_str |
UNAB2 |
network_name_str |
Repositorio UNAB |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing |
dc.title.translated.eng.fl_str_mv |
Prototype of content-based information filtering system using Latent Semantic Indexing |
title |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing |
spellingShingle |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing Selective dissemination of information Information storage systems Information retrieval systems Automatic indexing Systems Engineering Investigations Analysis Information filtering Topics of interest Information centers Diseminación selectiva de la información Sistemas de almacenamiento de información Sistemas de recuperación de información Indización automática Ingeniería de sistemas Investigaciones Análisis Filtrado de información Temas de interés Centros de información |
title_short |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing |
title_full |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing |
title_fullStr |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing |
title_full_unstemmed |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing |
title_sort |
Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing |
dc.creator.fl_str_mv |
Duran Valero, Iván Darío Bernal Rodríguez, Jorge Federico |
dc.contributor.advisor.spa.fl_str_mv |
Calderón Benavides, Maritza Liliana |
dc.contributor.author.spa.fl_str_mv |
Duran Valero, Iván Darío Bernal Rodríguez, Jorge Federico |
dc.contributor.cvlac.spa.fl_str_mv |
Calderón Benavides, Maritza Liliana [0000068900] |
dc.contributor.googlescholar.spa.fl_str_mv |
Calderón Benavides, Maritza Liliana [XihGBWoAAAAJ] |
dc.contributor.orcid.none.fl_str_mv |
Calderón Benavides, Maritza Liliana [0000-0001-8658-9036] |
dc.contributor.scopus.none.fl_str_mv |
Calderón Benavides, Maritza Liliana [15043558200] |
dc.contributor.researchgate.none.fl_str_mv |
Calderón Benavides, Maritza Liliana [Liliana_Calderon-Benavides] |
dc.contributor.researchgroup.spa.fl_str_mv |
Grupo de Investigación Tecnologías de Información - GTI Grupo de Investigaciones Clínicas |
dc.contributor.apolounab.none.fl_str_mv |
Calderón Benavides, Maritza Liliana [maritza-liliana-calderón-benavides] |
dc.contributor.linkedin.none.fl_str_mv |
Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84] Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84] |
dc.subject.keywords.eng.fl_str_mv |
Selective dissemination of information Information storage systems Information retrieval systems Automatic indexing Systems Engineering Investigations Analysis Information filtering Topics of interest Information centers |
topic |
Selective dissemination of information Information storage systems Information retrieval systems Automatic indexing Systems Engineering Investigations Analysis Information filtering Topics of interest Information centers Diseminación selectiva de la información Sistemas de almacenamiento de información Sistemas de recuperación de información Indización automática Ingeniería de sistemas Investigaciones Análisis Filtrado de información Temas de interés Centros de información |
dc.subject.lemb.spa.fl_str_mv |
Diseminación selectiva de la información Sistemas de almacenamiento de información Sistemas de recuperación de información Indización automática Ingeniería de sistemas Investigaciones Análisis |
dc.subject.proposal.spa.fl_str_mv |
Filtrado de información Temas de interés Centros de información |
description |
En la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinonimia, (palabras diferentes pero que tienen el mismo significado) y la polisemia, (palabras iguales pero que tienen diferentes significados), por lo tanto, estos problemas hacen que las búsquedas cambien de sentido y los usuarios obtengan información que no desean. El objetivo de este proyecto de investigación y desarrollo es comprobar el funcionamiento del modelo Latent Semantic Indexing LSI, mediante la implementación y puesta en funcionamiento de dicho modelo, en un Prototipo de Filtrado de Información Basado En Contenido. |
publishDate |
2004 |
dc.date.issued.none.fl_str_mv |
2004-07 |
dc.date.accessioned.none.fl_str_mv |
2020-06-26T17:56:30Z |
dc.date.available.none.fl_str_mv |
2020-06-26T17:56:30Z |
dc.type.driver.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.local.spa.fl_str_mv |
Trabajo de Grado |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.redcol.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12749/1351 |
dc.identifier.instname.spa.fl_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB |
dc.identifier.reponame.spa.fl_str_mv |
reponame:Repositorio Institucional UNAB |
url |
http://hdl.handle.net/20.500.12749/1351 |
identifier_str_mv |
instname:Universidad Autónoma de Bucaramanga - UNAB reponame:Repositorio Institucional UNAB |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.references.spa.fl_str_mv |
Duran Valero, Iván Darío, Bernal Rodríguez, Jorge Federico, Calderón Benavidez, Liliana Maritza (2004). Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB GOOGLE inc. Perfil de la compañía, todo acerca de Google. <http:\\www.google.com.ar/intl/es/profile.html>. Consultada en abril 2004. |
dc.relation.references.none.fl_str_mv |
AMPUERO Juan. Lengua Española, El léxico español. Estudio semántico. Disponible en: <http://mimosa.pntic.mec.es/~ajuan3/lengua/lex_sem.htm>. Consultada en abril 2004. ALEJANDRIA, Diseminación Selectiva de Información. Julio de 1999. Disponible en: <http://alejandria.hacer.ula.ve/DSIP.htm>. Consultada en abril 2004. IRINA, KATZAGIANNAKI Electra, PLEXOUSAKIS Dimitris. Information Dissemination Based in Semantic Relations. Grecia. Disponible en : <http://www.ics.forth.gr/isl/publications/paperlink/caiseforum-kp03.pdf>. Consultada en Marzo 2004. SANCHEZ Pereira Antonio. La diseminación selectiva de información a través de internet : propuesta de boletín electrónico de información bibliográfica especializada en economía, utilizando la base de datos CLASE. UNAM. Disponible: <http://www.dgbiblio.unam.mx/servicios/dgb/publicdgb/bole/fulltext/volII1/clase.html>. Consultada en febrero 2004. TAPASWI Murari. SDI Selective Dissemination of Information. National Information Centre For Marine Sciences. India. Disponible en: <http://ioc.unesco.org/oceanteacher/Information/Course2/sdi1.ppt>. Consultada en abril 2004. PONTE Cachafeiro, E., "Diseño de un servicio de Diseminación Selectiva de Información". Info: Congreso Internacional de Información, Vol. 5, 2004. FOLTZ Peter. Using Latent Semantic Indexing For Information Filtering. 1990. Disponible en: <http://www-psych.nmsu.edu/~pfoltz/cois/filtering-cois.html>. Consultada en febrerol 2004. VAN Setten M. Designing Personalised Information Systems. Telematica Instiuut. 2000. Disponible en: <https://doc.telin.nl/dscgi/ds.py/Get/File-12043/Sota.doc>. Consultada en abril 2004. INGWERSEN Peter. Information Retrieval Interaction. Royal School of Library and Information Science. Denmark. 2002. Disponible en: <http://www.db.dk/pi/iri/files/Ingwersen_IRI_Chapter3.pdf>. Consultada en mayo 2004. Introducción a los Sistemas de Recuperación de Información. Disponible en: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html. Consultada en enero 2004. KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre 1997. BELKIN, Nicolas y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992. CALDERÓN Benavides Maritza Liliana, GONZÁLEZ Caro Cristina Nayesca. Prototipo De Sistema De Filtrado De Información Para Dar Apoyo A La Diseminación Selectiva En El Centro De Información Técnica Del Instituto Colombiano De Petróleos. Universidad Autónoma de Bucaramanga. I.S 1589. 2002. HERLOCKER J., KONSTAN J., BORCHERS A., and RIEDL J., An algorithmic framework for performing collaborative filtering. In SIGIR´99: Proceedings of the 22 Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999. RESNICK, Paul, NEOPHYTOS, Iacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filtering of netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175-186. ACM, Octubre 1994. Disponible en: <http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html> Consultada en octubre 2003. DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000. PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98. GILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Libraries, pp. 89-98, 1998. KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. AI Magazine. Summer 1997. AAAI Press. KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997. KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997. MEADOW, Charles T. Text Information Retrieval Systems. Academic Press. 1992. VAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45p. FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.102-130. Frakes William, Baeza Yates Ricardo. Information Retrieval Data Strucures & Algorithms. Prentice Hall. 1992. YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellon University, 1997. SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report). SALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report). ROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.16-24 SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p. KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997. 349p. Dumais Susan .LSI meets TREC: A status report. The First Text REtrieval Conference (TREC1), National Institute of Standards and Technology Special Publication 500-207, pp. 137-152. Disponible en: <http://lsi.argreenhouse.com/lsi/LSIpapers.html>. Consultada en mayo 2004. YU clara, CUADRADO Jhon, CEGLOWSKY Maciej, PAYNE J. Scout. Patterns in Unstructured Data Discovery, Aggregation, and Visualization. 2002. Disponible en: <http://javelina.cet.middlebury.edu/lsa/out/lsa_definition.htm>. Consultada en febrero 2004. FOLTZ Peter, DUMAIS Susan. Personalized Information Delivery: An Analysis of Information Filtering Methods. Communications of the ACM, 35(12), 51-60. 1992. Disponible en: < http://www-psych.nmsu.edu/~pfoltz/cacm/cacm.html>. Consultada en abril 2004. DOMINGUEZ Javier, ALIAS Pujol Frances, SOCORO Joan. Extracción de tópicos independientes para la Clasificación de textos. Disponible en: <http://web.salleurl.edu/~xavis/cat/ursi2003_xsd.pdf.> Consultada en enero 2004. SANTO Orcero David. La matriz fundamental y la matriz esencial. Concepto y aplicaciones. Mayo 2002. Disponible en: <http://www.orcero.org/irbis/fundamental/node5.html>. Consultada en abril 2004. DEERWESTER Scott, DUMAIS Susan T., FURNAS George W., LANDAUER Thomas K, HARSHMAN Richard. Indexing by Latent Semantic Analysis.1990. Disponible en: <http://lsi.research.telcordia.com/lsi/papers/JASIS90.pdf.> Consultada en septiembre 2003. NAKOS George, JOYNER David. Álgebra lineal con aplicaciones. Edi Internacional Thomson Editores. 1998. BERNSTEIN Abraham, CLEARWATER Scott, PROVOST Foster. The Relational Vector-space Model and Industry Classification. Disponible en: < http://kdl.cs.umass.edu/srl2003_upload/files/bernstein-paper.pdf.> Consultada en enero 2004. LONGZHUANG Li, YI Shang, and WEI Zhang. Improvement of HITS-based Algorithms on Web Documents. ACM 1-58113-449-5/02/0005 May 2002. Honolulu. Disponible en: <http://www2002.org/CDROM/refereed/643/node5.html>. Consultada en abril 2004. Unit RR, Part B1: Basic Vector Space Model. Disponible en: <http://ei.cs.vt.edu/~cs5604/cs5604cnRR/RR-b1.html>. Consultada en noviembre 2003. BAEZA yates, Ricardo Y RIBEIRO NETO, Moder Information Retrieval . Edi. Addison – Wesley. 1999. Pág 76 y ss. BAEZA Yates Ricardo and RIBEIRO Neto Berthier. Modern Information Retrieval. Cystic Fibrosis Reference Collection. Disponible en: <http://sunsite.dcc.uchile.cl/irbook/cfc.html>. Consultada en abril 2004. |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.local.spa.fl_str_mv |
Abierto (Texto Completo) |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ Abierto (Texto Completo) http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 2.5 Colombia |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.coverage.spa.fl_str_mv |
Bucaramanga (Colombia) |
dc.coverage.campus.spa.fl_str_mv |
UNAB Campus Bucaramanga |
dc.publisher.grantor.spa.fl_str_mv |
Universidad Autónoma de Bucaramanga UNAB |
dc.publisher.faculty.spa.fl_str_mv |
Facultad Ingeniería |
dc.publisher.program.spa.fl_str_mv |
Pregrado Ingeniería de Sistemas |
institution |
Universidad Autónoma de Bucaramanga - UNAB |
bitstream.url.fl_str_mv |
https://repository.unab.edu.co/bitstream/20.500.12749/1351/1/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf https://repository.unab.edu.co/bitstream/20.500.12749/1351/2/2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zip https://repository.unab.edu.co/bitstream/20.500.12749/1351/3/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpg |
bitstream.checksum.fl_str_mv |
26706ce088c3fabbb32484fadba02939 bda66afe0e966595d6d35fcabe763e06 71dc29c2020fbb98d039837c3a1dd0a1 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB |
repository.mail.fl_str_mv |
repositorio@unab.edu.co |
_version_ |
1814278153710862336 |
spelling |
Calderón Benavides, Maritza Lilianaa478af73-8b10-4632-aff9-2b9977a8b4e2-1Duran Valero, Iván Darío310e52e2-88b1-42c8-bbf3-ddfb63a5fef9-1Bernal Rodríguez, Jorge Federico25fd8711-819c-4233-b2a4-9424fd450330-1Calderón Benavides, Maritza Liliana [0000068900]Calderón Benavides, Maritza Liliana [XihGBWoAAAAJ]Calderón Benavides, Maritza Liliana [0000-0001-8658-9036]Calderón Benavides, Maritza Liliana [15043558200]Calderón Benavides, Maritza Liliana [Liliana_Calderon-Benavides]Grupo de Investigación Tecnologías de Información - GTIGrupo de Investigaciones ClínicasCalderón Benavides, Maritza Liliana [maritza-liliana-calderón-benavides]Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]Calderón Benavides, Maritza Liliana [liliana-calderón-benavides-2031a84]2020-06-26T17:56:30Z2020-06-26T17:56:30Z2004-07http://hdl.handle.net/20.500.12749/1351instname:Universidad Autónoma de Bucaramanga - UNABreponame:Repositorio Institucional UNABEn la actualidad la sobrecarga de información es un problema que se hace más evidente cada día, esto debido a la gran cantidad de información que se publica y transmite en los diferentes formatos como texto, imagen, multimedia, etc. Otros problemas que afectan las búsquedas en Internet son la sinonimia, (palabras diferentes pero que tienen el mismo significado) y la polisemia, (palabras iguales pero que tienen diferentes significados), por lo tanto, estos problemas hacen que las búsquedas cambien de sentido y los usuarios obtengan información que no desean. El objetivo de este proyecto de investigación y desarrollo es comprobar el funcionamiento del modelo Latent Semantic Indexing LSI, mediante la implementación y puesta en funcionamiento de dicho modelo, en un Prototipo de Filtrado de Información Basado En Contenido.RESUMEN ABSTRACT INTRODUCCIÓN 1. GENERALIDADES 14 1.1DISEMINACIÓN SELECTIVA DE INFORMACIÓN (DSI). 14 1.2RECUPERACIÓN DE INFORMACIÓN. 15 1.3FILTRADO DE INFORMACIÓN. 16 1.4DIFERENCIAS ENTRE FILTRADO Y RECUPERACIÓN DE INFORMACIÓN. 17 2. TÉCNICAS DE FILTRADO DE INFORMACIÓN. 19 2.1FILTRADO COLABORATIVO O SOCIAL. 20 2.2FILTRADO BASADO EN EVENTOS. 22 2.3FILTRADO BASADO EN REPUTACIÓN. 24 2.4FILTRADO BASADO EN CONTENIDO. 27 3. REPRESENTACIÓN DE DOCUMENTOS. 28 3.1INDEXACIÓN AUTOMÁTICA. 28 3.2ELIMINACIÓN DE STOP-WORDS. 29 3.3MÉTODO DE STEMMING. 30 3.3.1 Algoritmo de Porter 30 3.4IDENTIFICACIÓN DE TÉRMINOS. 32 3.5CALCULO DE RELEVANCIA. 32 3.5.1Frecuencia Absoluta. 33 3.5.2Frecuencia Relativa. 34 3.5.3Frecuencia Inversa de Documentos. 34 3.5.4Calculo de Pesos. 35 4. MÉTODO DE INDEXACIÓN SEMÁNTICA LATENTE (LSI). 37 4.1SINGULAR VALUÉ DESCOMPOSICIÓN. 41 4.2MÉTODO DEL VECTOR ESPACIAL. 43 4.3EVALUACIÓN DEL MÉTODO LSI. 44 4.3.1Recall. 45 4.3.2Precisión. 45 5. IMPLEMENTACIÓN DEL MODELO LATENT SEMANTIC INDEXING LSI 47 5.1 ANÁLISIS Y DISEÑO DEL PROTOTIPO EN UML. 47 5.2 IMPLEMENTACIÓN DEL MODELO LSI. 55 5.2.1 Descripción de la Base de Datos Cistyc Fibrosis CF. 55 5.3 PRUEBAS DEL MODELO. 62 6. CONCLUSIONES. 66 7. RECOMENDACIONES PARA TRABAJOS FUTUROS 68 8. BIBLIOGRAFÍA. 69PregradoAt present, information overload is a problem that becomes more evident every day, due to the large amount of information that is published and transmitted in different formats such as text, image, multimedia, etc. Other problems that affect Internet searches are synonymy, (different words but that have the same meaning) and polysemy, (the same words but that have different meanings), therefore, these problems cause searches to change their meaning and users get information they don't want. The objective of this research and development project is to verify the operation of the Latent Semantic Indexing LSI model, through the implementation and commissioning of said model, in a Content-Based Information Filtering Prototype.Modalidad Presencialapplication/pdfspahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial-SinDerivadas 2.5 ColombiaPrototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic IndexingPrototype of content-based information filtering system using Latent Semantic IndexingIngeniero de SistemasBucaramanga (Colombia)UNAB Campus BucaramangaUniversidad Autónoma de Bucaramanga UNABFacultad IngenieríaPregrado Ingeniería de Sistemasinfo:eu-repo/semantics/bachelorThesisTrabajo de Gradohttp://purl.org/coar/resource_type/c_7a1fhttp://purl.org/redcol/resource_type/TPSelective dissemination of informationInformation storage systemsInformation retrieval systemsAutomatic indexingSystems EngineeringInvestigationsAnalysisInformation filteringTopics of interestInformation centersDiseminación selectiva de la informaciónSistemas de almacenamiento de informaciónSistemas de recuperación de informaciónIndización automáticaIngeniería de sistemasInvestigacionesAnálisisFiltrado de informaciónTemas de interésCentros de informaciónDuran Valero, Iván Darío, Bernal Rodríguez, Jorge Federico, Calderón Benavidez, Liliana Maritza (2004). Prototipo de sistema de filtrado de información basado en contenido utilizando Latent Semantic Indexing. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNABGOOGLE inc. Perfil de la compañía, todo acerca de Google. <http:\\www.google.com.ar/intl/es/profile.html>. Consultada en abril 2004.AMPUERO Juan. Lengua Española, El léxico español. Estudio semántico. Disponible en: <http://mimosa.pntic.mec.es/~ajuan3/lengua/lex_sem.htm>. Consultada en abril 2004.ALEJANDRIA, Diseminación Selectiva de Información. Julio de 1999. Disponible en: <http://alejandria.hacer.ula.ve/DSIP.htm>. Consultada en abril 2004.IRINA, KATZAGIANNAKI Electra, PLEXOUSAKIS Dimitris. Information Dissemination Based in Semantic Relations. Grecia. Disponible en : <http://www.ics.forth.gr/isl/publications/paperlink/caiseforum-kp03.pdf>. Consultada en Marzo 2004.SANCHEZ Pereira Antonio. La diseminación selectiva de información a través de internet : propuesta de boletín electrónico de información bibliográfica especializada en economía, utilizando la base de datos CLASE. UNAM. Disponible: <http://www.dgbiblio.unam.mx/servicios/dgb/publicdgb/bole/fulltext/volII1/clase.html>. Consultada en febrero 2004.TAPASWI Murari. SDI Selective Dissemination of Information. National Information Centre For Marine Sciences. India. Disponible en: <http://ioc.unesco.org/oceanteacher/Information/Course2/sdi1.ppt>. Consultada en abril 2004.PONTE Cachafeiro, E., "Diseño de un servicio de Diseminación Selectiva de Información". Info: Congreso Internacional de Información, Vol. 5, 2004.FOLTZ Peter. Using Latent Semantic Indexing For Information Filtering. 1990. Disponible en: <http://www-psych.nmsu.edu/~pfoltz/cois/filtering-cois.html>. Consultada en febrerol 2004.VAN Setten M. Designing Personalised Information Systems. Telematica Instiuut. 2000. Disponible en: <https://doc.telin.nl/dscgi/ds.py/Get/File-12043/Sota.doc>. Consultada en abril 2004.INGWERSEN Peter. Information Retrieval Interaction. Royal School of Library and Information Science. Denmark. 2002. Disponible en: <http://www.db.dk/pi/iri/files/Ingwersen_IRI_Chapter3.pdf>. Consultada en mayo 2004.Introducción a los Sistemas de Recuperación de Información. Disponible en: http://www.um.es/gtiweb/fjmm/sarisite/tema1.html. Consultada en enero 2004.KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre 1997.BELKIN, Nicolas y BRUCE CROFT, W. Information Filtering and Information Retrieval: two sides of the same coin?. Comunications of the ACM. Vol 35. No. 12. Diciembre, 1992.CALDERÓN Benavides Maritza Liliana, GONZÁLEZ Caro Cristina Nayesca. Prototipo De Sistema De Filtrado De Información Para Dar Apoyo A La Diseminación Selectiva En El Centro De Información Técnica Del Instituto Colombiano De Petróleos. Universidad Autónoma de Bucaramanga. I.S 1589. 2002.HERLOCKER J., KONSTAN J., BORCHERS A., and RIEDL J., An algorithmic framework for performing collaborative filtering. In SIGIR´99: Proceedings of the 22 Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1999.RESNICK, Paul, NEOPHYTOS, Iacovou, SUCHAK, Mitesh, BERGSTROM, Peter, and RIELD, John. GroupLens: An open architecture for collaborative filtering of netnews. En FARUTA, Richard K. y NEWIRTH, Christine M. Proceedings of the ACM 1994 Conference on Computer Supported Cooperative Work. Páginas 175-186. ACM, Octubre 1994. Disponible en: <http://www.cs.umn.edu/Research/GroupLens/cscwpaper/paper.html> Consultada en octubre 2003.DELGADO, J.A. Agent - Based Information Filtering and Recommender Systems on the Internet. PhD. Thesis, Nagoya Institute of Technology. Marzo 2000.PERKOWITZ, M. y ETZIONI, O. Adaptive Web Sites: Automatically Synthesizing Web Pages. En Proceedings of the American National Conference on Artificial Intelligence AAAI-98.GILES, L., BOLLACKER, K. y LAWRENCE, S. CiteSeer An Automatic Citation Indexing System. En Proceedings of the 3rd ACM Conference on Digital Libraries, pp. 89-98, 1998.KAUTZ, H., SELMAN, B. y SHAH, M. The Hidden Web. AI Magazine. Summer 1997. AAAI Press.KLEINBERG, J. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. To appear in Journal of the ACM. 1999. Also appears as IBM Research Report RJ 10076, May 1997.KJERSTI, Aas. A Survey on Personalized Information Filtering Systems for the World Wide Web. Norwegian Computing Center. Oslo. Diciembre. 1997.MEADOW, Charles T. Text Information Retrieval Systems. Academic Press. 1992.VAN RIJSBERGEN, C. J. Information retrieval. Butterworths, 1979. 45p.FOX, Christopher. Lexical analysis and stoplists. En: FRAKES, William B. y BAEZA Yates, Ricardo A. Information Retrieval: Data Structures & Algorithms. Upper Saddle River, New Jersey: Prentice Hall PTR, 1992. p.102-130.Frakes William, Baeza Yates Ricardo. Information Retrieval Data Strucures & Algorithms. Prentice Hall. 1992.YANG, Yiming y PEDERSEN, Jan O. A comparative study on features selection in text categorization. School of Computer Science, Carnegie Mellon University, 1997.SALTON, Gerard y BUCKLEY, Chris. Improving Retrieval Performance by Relevance Feedback. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).SALTON, Gerard; BUCKLEY, Chris. Term weighting approaches in automatic text retrieval. Ithaca, New York. Department of computer science, Cornell University, 1987. (Technical Report).ROBERTSON, S. E.; WALKER, S. On relevance weights with little relevance information. En Annual International ACM-SIGIR Conference on research and Development in Information Retrieval (SIGIR'97), 1997, Philadelphia, USA. Proceedings. New York ACM Press, 1997. p.16-24SALTON, Gerard. MACGILL, Michael J. Introduction to Modern Information Retrieval. New York: McGRAW-Hill, 1983. 448p.KORFHAGE, Robert R. Information Retrieval and Storage. New York: John Wiley & Sons, 1997. 349p.Dumais Susan .LSI meets TREC: A status report. The First Text REtrieval Conference (TREC1), National Institute of Standards and Technology Special Publication 500-207, pp. 137-152. Disponible en: <http://lsi.argreenhouse.com/lsi/LSIpapers.html>. Consultada en mayo 2004.YU clara, CUADRADO Jhon, CEGLOWSKY Maciej, PAYNE J. Scout. Patterns in Unstructured Data Discovery, Aggregation, and Visualization. 2002. Disponible en: <http://javelina.cet.middlebury.edu/lsa/out/lsa_definition.htm>. Consultada en febrero 2004.FOLTZ Peter, DUMAIS Susan. Personalized Information Delivery: An Analysis of Information Filtering Methods. Communications of the ACM, 35(12), 51-60. 1992. Disponible en: < http://www-psych.nmsu.edu/~pfoltz/cacm/cacm.html>. Consultada en abril 2004.DOMINGUEZ Javier, ALIAS Pujol Frances, SOCORO Joan. Extracción de tópicos independientes para la Clasificación de textos. Disponible en: <http://web.salleurl.edu/~xavis/cat/ursi2003_xsd.pdf.> Consultada en enero 2004.SANTO Orcero David. La matriz fundamental y la matriz esencial. Concepto y aplicaciones. Mayo 2002. Disponible en: <http://www.orcero.org/irbis/fundamental/node5.html>. Consultada en abril 2004.DEERWESTER Scott, DUMAIS Susan T., FURNAS George W., LANDAUER Thomas K, HARSHMAN Richard. Indexing by Latent Semantic Analysis.1990. Disponible en: <http://lsi.research.telcordia.com/lsi/papers/JASIS90.pdf.> Consultada en septiembre 2003.NAKOS George, JOYNER David. Álgebra lineal con aplicaciones. Edi Internacional Thomson Editores. 1998.BERNSTEIN Abraham, CLEARWATER Scott, PROVOST Foster. The Relational Vector-space Model and Industry Classification. Disponible en: < http://kdl.cs.umass.edu/srl2003_upload/files/bernstein-paper.pdf.> Consultada en enero 2004.LONGZHUANG Li, YI Shang, and WEI Zhang. Improvement of HITS-based Algorithms on Web Documents. ACM 1-58113-449-5/02/0005 May 2002. Honolulu. Disponible en: <http://www2002.org/CDROM/refereed/643/node5.html>. Consultada en abril 2004.Unit RR, Part B1: Basic Vector Space Model. Disponible en: <http://ei.cs.vt.edu/~cs5604/cs5604cnRR/RR-b1.html>. Consultada en noviembre 2003.BAEZA yates, Ricardo Y RIBEIRO NETO, Moder Information Retrieval . Edi. Addison – Wesley. 1999. Pág 76 y ss.BAEZA Yates Ricardo and RIBEIRO Neto Berthier. Modern Information Retrieval. Cystic Fibrosis Reference Collection. Disponible en: <http://sunsite.dcc.uchile.cl/irbook/cfc.html>. Consultada en abril 2004.ORIGINAL2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdfTesisapplication/pdf1838770https://repository.unab.edu.co/bitstream/20.500.12749/1351/1/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf26706ce088c3fabbb32484fadba02939MD51open access2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zip2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zipAnexosapplication/octet-stream2537407https://repository.unab.edu.co/bitstream/20.500.12749/1351/2/2004_Anexos_Bernal_Rodriguez_Jorge_Federico.zipbda66afe0e966595d6d35fcabe763e06MD52open accessTHUMBNAIL2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpg2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpgIM Thumbnailimage/jpeg5026https://repository.unab.edu.co/bitstream/20.500.12749/1351/3/2004_Tesis_Bernal_Rodriguez_Jorge_Federico.pdf.jpg71dc29c2020fbb98d039837c3a1dd0a1MD53open access20.500.12749/1351oai:repository.unab.edu.co:20.500.12749/13512024-01-21 13:14:12.675open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.co |