S3niffer: A text description-based service search system

In this research, we address the problem of retrieving services which fulfil users' need expressed in query in free text. Our goal is to cope the term mismatch problems which affect the effectiveness of service retrieval models applied in prior research on text descriptions-based service retrie...

Full description

Autores:
Caicedo Castro, Isaac Bernardo
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2015
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/54391
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/54391
http://bdigital.unal.edu.co/49323/
Palabra clave:
0 Generalidades / Computer science, information and general works
02 Bibliotecología y ciencias de la información / Library and information sciences
62 Ingeniería y operaciones afines / Engineering
Extracción de información
Factorización de matrices
Descubrimiento de servicios basados en IR
Expansión de consultas
Tesauros de co-ocurrencias
Information retrieval
Matrix factorisation
IR-based service discovery
Query expansion
Co-occurrence thesaurus
La recherche d'information
Factorisation de matrices
Découverte de service basé sur des techniques de RI
Expansion de requêtes
thésaurus co-occurrence
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_8a11ed37f97c581a77929e164bc81418
oai_identifier_str oai:repositorio.unal.edu.co:unal/54391
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv S3niffer: A text description-based service search system
title S3niffer: A text description-based service search system
spellingShingle S3niffer: A text description-based service search system
0 Generalidades / Computer science, information and general works
02 Bibliotecología y ciencias de la información / Library and information sciences
62 Ingeniería y operaciones afines / Engineering
Extracción de información
Factorización de matrices
Descubrimiento de servicios basados en IR
Expansión de consultas
Tesauros de co-ocurrencias
Information retrieval
Matrix factorisation
IR-based service discovery
Query expansion
Co-occurrence thesaurus
La recherche d'information
Factorisation de matrices
Découverte de service basé sur des techniques de RI
Expansion de requêtes
thésaurus co-occurrence
title_short S3niffer: A text description-based service search system
title_full S3niffer: A text description-based service search system
title_fullStr S3niffer: A text description-based service search system
title_full_unstemmed S3niffer: A text description-based service search system
title_sort S3niffer: A text description-based service search system
dc.creator.fl_str_mv Caicedo Castro, Isaac Bernardo
dc.contributor.author.spa.fl_str_mv Caicedo Castro, Isaac Bernardo
dc.contributor.spa.fl_str_mv Fauvet, Marie-Christine
Duarte Amaya, Helga
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
02 Bibliotecología y ciencias de la información / Library and information sciences
62 Ingeniería y operaciones afines / Engineering
topic 0 Generalidades / Computer science, information and general works
02 Bibliotecología y ciencias de la información / Library and information sciences
62 Ingeniería y operaciones afines / Engineering
Extracción de información
Factorización de matrices
Descubrimiento de servicios basados en IR
Expansión de consultas
Tesauros de co-ocurrencias
Information retrieval
Matrix factorisation
IR-based service discovery
Query expansion
Co-occurrence thesaurus
La recherche d'information
Factorisation de matrices
Découverte de service basé sur des techniques de RI
Expansion de requêtes
thésaurus co-occurrence
dc.subject.proposal.spa.fl_str_mv Extracción de información
Factorización de matrices
Descubrimiento de servicios basados en IR
Expansión de consultas
Tesauros de co-ocurrencias
Information retrieval
Matrix factorisation
IR-based service discovery
Query expansion
Co-occurrence thesaurus
La recherche d'information
Factorisation de matrices
Découverte de service basé sur des techniques de RI
Expansion de requêtes
thésaurus co-occurrence
description In this research, we address the problem of retrieving services which fulfil users' need expressed in query in free text. Our goal is to cope the term mismatch problems which affect the effectiveness of service retrieval models applied in prior research on text descriptions-based service retrieval models. These problems are caused due to service descriptions are brief. Service providers use few terms to describe desired services, thereby, when these descriptions are different to the sentences in queries, term mismatch problems decrease the effectiveness in classical models which depend on the observable text features instead of the latent semantic features of the text. We have applied a family of Information Retrieval (IR) models for the purpose of contributing to increase the effectiveness acquired with the models applied in prior research on service retrieval. Besides, we have conducted systematic experiments to compare our family of IR models with those used in the state-of-the-art in service discovery. From the outcomes of the experiments, we conclude that our model based on query expansion via a co-occurrence thesaurus outperforms the effectiveness of all the models studied in this research. Therefore, we have implemented this model in S3niffer, which is a text description-based service search engine.
publishDate 2015
dc.date.issued.spa.fl_str_mv 2015
dc.date.accessioned.spa.fl_str_mv 2019-06-29T20:19:51Z
dc.date.available.spa.fl_str_mv 2019-06-29T20:19:51Z
dc.type.spa.fl_str_mv Trabajo de grado - Doctorado
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_db06
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TD
format http://purl.org/coar/resource_type/c_db06
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/54391
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/49323/
url https://repositorio.unal.edu.co/handle/unal/54391
http://bdigital.unal.edu.co/49323/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Ingeniería de Sistemas
Ingeniería de Sistemas
dc.relation.references.spa.fl_str_mv Caicedo Castro, Isaac Bernardo (2015) S3niffer: A text description-based service search system. Doctorado thesis, Universidad Nacional de Colombia : Universidad de Grenoble Alpes.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/54391/1/02300533.2015.pdf
https://repositorio.unal.edu.co/bitstream/unal/54391/2/02300533.2015.pdf.jpg
bitstream.checksum.fl_str_mv 392d5ba9fcf38ec1bb5a9d63d5b98939
76d6f93c4116b68960eee87c58a80661
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1812169394844860416
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Fauvet, Marie-ChristineDuarte Amaya, HelgaCaicedo Castro, Isaac Bernardocb3e8d24-da2b-464d-b41f-df9a7bf8331c3002019-06-29T20:19:51Z2019-06-29T20:19:51Z2015https://repositorio.unal.edu.co/handle/unal/54391http://bdigital.unal.edu.co/49323/In this research, we address the problem of retrieving services which fulfil users' need expressed in query in free text. Our goal is to cope the term mismatch problems which affect the effectiveness of service retrieval models applied in prior research on text descriptions-based service retrieval models. These problems are caused due to service descriptions are brief. Service providers use few terms to describe desired services, thereby, when these descriptions are different to the sentences in queries, term mismatch problems decrease the effectiveness in classical models which depend on the observable text features instead of the latent semantic features of the text. We have applied a family of Information Retrieval (IR) models for the purpose of contributing to increase the effectiveness acquired with the models applied in prior research on service retrieval. Besides, we have conducted systematic experiments to compare our family of IR models with those used in the state-of-the-art in service discovery. From the outcomes of the experiments, we conclude that our model based on query expansion via a co-occurrence thesaurus outperforms the effectiveness of all the models studied in this research. Therefore, we have implemented this model in S3niffer, which is a text description-based service search engine.Resumen. En esta investigación, nosotros abordamos el problema de extraer servicios que satisfagan las necesidades de los usuarios, las cuales son expresadas en consultas en texto libre. Nuestro objetivo es resolver los problemas relacionados con la co-rrespondencia de términos, los cuales afectan la efectividad de los modelos de extracción de servicios aplicados en previas investigaciones en extracción de servicios basada en descripciones de texto. Tales problemas son causados porque la descripción de servicios son breves. Los proveedores de servicio usan pocos términos para describir los servicios deseados, por ende, cuando las descripciones son diferentes a las frases en las consultas, los problemas de correspondencia de términos reducen la efectividad en modelos clásicos que dependen de las características observables del texto en vez de las características semánticas latentes. Nosotros hemos aplicado una familia de modelos de extracción de información con el propósito de contribuir a incrementar la efectividad adquirida con los modelos aplicados en previas investigaciones en extracción de servicios. Además, nosotros realizamos experimentos para comparar nuestra familia de modelos de extracción de información con aquellos usados en el estado del arte en descubrimiento de servicios. De los resultados experimentales, se concluye que nuestro modelo basado en expansión de consulta via un tesauros de co-ocurrencias, supera la efectividad de todos los modelos estudiados en esta investigación. Por lo tanto, nosotros hemos implementado este modelo en S3niffer, el cual es un motor de búsqueda de servicios basado en descripciones textuales.Résumé. Dans cette recherche, nous abordons le problème de le recherche de services qui répondent à des besoins des utilisateurs exprimés sous forme de requ^ete en texte libre. Notre objectif est de résoudre les problèmes qui affectent l'efficacité des modèles de recherche d'information existant lorsqu'ils sont appliqués à la recherche de services dans un corpus rassemblant des descriptions standard de ces services. Ces problèmes sont issus du fait que les descriptions des services sont brèves. En effet, les fournisseurs de services n'utilisent que quelques termes pour décrire les services souhaités. Ainsi, lorsque ces descriptions sont differentes des phrases dans les requ^etes ce qui diminue l'efficacité des modèles classiques qui dépendent de traits observables au lieu de traits sémantiques latents du texte. Nous avons adapté une famille de modèles de recherche d'information (IR) dans le but de contribuer à accroître l'efficacité acquise avec les modèles existant concernant la découverte de services. En outre, nous avons mené des expériences systématiques afin de comparer notre famille de modèles IR avec ceux de l'état de l'art portant sur la découverte de service. Des résultats des expériences, nous concluons que notre modèle basé sur l'extension des requêtes via un thésaurus co-occurrence est plus efficace en terme des mesures classiques utilisées en IR que tous les modèles étudiés dans cette recherche. Par conséquent, nous avons mis en place ce modèle dans S3niffer qui est un moteur de recherche de service basé sur leur description standard.Doctoradoapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrial Ingeniería de SistemasIngeniería de SistemasCaicedo Castro, Isaac Bernardo (2015) S3niffer: A text description-based service search system. Doctorado thesis, Universidad Nacional de Colombia : Universidad de Grenoble Alpes.0 Generalidades / Computer science, information and general works02 Bibliotecología y ciencias de la información / Library and information sciences62 Ingeniería y operaciones afines / EngineeringExtracción de informaciónFactorización de matricesDescubrimiento de servicios basados en IRExpansión de consultasTesauros de co-ocurrenciasInformation retrievalMatrix factorisationIR-based service discoveryQuery expansionCo-occurrence thesaurusLa recherche d'informationFactorisation de matricesDécouverte de service basé sur des techniques de RIExpansion de requêtesthésaurus co-occurrenceS3niffer: A text description-based service search systemTrabajo de grado - Doctoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06Texthttp://purl.org/redcol/resource_type/TDORIGINAL02300533.2015.pdfapplication/pdf891507https://repositorio.unal.edu.co/bitstream/unal/54391/1/02300533.2015.pdf392d5ba9fcf38ec1bb5a9d63d5b98939MD51THUMBNAIL02300533.2015.pdf.jpg02300533.2015.pdf.jpgGenerated Thumbnailimage/jpeg4151https://repositorio.unal.edu.co/bitstream/unal/54391/2/02300533.2015.pdf.jpg76d6f93c4116b68960eee87c58a80661MD52unal/54391oai:repositorio.unal.edu.co:unal/543912024-03-12 23:08:25.262Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co