Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso

Este artículo representa la información disponible en bases de datos no relacionales, aprovechando los beneficios de escalabilidad, alta disponibilidad, resiliencia y facilidad proporcionados por estas. Así mismo, se da a conocer una serie de algoritmos suministrados por el motor de bases de datos d...

Full description

Autores:
Tipo de recurso:
Article of journal
Fecha de publicación:
2021
Institución:
Universidad de Bogotá Jorge Tadeo Lozano
Repositorio:
Expeditio: repositorio UTadeo
Idioma:
spa
OAI Identifier:
oai:expeditiorepositorio.utadeo.edu.co:20.500.12010/32277
Acceso en línea:
https://revistas.utadeo.edu.co/index.php/mutis/article/view/1740/1980
http://hdl.handle.net/20.500.12010/32277
Palabra clave:
Base de datos de grafos
Analítica de grafos
Métricas de centralidad
Detección de comunidades.
Rights
License
Abierto (Texto Completo)
id UTADEO2_2f9a11618b453a79cd6a20b8ae2baae9
oai_identifier_str oai:expeditiorepositorio.utadeo.edu.co:20.500.12010/32277
network_acronym_str UTADEO2
network_name_str Expeditio: repositorio UTadeo
repository_id_str
dc.title.spa.fl_str_mv Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
title Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
spellingShingle Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
Base de datos de grafos
Analítica de grafos
Métricas de centralidad
Detección de comunidades.
title_short Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
title_full Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
title_fullStr Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
title_full_unstemmed Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
title_sort Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de caso
dc.subject.spa.fl_str_mv Base de datos de grafos
Analítica de grafos
Métricas de centralidad
Detección de comunidades.
topic Base de datos de grafos
Analítica de grafos
Métricas de centralidad
Detección de comunidades.
description Este artículo representa la información disponible en bases de datos no relacionales, aprovechando los beneficios de escalabilidad, alta disponibilidad, resiliencia y facilidad proporcionados por estas. Así mismo, se da a conocer una serie de algoritmos suministrados por el motor de bases de datos de grafos Neo4j para computar métricas de grafos, nodos y relaciones. En primer lugar, se consolida un conjunto de datos públicos tomado del sistema de ventas online de Mercado Libre. Posteriormente, se modelan los datos obtenidos en un esquema de grafos que tiene como nodos a los usuarios, quienes pueden ser vendedores, compradores, productos y sus características. Como siguiente paso, se aplican algoritmos que calculan métricas del grafo, junto con sus nodos y relaciones, visualizando de esta manera los resultados obtenidos. Para finalizar, se identifican las categorías ofertadas más importantes, las comunidades existentes y los usuarios más influyentes.
publishDate 2021
dc.date.created.none.fl_str_mv 2021
dc.date.accessioned.none.fl_str_mv 2023-10-31T05:52:22Z
dc.date.available.none.fl_str_mv 2023-10-31T05:52:22Z
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
format http://purl.org/coar/resource_type/c_6501
dc.identifier.other.spa.fl_str_mv https://revistas.utadeo.edu.co/index.php/mutis/article/view/1740/1980
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12010/32277
url https://revistas.utadeo.edu.co/index.php/mutis/article/view/1740/1980
http://hdl.handle.net/20.500.12010/32277
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Branting, L. K., Reeder, F., Gold, J., & Champney, T. (2016). Graph analytics for healthcare fraud risk estimation. 2016 ieee/acm International Conference on Advances in Social Networks Analysis and Mining (asonam) (pp. 845-851). asonam. https:// www.computer.org/csdl/proceedings-article/ asonam/2016/07752336/12OmNz4SOvm
Carrillo-Gelvez, G. (2019). Conjunto de datos de Mercadolibre [data set]. GitHub. https://github. com/gersongelvez/TESIS_MAESTRIA/tree/master/ DATOS
Das, S. R., & Sisk, J. (2005). Financial communities. Journal of Portfolio Management, 31(4), 112-123.
db-Engines (2020a). db-Engines ranking. https:// db-engines.com/en/ranking
db-Engines (2020b). db-Engines ranking of graph dbms. https://db-engines.com/en/ranking/ graph+dbms
Dinero. (2020, agosto 10). Mercado Libre: ¿cómo llegó a ser la firma más valiosa de Latinoamérica? https://www.dinero.com/empresas/articulo/ mercado-libre-es-la-empresa-mas-valiosa-deamerica- latina-en-2020/295269
Eboli, M. (2007). Systemic risk in financial networks: A graph-theoretic approach. http:// citeseerx.ist.psu.edu/viewdoc/download?- doi=10.1.1.466.7515&rep=rep1&type=pdf
Kanavos, A., Drakopoulos, G., & Tsakalidis, A. (2017). Graph community discovery algorithms in Neo4j with a regularization-based evaluation metric. Proceedings of the 13th International Conference on Web Information Systems and Technologies (webist 2017) (pp. 403-410). webist. https:// www.scitepress.org/papers/2017/63821/63821. pdf
Kleinberg, J. M. (1999). Authoritative sources in a hyperlinked environment. Journal of the acm, 46(5), 604-632. https://doi. org/10.1145/324133.324140
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
rights_invalid_str_mv Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
dc.format.extent.spa.fl_str_mv 19 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Revista Mutis
institution Universidad de Bogotá Jorge Tadeo Lozano
bitstream.url.fl_str_mv https://expeditiorepositorio.utadeo.edu.co/bitstream/20.500.12010/32277/1/webmaster%2c%2ba07-Mutis_11_1_vAGO24.pdf
https://expeditiorepositorio.utadeo.edu.co/bitstream/20.500.12010/32277/2/license.txt
https://expeditiorepositorio.utadeo.edu.co/bitstream/20.500.12010/32277/3/webmaster%2c%2ba07-Mutis_11_1_vAGO24.pdf.jpg
bitstream.checksum.fl_str_mv 1e8d45226c62301e7a387ee4eb1beceb
baba314677a6b940f072575a13bb6906
f565f64326f9664be841efd240ad74e3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional - Universidad Jorge Tadeo Lozano
repository.mail.fl_str_mv expeditiorepositorio@utadeo.edu.co
_version_ 1812100372177616896
spelling 2023-10-31T05:52:22Z2023-10-31T05:52:22Z2021https://revistas.utadeo.edu.co/index.php/mutis/article/view/1740/1980http://hdl.handle.net/20.500.12010/32277Este artículo representa la información disponible en bases de datos no relacionales, aprovechando los beneficios de escalabilidad, alta disponibilidad, resiliencia y facilidad proporcionados por estas. Así mismo, se da a conocer una serie de algoritmos suministrados por el motor de bases de datos de grafos Neo4j para computar métricas de grafos, nodos y relaciones. En primer lugar, se consolida un conjunto de datos públicos tomado del sistema de ventas online de Mercado Libre. Posteriormente, se modelan los datos obtenidos en un esquema de grafos que tiene como nodos a los usuarios, quienes pueden ser vendedores, compradores, productos y sus características. Como siguiente paso, se aplican algoritmos que calculan métricas del grafo, junto con sus nodos y relaciones, visualizando de esta manera los resultados obtenidos. Para finalizar, se identifican las categorías ofertadas más importantes, las comunidades existentes y los usuarios más influyentes.#BasesDeDatosThis article represents the information available in non-relational databases, taking advantage of their scalability, high availability, resilience, and ease of development. This work also describes some algorithms provided by the Neo4j graph database engine to compute graph, node and relationship metrics. To do this, we first consolidate a data set obtained from Mercado Libre online sales system. Subsequently, the data is cast into a graph schema that considers users as nodes. Such users can be sellers or buyers, products and their characteristics. Afterward, we applied the algorithms that calculate metrics from the graph, as well as its nodes and relationships, thus displaying the results obtained. Finally, we identify the most important categories offered, along with the most influential communities and users.19 páginasapplication/pdfspaRevista MutisBase de datos de grafosAnalítica de grafosMétricas de centralidadDetección de comunidades.Analítica de grafos para identificar entidades relevantes y comunidades en Mercado Libre: un estudio de casoAbierto (Texto Completo)http://purl.org/coar/access_right/c_abf2Branting, L. K., Reeder, F., Gold, J., & Champney, T. (2016). Graph analytics for healthcare fraud risk estimation. 2016 ieee/acm International Conference on Advances in Social Networks Analysis and Mining (asonam) (pp. 845-851). asonam. https:// www.computer.org/csdl/proceedings-article/ asonam/2016/07752336/12OmNz4SOvmCarrillo-Gelvez, G. (2019). Conjunto de datos de Mercadolibre [data set]. GitHub. https://github. com/gersongelvez/TESIS_MAESTRIA/tree/master/ DATOSDas, S. R., & Sisk, J. (2005). Financial communities. Journal of Portfolio Management, 31(4), 112-123.db-Engines (2020a). db-Engines ranking. https:// db-engines.com/en/rankingdb-Engines (2020b). db-Engines ranking of graph dbms. https://db-engines.com/en/ranking/ graph+dbmsDinero. (2020, agosto 10). Mercado Libre: ¿cómo llegó a ser la firma más valiosa de Latinoamérica? https://www.dinero.com/empresas/articulo/ mercado-libre-es-la-empresa-mas-valiosa-deamerica- latina-en-2020/295269Eboli, M. (2007). Systemic risk in financial networks: A graph-theoretic approach. http:// citeseerx.ist.psu.edu/viewdoc/download?- doi=10.1.1.466.7515&rep=rep1&type=pdfKanavos, A., Drakopoulos, G., & Tsakalidis, A. (2017). Graph community discovery algorithms in Neo4j with a regularization-based evaluation metric. Proceedings of the 13th International Conference on Web Information Systems and Technologies (webist 2017) (pp. 403-410). webist. https:// www.scitepress.org/papers/2017/63821/63821. pdfKleinberg, J. M. (1999). Authoritative sources in a hyperlinked environment. Journal of the acm, 46(5), 604-632. https://doi. org/10.1145/324133.324140http://purl.org/coar/resource_type/c_6501Carrillo Gelvez, Gerson EnriqueGalpin, I.ORIGINALwebmaster,+a07-Mutis_11_1_vAGO24.pdfwebmaster,+a07-Mutis_11_1_vAGO24.pdfapplication/pdf2378086https://expeditiorepositorio.utadeo.edu.co/bitstream/20.500.12010/32277/1/webmaster%2c%2ba07-Mutis_11_1_vAGO24.pdf1e8d45226c62301e7a387ee4eb1becebMD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-82938https://expeditiorepositorio.utadeo.edu.co/bitstream/20.500.12010/32277/2/license.txtbaba314677a6b940f072575a13bb6906MD52open accessTHUMBNAILwebmaster,+a07-Mutis_11_1_vAGO24.pdf.jpgwebmaster,+a07-Mutis_11_1_vAGO24.pdf.jpgIM Thumbnailimage/jpeg16877https://expeditiorepositorio.utadeo.edu.co/bitstream/20.500.12010/32277/3/webmaster%2c%2ba07-Mutis_11_1_vAGO24.pdf.jpgf565f64326f9664be841efd240ad74e3MD53open access20.500.12010/32277oai:expeditiorepositorio.utadeo.edu.co:20.500.12010/322772024-03-14 09:56:30.484open accessRepositorio Institucional - Universidad Jorge Tadeo Lozanoexpeditiorepositorio@utadeo.edu.coQXV0b3Jpem8gYWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBVbml2ZXJzaWRhZCBkZSBCb2dvdMOhIEpvcmdlIFRhZGVvIExvemFubyBwYXJhCnF1ZSBjb24gZmluZXMgYWNhZMOpbWljb3MsIHByZXNlcnZlLCBjb25zZXJ2ZSwgb3JnYW5pY2UsIGVkaXRlIHkgbW9kaWZpcXVlCnRlY25vbMOzZ2ljYW1lbnRlIGVsIGRvY3VtZW50byBhbnRlcmlvcm1lbnRlIGNhcmdhZG8gYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbApFeHBlZGl0aW8KCkV4Y2VwdHVhbmRvIHF1ZSBlbCBkb2N1bWVudG8gc2VhIGNvbmZpZGVuY2lhbCwgYXV0b3Jpem8gYSB1c3VhcmlvcyBpbnRlcm5vcyB5CmV4dGVybm9zIGRlIGxhIEluc3RpdHVjacOzbiBhIGNvbnN1bHRhciB5IHJlcHJvZHVjaXIgZWwgY29udGVuaWRvIGRlbCBkb2N1bWVudG8KcGFyYSBmaW5lcyBhY2Fkw6ltaWNvcyBudW5jYSBwYXJhIHVzb3MgY29tZXJjaWFsZXMsIGN1YW5kbyBtZWRpYW50ZSBsYQpjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkZSBjcsOpZGl0byBhIGxhIG9icmEgeSBzdShzKSBhdXRvcihzKS4KCkV4Y2VwdHVhbmRvIHF1ZSBlbCBkb2N1bWVudG8gc2VhIGNvbmZpZGVuY2lhbCwgYXV0b3Jpem8gYXBsaWNhciBsYSBsaWNlbmNpYSBkZWwKZXN0w6FuZGFyIGludGVybmFjaW9uYWwgQ3JlYXRpdmUgQ29tbW9ucyAoQXR0cmlidXRpb24tTm9uQ29tbWVyY2lhbC1Ob0Rlcml2YXRpdmVzCjQuMCBJbnRlcm5hdGlvbmFsKSBxdWUgaW5kaWNhIHF1ZSBjdWFscXVpZXIgcGVyc29uYSBwdWVkZSB1c2FyIGxhIG9icmEgZGFuZG8KY3LDqWRpdG8gYWwgYXV0b3IsIHNpbiBwb2RlciBjb21lcmNpYXIgY29uIGxhIG9icmEgeSBzaW4gZ2VuZXJhciBvYnJhcyBkZXJpdmFkYXMuCgpFbCAobG9zKSBhdXRvcihlcykgY2VydGlmaWNhKG4pIHF1ZSBlbCBkb2N1bWVudG8gbm8gaW5mcmluZ2UgbmkgYXRlbnRhIGNvbnRyYQpkZXJlY2hvcyBpbmR1c3RyaWFsZXMsIHBhdHJpbW9uaWFsZXMsIGludGVsZWN0dWFsZXMsIG1vcmFsZXMgbyBjdWFscXVpZXIgb3RybyBkZQp0ZXJjZXJvcywgYXPDrSBtaXNtbyBkZWNsYXJhbiBxdWUgbGEgVW5pdmVyc2lkYWQgSm9yZ2UgVGFkZW8gTG96YW5vIHNlIGVuY3VlbnRyYQpsaWJyZSBkZSB0b2RhIHJlc3BvbnNhYmlsaWRhZCBjaXZpbCwgYWRtaW5pc3RyYXRpdmEgeS9vIHBlbmFsIHF1ZSBwdWVkYSBkZXJpdmFyc2UKZGUgbGEgcHVibGljYWNpw7NuIGRlbCB0cmFiYWpvIGRlIGdyYWRvIHkvbyB0ZXNpcyBlbiBjYWxpZGFkIGRlIGFjY2VzbyBhYmllcnRvIHBvcgpjdWFscXVpZXIgbWVkaW8uCgpFbiBjdW1wbGltaWVudG8gY29uIGxvIGRpc3B1ZXN0byBlbiBsYSBMZXkgMTU4MSBkZSAyMDEyIHkgZXNwZWNpYWxtZW50ZSBlbiB2aXJ0dWQKZGUgbG8gZGlzcHVlc3RvIGVuIGVsIEFydMOtY3VsbyAxMCBkZWwgRGVjcmV0byAxMzc3IGRlIDIwMTMsIGF1dG9yaXpvIGEgbGEKVW5pdmVyc2lkYWQgSm9yZ2UgVGFkZW8gTG96YW5vIGEgcHJvY2VkZXIgY29uIGVsIHRyYXRhbWllbnRvIGRlIGxvcyBkYXRvcwpwZXJzb25hbGVzIHBhcmEgZmluZXMgYWNhZMOpbWljb3MsIGhpc3TDs3JpY29zLCBlc3RhZMOtc3RpY29zIHkgYWRtaW5pc3RyYXRpdm9zIGRlCmxhIEluc3RpdHVjacOzbi4gRGUgY29uZm9ybWlkYWQgY29uIGxvIGVzdGFibGVjaWRvIGVuIGVsIGFydMOtY3VsbyAzMCBkZSBsYSBMZXkgMjMKZGUgMTk4MiB5IGVsIGFydMOtY3VsbyAxMSBkZSBsYSBEZWNpc2nDs24gQW5kaW5hIDM1MSBkZSAxOTkzLCBhY2xhcmFtb3MgcXVlIOKAnExvcwpkZXJlY2hvcyBtb3JhbGVzIHNvYnJlIGVsIHRyYWJham8gc29uIHByb3BpZWRhZCBkZSBsb3MgYXV0b3Jlc+KAnSwgbG9zIGN1YWxlcyBzb24KaXJyZW51bmNpYWJsZXMsIGltcHJlc2NyaXB0aWJsZXMsIGluZW1iYXJnYWJsZXMgZSBpbmFsaWVuYWJsZXMuCgpDb24gZWwgcmVnaXN0cm8gZW4gbGEgcMOhZ2luYSwgYXV0b3Jpem8gZGUgbWFuZXJhIGV4cHJlc2EgYSBsYSBGVU5EQUNJw5NOIFVOSVZFUlNJREFECkRFIEJPR09Uw4EgSk9SR0UgVEFERU8gTE9aQU5PLCBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcyBwYXJhIHByb2Nlc2FyCm8gY29uc2VydmFyLCBjb24gZmluZXMgZXN0YWTDrXN0aWNvcywgZGUgY29udHJvbCBvIHN1cGVydmlzacOzbiwgYXPDrSBjb21vIHBhcmEgZWwKZW52w61vIGRlIGluZm9ybWFjacOzbiB2w61hIGNvcnJlbyBlbGVjdHLDs25pY28sIGRlbnRybyBkZWwgbWFyY28gZXN0YWJsZWNpZG8gcG9yIGxhCkxleSAxNTgxIGRlIDIwMTIgeSBzdXMgZGVjcmV0b3MgY29tcGxlbWVudGFyaW9zIHNvYnJlIFRyYXRhbWllbnRvIGRlIERhdG9zClBlcnNvbmFsZXMuIEVuIGN1YWxxdWllciBjYXNvLCBlbnRpZW5kbyBxdWUgcG9kcsOpIGhhY2VyIHVzbyBkZWwgZGVyZWNobyBhIGNvbm9jZXIsCmFjdHVhbGl6YXIsIHJlY3RpZmljYXIgbyBzdXByaW1pciBsb3MgZGF0b3MgcGVyc29uYWxlcyBtZWRpYW50ZSBlbCBlbnbDrW8gZGUgdW5hCmNvbXVuaWNhY2nDs24gZXNjcml0YSBhbCBjb3JyZW8gZWxlY3Ryw7NuaWNvIHByb3RlY2Npb25kYXRvc0B1dGFkZW8uZWR1LmNvLgoKTGEgRlVOREFDScOTTiBVTklWRVJTSURBRCBERSBCT0dPVMOBIEpPUkdFIFRBREVPIExPWkFOTyBubyB1dGlsaXphcsOhIGxvcyBkYXRvcwpwZXJzb25hbGVzIHBhcmEgZmluZXMgZGlmZXJlbnRlcyBhIGxvcyBhbnVuY2lhZG9zIHkgZGFyw6EgdW4gdXNvIGFkZWN1YWRvIHkKcmVzcG9uc2FibGUgYSBzdXMgZGF0b3MgcGVyc29uYWxlcyBkZSBhY3VlcmRvIGNvbiBsYSBkaXJlY3RyaXogZGUgUHJvdGVjY2nDs24gZGUKRGF0b3MgUGVyc29uYWxlcyBxdWUgcG9kcsOhIGNvbnN1bHRhciBlbjoKaHR0cDovL3d3dy51dGFkZW8uZWR1LmNvL2VzL2xpbmsvZGVzY3VicmUtbGEtdW5pdmVyc2lkYWQvMi9kb2N1bWVudG9zCg==