Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica

El presente documento tiene como objeto presentar las actividades y logros obtenidos en un proyecto de mejora técnico-contable llevado a cabo en, Zimmer Biomet, una compañía del sector de la industria de la tecnología médica, como parte del desarrollo de la pasantía profesional. La propuesta consist...

Full description

Autores:
Poveda Guacaneme, Nicolas Julian
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/51066
Acceso en línea:
http://hdl.handle.net/11634/51066
Palabra clave:
Web scraping
Python
expense management
Accountancy
financial accounting
Contabilidad
Empresas -- Contabilidad
Trabajadores
Web scraping
Python
Gestion de gastos
contabilidad financiera
Contaduria
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
id SANTTOMAS2_173bd4e1afa7bf6182b625b0407ab8a2
oai_identifier_str oai:repository.usta.edu.co:11634/51066
network_acronym_str SANTTOMAS2
network_name_str Repositorio Institucional USTA
repository_id_str
dc.title.spa.fl_str_mv Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
title Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
spellingShingle Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
Web scraping
Python
expense management
Accountancy
financial accounting
Contabilidad
Empresas -- Contabilidad
Trabajadores
Web scraping
Python
Gestion de gastos
contabilidad financiera
Contaduria
title_short Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
title_full Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
title_fullStr Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
title_full_unstemmed Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
title_sort Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica
dc.creator.fl_str_mv Poveda Guacaneme, Nicolas Julian
dc.contributor.advisor.none.fl_str_mv Montoya Ocampo, Luz Dary
Rico Bonilla, Carlos Orlando
dc.contributor.author.none.fl_str_mv Poveda Guacaneme, Nicolas Julian
dc.contributor.corporatename.spa.fl_str_mv Universidad Santo Tomás
dc.subject.keyword.spa.fl_str_mv Web scraping
Python
expense management
Accountancy
financial accounting
topic Web scraping
Python
expense management
Accountancy
financial accounting
Contabilidad
Empresas -- Contabilidad
Trabajadores
Web scraping
Python
Gestion de gastos
contabilidad financiera
Contaduria
dc.subject.lemb.spa.fl_str_mv Contabilidad
Empresas -- Contabilidad
Trabajadores
dc.subject.proposal.spa.fl_str_mv Web scraping
Python
Gestion de gastos
contabilidad financiera
Contaduria
description El presente documento tiene como objeto presentar las actividades y logros obtenidos en un proyecto de mejora técnico-contable llevado a cabo en, Zimmer Biomet, una compañía del sector de la industria de la tecnología médica, como parte del desarrollo de la pasantía profesional. La propuesta consiste en implementar las herramientas de web scraping para la automatización de los procesos de clasificación y reconocimiento de gastos, en este caso, para los reportados por los empleados pertenecientes al centro de costos de la filial de Zimmer Canadá. Este proyecto se sustentó en el diseño de códigos como VBA y Python para la extracción y el procesamiento de la información financiera. Este trabajo es una respuesta a una necesidad que presentaba la empresa de optimizar sus procesos de clasificación y reconocimiento de gastos de empleados, los cuales se realizaban de manera manual extrayendo uno a uno los datos de cada empleado. Esto representaba una cantidad de tiempo considerable para la persona a cargo de la actividad. Se tuvo como objetivos el incrementar la precisión de la información, fortalecer a seguridad de los datos y aumentar la frecuencia del análisis de estos. Se describirá detalladamente las actividades realizadas para la implementación del proyecto, incluyendo los requisitos clave de este, los campos necesarios para la extracción de datos, la búsqueda y selección de las herramientas de web scraping, el desarrollo del proceso y la aplicación y pruebas de este. Se analizan los problemas encontrados durante el trabajo, tales como la dificultad para acceder a toda la información en la página web objetivo, y se presentan soluciones para estas restricciones. Finalmente, los resultados muestran un marcado aumento en la eficiencia del proceso de reconocimiento de gastos, lo que reduce en gran medida el tiempo y el esfuerzo que los empleados necesitan para hacerlo. Asimismo, se ha logrado una mayor precisión de la información registrada, reduciendo la posibilidad de errores. Este trabajo puede servir como base para futuros proyectos de automatización de procesos en la compañía y otras organizaciones similares.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-07-06T14:11:18Z
dc.date.available.none.fl_str_mv 2023-07-06T14:11:18Z
dc.date.issued.none.fl_str_mv 2023-07-07
dc.type.local.spa.fl_str_mv Trabajo de grado
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.drive.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.citation.spa.fl_str_mv Poveda Guacaneme, N. J. (2023). Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica. [Trabajo de grado, Universidad Santo Tomás]. Repositorio institucional.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/11634/51066
dc.identifier.reponame.spa.fl_str_mv reponame:Repositorio Institucional Universidad Santo Tomás
dc.identifier.instname.spa.fl_str_mv instname:Universidad Santo Tomás
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.usta.edu.co
identifier_str_mv Poveda Guacaneme, N. J. (2023). Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica. [Trabajo de grado, Universidad Santo Tomás]. Repositorio institucional.
reponame:Repositorio Institucional Universidad Santo Tomás
instname:Universidad Santo Tomás
repourl:https://repository.usta.edu.co
url http://hdl.handle.net/11634/51066
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Berman, A., & Rubin, S. (06 de Diciembre de 2021). The Future of Internal Controls: Embracing Advanced Automation. Obtenido de deloitte: https://www.deloitte.com/global/en/services/risk-advisory/blogs/the-future-of-internal-controls-embracing-advanced-automation.html
Brightman, D. (06 de septiembre de 2021). Blackline. Obtenido de What Is Robotic Process Automation in Accounting?: https://www.blackline.com/blog/robotic-process-automation-accounting/
Krotov, V., & Tennyson, M. (2018). Nota de investigación: Scraping de datos financieros de la web utilizando el lenguaje R. Journal of Emerging Technologies in Accounting, 15(1), 169-181.
Macias, H. A., Farfán, M. A., & Rodríguez, B. A. (2020). Contabilidad digital: los retos del blockchain para académicos y profesionales. Revista Activos, 18(1).
Saurkar, A. V., Pathare, K. G., & Gode, S. A. (2018). Revisión exhaustiva del web scraping. International Journal on Future Revolution in Computer Science & Communication Engineering, 4(4). ISSN: 2454-4248.
Vincent, N. E., Igou, A., & Burns, M. B. (2020 Prepararse para los robots: Una propuesta de curso sobre automatización robótica de procesos. Journal of Emerging Technologies in Accounting, 17(2), 75-91.
dc.rights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.local.spa.fl_str_mv Abierto (Texto Completo)
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Abierto (Texto Completo)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.coverage.campus.spa.fl_str_mv CRAI-USTA Bogotá
dc.publisher.spa.fl_str_mv Universidad Santo Tomás
dc.publisher.program.spa.fl_str_mv Pregrado Contaduría Pública
dc.publisher.faculty.spa.fl_str_mv Facultad de Contaduría Pública
institution Universidad Santo Tomás
bitstream.url.fl_str_mv https://repository.usta.edu.co/bitstream/11634/51066/1/Carta_aprobacion_facultad_2021%20%281%29.pdf
https://repository.usta.edu.co/bitstream/11634/51066/2/2023JulianPoveda.pdf
https://repository.usta.edu.co/bitstream/11634/51066/3/Carta%20derechos%20de%20autor.pdf
https://repository.usta.edu.co/bitstream/11634/51066/4/license_rdf
https://repository.usta.edu.co/bitstream/11634/51066/5/license.txt
https://repository.usta.edu.co/bitstream/11634/51066/6/Carta_aprobacion_facultad_2021%20%281%29.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/51066/7/2023JulianPoveda.pdf.jpg
https://repository.usta.edu.co/bitstream/11634/51066/8/Carta%20derechos%20de%20autor.pdf.jpg
bitstream.checksum.fl_str_mv 7668132a0eb23e0326b77f92b6c5be43
f4608acb5919ef3a6a4a9fd0ef893ede
e9a8262fa2049a208a48016271e930eb
217700a34da79ed616c2feb68d4c5e06
aedeaf396fcd827b537c73d23464fc27
e73880216a7bc511726d3734b1448a06
8abc6bc251c215a3d3940513e5b36041
fc6007581bf003ddd3189d6ab99fc768
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad Santo Tomás
repository.mail.fl_str_mv repositorio@usantotomas.edu.co
_version_ 1782026283170922496
spelling Montoya Ocampo, Luz DaryRico Bonilla, Carlos OrlandoPoveda Guacaneme, Nicolas JulianUniversidad Santo Tomás2023-07-06T14:11:18Z2023-07-06T14:11:18Z2023-07-07Poveda Guacaneme, N. J. (2023). Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médica. [Trabajo de grado, Universidad Santo Tomás]. Repositorio institucional.http://hdl.handle.net/11634/51066reponame:Repositorio Institucional Universidad Santo Tomásinstname:Universidad Santo Tomásrepourl:https://repository.usta.edu.coEl presente documento tiene como objeto presentar las actividades y logros obtenidos en un proyecto de mejora técnico-contable llevado a cabo en, Zimmer Biomet, una compañía del sector de la industria de la tecnología médica, como parte del desarrollo de la pasantía profesional. La propuesta consiste en implementar las herramientas de web scraping para la automatización de los procesos de clasificación y reconocimiento de gastos, en este caso, para los reportados por los empleados pertenecientes al centro de costos de la filial de Zimmer Canadá. Este proyecto se sustentó en el diseño de códigos como VBA y Python para la extracción y el procesamiento de la información financiera. Este trabajo es una respuesta a una necesidad que presentaba la empresa de optimizar sus procesos de clasificación y reconocimiento de gastos de empleados, los cuales se realizaban de manera manual extrayendo uno a uno los datos de cada empleado. Esto representaba una cantidad de tiempo considerable para la persona a cargo de la actividad. Se tuvo como objetivos el incrementar la precisión de la información, fortalecer a seguridad de los datos y aumentar la frecuencia del análisis de estos. Se describirá detalladamente las actividades realizadas para la implementación del proyecto, incluyendo los requisitos clave de este, los campos necesarios para la extracción de datos, la búsqueda y selección de las herramientas de web scraping, el desarrollo del proceso y la aplicación y pruebas de este. Se analizan los problemas encontrados durante el trabajo, tales como la dificultad para acceder a toda la información en la página web objetivo, y se presentan soluciones para estas restricciones. Finalmente, los resultados muestran un marcado aumento en la eficiencia del proceso de reconocimiento de gastos, lo que reduce en gran medida el tiempo y el esfuerzo que los empleados necesitan para hacerlo. Asimismo, se ha logrado una mayor precisión de la información registrada, reduciendo la posibilidad de errores. Este trabajo puede servir como base para futuros proyectos de automatización de procesos en la compañía y otras organizaciones similares.The purpose of this document is to present the activities and achievements obtained in a technical-accounting improvement project carried out at Zimmer Biomet, a company in the medical technology industry sector, as part of the development of the professional internship. The proposal consists of implementing web scraping tools for the automation of the processes of classification and recognition of expenses, in this case, for those reported by employees belonging to the cost center of the subsidiary of Zimmer Canada. This project was based on the design of codes such as VBA and Python for the extraction and processing of financial information. This work is a response to a need presented by the company to optimize its processes of classification and recognition of employee expenses, which were performed manually by extracting one by one the data of each employee. This represented a considerable amount of time for the person in charge of the activity. The objectives were to increase the accuracy of the information, strengthen data security and increase the frequency of data analysis. The activities carried out for the implementation of the project will be described in detail, including the key requirements of the project, the necessary fields for data extraction, the search and selection of the web scraping tools, the development of the process, and the application and testing of the process. Problems encountered during the work, such as the difficulty in accessing all the information on the target web page, are discussed and solutions to these constraints are presented. Finally, the results show a marked increase in the efficiency of the expense recognition process, which greatly reduces the time and effort needed by employees to do so. Likewise, greater accuracy of the information recorded has been achieved, reducing the possibility of errors. This work can serve as a basis for future process automation projects in the company and other similar organizations.Contador PúblicoPregradoapplication/pdfspaUniversidad Santo TomásPregrado Contaduría PúblicaFacultad de Contaduría PúblicaAtribución-NoComercial-SinDerivadas 2.5 Colombiahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/Abierto (Texto Completo)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Web scraping aplicado al proceso de clasificación y reconocimiento de gastos de empleados en el caso de una empresa de la industria de la tecnología médicaWeb scrapingPythonexpense managementAccountancyfinancial accountingContabilidadEmpresas -- ContabilidadTrabajadoresWeb scrapingPythonGestion de gastoscontabilidad financieraContaduriaTrabajo de gradoinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:eu-repo/semantics/bachelorThesisCRAI-USTA BogotáBerman, A., & Rubin, S. (06 de Diciembre de 2021). The Future of Internal Controls: Embracing Advanced Automation. Obtenido de deloitte: https://www.deloitte.com/global/en/services/risk-advisory/blogs/the-future-of-internal-controls-embracing-advanced-automation.htmlBrightman, D. (06 de septiembre de 2021). Blackline. Obtenido de What Is Robotic Process Automation in Accounting?: https://www.blackline.com/blog/robotic-process-automation-accounting/Krotov, V., & Tennyson, M. (2018). Nota de investigación: Scraping de datos financieros de la web utilizando el lenguaje R. Journal of Emerging Technologies in Accounting, 15(1), 169-181.Macias, H. A., Farfán, M. A., & Rodríguez, B. A. (2020). Contabilidad digital: los retos del blockchain para académicos y profesionales. Revista Activos, 18(1).Saurkar, A. V., Pathare, K. G., & Gode, S. A. (2018). Revisión exhaustiva del web scraping. International Journal on Future Revolution in Computer Science & Communication Engineering, 4(4). ISSN: 2454-4248.Vincent, N. E., Igou, A., & Burns, M. B. (2020 Prepararse para los robots: Una propuesta de curso sobre automatización robótica de procesos. Journal of Emerging Technologies in Accounting, 17(2), 75-91.ORIGINALCarta_aprobacion_facultad_2021 (1).pdfCarta_aprobacion_facultad_2021 (1).pdfCarta aprobacion facultad 2021application/pdf848942https://repository.usta.edu.co/bitstream/11634/51066/1/Carta_aprobacion_facultad_2021%20%281%29.pdf7668132a0eb23e0326b77f92b6c5be43MD51metadata only access2023JulianPoveda.pdf2023JulianPoveda.pdfTrabajo de Gradoapplication/pdf656037https://repository.usta.edu.co/bitstream/11634/51066/2/2023JulianPoveda.pdff4608acb5919ef3a6a4a9fd0ef893edeMD52open accessCarta derechos de autor.pdfCarta derechos de autor.pdfCarta derechos de autorapplication/pdf938513https://repository.usta.edu.co/bitstream/11634/51066/3/Carta%20derechos%20de%20autor.pdfe9a8262fa2049a208a48016271e930ebMD53metadata only accessCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repository.usta.edu.co/bitstream/11634/51066/4/license_rdf217700a34da79ed616c2feb68d4c5e06MD54open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8807https://repository.usta.edu.co/bitstream/11634/51066/5/license.txtaedeaf396fcd827b537c73d23464fc27MD55open accessTHUMBNAILCarta_aprobacion_facultad_2021 (1).pdf.jpgCarta_aprobacion_facultad_2021 (1).pdf.jpgIM Thumbnailimage/jpeg6582https://repository.usta.edu.co/bitstream/11634/51066/6/Carta_aprobacion_facultad_2021%20%281%29.pdf.jpge73880216a7bc511726d3734b1448a06MD56open access2023JulianPoveda.pdf.jpg2023JulianPoveda.pdf.jpgIM Thumbnailimage/jpeg6156https://repository.usta.edu.co/bitstream/11634/51066/7/2023JulianPoveda.pdf.jpg8abc6bc251c215a3d3940513e5b36041MD57open accessCarta derechos de autor.pdf.jpgCarta derechos de autor.pdf.jpgIM Thumbnailimage/jpeg7879https://repository.usta.edu.co/bitstream/11634/51066/8/Carta%20derechos%20de%20autor.pdf.jpgfc6007581bf003ddd3189d6ab99fc768MD58open access11634/51066oai:repository.usta.edu.co:11634/510662023-07-07 03:09:24.952metadata only accessRepositorio Universidad Santo Tomásrepositorio@usantotomas.edu.coQXV0b3Jpem8gYWwgQ2VudHJvIGRlIFJlY3Vyc29zIHBhcmEgZWwgQXByZW5kaXphamUgeSBsYSBJbnZlc3RpZ2FjacOzbiwgQ1JBSS1VU1RBCmRlIGxhIFVuaXZlcnNpZGFkIFNhbnRvIFRvbcOhcywgcGFyYSBxdWUgY29uIGZpbmVzIGFjYWTDqW1pY29zIGFsbWFjZW5lIGxhCmluZm9ybWFjacOzbiBpbmdyZXNhZGEgcHJldmlhbWVudGUuCgpTZSBwZXJtaXRlIGxhIGNvbnN1bHRhLCByZXByb2R1Y2Npw7NuIHBhcmNpYWwsIHRvdGFsIG8gY2FtYmlvIGRlIGZvcm1hdG8gY29uCmZpbmVzIGRlIGNvbnNlcnZhY2nDs24sIGEgbG9zIHVzdWFyaW9zIGludGVyZXNhZG9zIGVuIGVsIGNvbnRlbmlkbyBkZSBlc3RlCnRyYWJham8sIHBhcmEgdG9kb3MgbG9zIHVzb3MgcXVlIHRlbmdhbiBmaW5hbGlkYWQgYWNhZMOpbWljYSwgc2llbXByZSB5IGN1YW5kbwptZWRpYW50ZSBsYSBjb3JyZXNwb25kaWVudGUgY2l0YSBiaWJsaW9ncsOhZmljYSBzZSBsZSBkw6kgY3LDqWRpdG8gYWwgdHJhYmFqbyBkZQpncmFkbyB5IGEgc3UgYXV0b3IuIERlIGNvbmZvcm1pZGFkIGNvbiBsbyBlc3RhYmxlY2lkbyBlbiBlbCBhcnTDrWN1bG8gMzAgZGUgbGEKTGV5IDIzIGRlIDE5ODIgeSBlbCBhcnTDrWN1bG8gMTEgZGUgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5Mywg4oCcTG9zIGRlcmVjaG9zCm1vcmFsZXMgc29icmUgZWwgdHJhYmFqbyBzb24gcHJvcGllZGFkIGRlIGxvcyBhdXRvcmVz4oCdLCBsb3MgY3VhbGVzIHNvbgppcnJlbnVuY2lhYmxlcywgaW1wcmVzY3JpcHRpYmxlcywgaW5lbWJhcmdhYmxlcyBlIGluYWxpZW5hYmxlcy4K