Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa

El web scraping es una técnica que se usa para recopilar datos en Internet y almacenarlos en una base de datos. Ese proceso se usa, entre otras cosas, para entrenar modelos de inteligencia artificial generativa y ha generado controversia alrededor del mundo debido a sus riesgos legales. En este artí...

Full description

Autores:
Pacheco Chaparro , Juan Manuel
Barrero Ramírez, Laura
Tipo de recurso:
Article of journal
Fecha de publicación:
2024
Institución:
Universidad Externado de Colombia
Repositorio:
Biblioteca Digital Universidad Externado de Colombia
Idioma:
spa
OAI Identifier:
oai:bdigital.uexternado.edu.co:001/26285
Acceso en línea:
https://bdigital.uexternado.edu.co/handle/001/26285
https://doi.org/10.18601/16571959.n38.07
Palabra clave:
Data,
Web Scraping,
Artificial Intelligence,
Terms of Service (ToS),
Privacy,
Intellectual Property,
Public Domain
datos,
web scraping,
inteligencia artificial,
términos de servicio (ToS),
privacidad,
propiedad intelectual,
dominio público
Rights
openAccess
License
Juan Manuel Pacheco Chaparro , Laura Barrero Ramírez - 2024
id uexternad2_f990e0289be26bff31a681a570afe1a0
oai_identifier_str oai:bdigital.uexternado.edu.co:001/26285
network_acronym_str uexternad2
network_name_str Biblioteca Digital Universidad Externado de Colombia
repository_id_str
dc.title.spa.fl_str_mv Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
dc.title.translated.eng.fl_str_mv Legal implications of web scraping in the training of generative artificial intelligence models
title Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
spellingShingle Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
Data,
Web Scraping,
Artificial Intelligence,
Terms of Service (ToS),
Privacy,
Intellectual Property,
Public Domain
datos,
web scraping,
inteligencia artificial,
términos de servicio (ToS),
privacidad,
propiedad intelectual,
dominio público
title_short Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
title_full Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
title_fullStr Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
title_full_unstemmed Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
title_sort Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa
dc.creator.fl_str_mv Pacheco Chaparro , Juan Manuel
Barrero Ramírez, Laura
dc.contributor.author.spa.fl_str_mv Pacheco Chaparro , Juan Manuel
Barrero Ramírez, Laura
dc.subject.eng.fl_str_mv Data,
Web Scraping,
Artificial Intelligence,
Terms of Service (ToS),
Privacy,
Intellectual Property,
Public Domain
topic Data,
Web Scraping,
Artificial Intelligence,
Terms of Service (ToS),
Privacy,
Intellectual Property,
Public Domain
datos,
web scraping,
inteligencia artificial,
términos de servicio (ToS),
privacidad,
propiedad intelectual,
dominio público
dc.subject.spa.fl_str_mv datos,
web scraping,
inteligencia artificial,
términos de servicio (ToS),
privacidad,
propiedad intelectual,
dominio público
description El web scraping es una técnica que se usa para recopilar datos en Internet y almacenarlos en una base de datos. Ese proceso se usa, entre otras cosas, para entrenar modelos de inteligencia artificial generativa y ha generado controversia alrededor del mundo debido a sus riesgos legales. En este artículo se analizará la viabilidad legal del uso de técnicas de web scraping y se abordarán tensiones relacionadas con asuntos contractuales de los términos de servicio de las páginas web, los riesgos legales que se desprenden de estas técnicas y, en particular, del uso de obras protegidas en el entrenamiento de modelos de inteligencia artificial generativa, de protección de datos personales y de implicaciones penales; las licencias open source, open access y de Creative Commons, así como también los datos de dominio público y en cabeza del Estado colombiano. Este artículo pretende ser un marco teórico inicial para la discusión del web scraping en modelos de inteligencia artificial generativa, dado que, a la fecha de elaboración de este artículo, el desarrollo normativo y jurisprudencial sobre este tema es aún incipiente.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-08-02T11:43:22Z
2025-04-09T19:13:25Z
dc.date.available.none.fl_str_mv 2024-08-02T11:43:22Z
2025-04-09T19:13:25Z
dc.date.issued.none.fl_str_mv 2024-08-02
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.local.eng.fl_str_mv Journal article
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ARTREF
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.doi.none.fl_str_mv 10.18601/16571959.n38.07
dc.identifier.eissn.none.fl_str_mv 2346-2116
dc.identifier.issn.none.fl_str_mv 1657-1959
dc.identifier.uri.none.fl_str_mv https://bdigital.uexternado.edu.co/handle/001/26285
dc.identifier.url.none.fl_str_mv https://doi.org/10.18601/16571959.n38.07
identifier_str_mv 10.18601/16571959.n38.07
2346-2116
1657-1959
url https://bdigital.uexternado.edu.co/handle/001/26285
https://doi.org/10.18601/16571959.n38.07
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.bitstream.none.fl_str_mv https://revistas.uexternado.edu.co/index.php/propin/article/download/9706/16869
https://revistas.uexternado.edu.co/index.php/propin/article/download/9706/16870
dc.relation.citationedition.spa.fl_str_mv Núm. 38 , Año 2024 : Julio-Diciembre
dc.relation.citationendpage.none.fl_str_mv 189
dc.relation.citationissue.spa.fl_str_mv 38
dc.relation.citationstartpage.none.fl_str_mv 167
dc.relation.ispartofjournal.spa.fl_str_mv Revista La Propiedad Inmaterial
dc.relation.references.spa.fl_str_mv Andersen v. Stability AI Ltd, U.S. District Court for the Northern District of California, n.° 3:23-cv-00201.
Associated Press. “AP, OpenAI agree to share select news content and technology in new collaboration”. Comunicado de prensa. 2023.
Bale, Ajay, Naveen Ghorpade, S. S. Rohith Kamalesh, R. Rohith y S. Rohan. “Web Scraping Approaches and their Performance on Modern Websites”. Coimbatore, India: Proceedings of the Third International Conference on Electronics and Sustainable Communication Systems, 2022.
Brittain, Blake. “Lawsuits accuse AI content creators of misusing copyrighted work”. Reuters, 2023.
Brittain, Blake. “OpenAI hit with new lawsuits from news outlets over AI training”. 2024.
Centro Nacional de Desarrollo Curricular en Sistemas no Propietarios. “Las licencias Creative Commons: qué son, por qué utilizarlas y cómo hacerlo”. 2021.
Concord Music Group Inc v. Anthropic PBC, U.S. District Court for the Middle District of Tennessee, n.° 3:23-cv-01092.
Corte Constitucional. Sentencia SU139 de 2021, 14 de mayo de 2021, M.P. Jorge Enrique Ibáñez Najar.
Corte Constitucional. Sentencia T-020 de 2014, 27 de enero de 2014. M.P. Luis Guillermo Guerrero Pérez. Creative Commons. “CC0”.
Creative Commons. “Who we are”.
David, Emilia. “Microsoft invokes VCRs in motion to dismiss the New York Times’ AI lawsuit”. 2024.
De Frutos, Rahn. “Excepciones y limitaciones al derecho de autor en Colombia: propuestas legislativas”. 2014.
Dirección Nacional de Derechos de Autor. Resolución 11 de 2017.
Doe et al v. GitHub, Inc. et al, U.S. District Court for the Northern District of California, n.° 4:22-cv-06823 (N.D. Cal. Nov 03, 2022).
Hacker, Philipp. “A legal framework for AI training data—from firs tprinciples to the Artificial Intelligence Act”. 2020.
hiQ Labs, Inc. v. LinkedIn Corporation, U.S. Court of Appeals for the Ninth Circuit.
Kroto, Vlad, Leigh Redd y Leiser Silva. “Tutorial: Legality and Ethics of Web Scraping”. Communications of the Association for Information Systems, 2020.
Lofti, Chaimaa, Swetha Srinivasan, Myriam Ertz y Imen Latrous. Web scraping techniques and applications: A literature review. SCRS Conference Proceedings on Intelligent Systems, pp. 381-394.
Margini, Thomas y Diane Peters. “Creative Commons Licenses: Empowering Open Access”. 2016.
Meta Platforms, Inc. v. Bright Data Ltd., U.S. District Court for the Northern District of California, n.° 3:23-cv-00077-EMC.
Metke, Ricardo. Lecciones de propiedad industrial (III). Baker & McKenzie, 2006.
Nazemian et al v Nvidia Corp, U.S. District Court, Northern District of California, n.° 24-01454.
New York Times Co v Microsoft Corp et al, U.S. District Court for the Southern District of New York, n.° 23-11195.
OpenAI. “GPT-4 Technical Report”. Computation and Language (cs.CL). Nueva York: Cornell University, 2023. DOI: arXiv:2303.08774 [cs.CL]. OpenAI. “GPTBot”. 2023.
Opendatasoft. “Open Data”.
Opendatasoft. “What is open data - Practical Guide”.
Open Knowledge foundation. “What is Open Data?”.
Originality.ai. “Websites that have blocked OpenAI’s GPTBot CCBot Anthropic Google Extended - 1000 Website Study”. 2024.
Patern, Tatjana y Layna Deneen. “AI Threats Emerge in Music Publishers’ Battle with Big Tech”. 2024.
Perez, Sarah. “Court rules in favor of a web scraper, Bright Data, which Meta had used and then sued”. TechCrunch. 2024.
Perez, Sarah. “Meta drops lawsuit against web-scraping firm Bright Data that sold millions of Instagram records”. TechCrunch. 2024.
Rajko M. Terzic´ y N. Majstorovic´ Milosav. “Open Data Concept, Its Application and Experiences” Belgrado, Serbia: Vojnotehnicˇki Glasnik / Military Technical Courier, 2019.
Raw Story Media v. OpenAI Inc, U.S. District Court for the Southern District of New York, No. 1:24-cv-01514
Ríos Ruiz, W. R. “Aspectos legales del software libre o de código abierto (open source)”. Revista la Propiedad Inmaterial, (2003), 41-60.
Rubin, Aaron y Jackie Li. “Court discovers rare and elusive ‘enforceable browsewrap’”. JDSupra. 2020.
Sala de Casación Penal. Corte Suprema de Justicia. Sentencia SP592-2022, 2 de marzo de 2022 M.P. Diego Eugenio Corredor Beltrán.
Sala de Casación Penal. Corte Suprema de Justicia. Sentencia SP2699-2023, 3 de agosto de 2023 M.P. Fernando León Bolaños Palacios.
Sanabria, Johan. Sector privado y libre competencia: implicaciones jurídicas del web. Bogotá: Universidad Externado de Colombia, 2021.
Schmitz, Christian. “Propiedad intelectual, dominio público y equilibrio de intereses”. Revista Chilena de Derecho 36, n.° 2 (2009).
Sellars, Andrew. Twenty Years of Web Scraping and the Computer Fraud and AbuseAct. Boston: Boston Univeristy School of Law, Scholarly Commons at Boston University School of Law.
Shutterstock. “Shutterstock expands partnership with OpenAI, signis new six-year agreement to provide high-quality training data”. Comunicado de prensa. 2023.
Shutterstock. “Shutterstock partners with OpenAI and leads the way to bring AIGenerated content to all”. Comunicado de prensa. 2022.
St. Laurent, Andrew. “Understanding Open Source and Free Software Licensing”. Sebastopol, USA: O’Reilly Media, Inc. 2004.
Stempel, Jonathan. “Nvidia is sued by authors over AI use of copyrighted works”. 2024.
Suárez, Alberto. Delitos informáticos. “Lecciones de derecho penal: parte especial”. Bogotá: Universidad Externado de Colombia, 2014.
Superintendencia de Industria y Comercio. “Protección de datos personales: aspectos prácticos sobre el derecho de hábeas data”. Superintendencia de Industria y Comercio. Resolución 58834 de 2023.
Telus International. “The essential guide to AI training data”.
The Intercept Media Inc v. OpenAI Inc, U.S. District Court for the Southern District of New York, n.° 1:24-cv-01515.
Tong, Anna, Echo Wang y Martin Coulter. “Exclusive: Reddit in AI content licensing deal with Google”. Reuters. 2024.
UNESCO. “Concepts of openness and open access”. 2015.
US. Copyright Office. “U.S. Copyright Office Fair Use Index”. 2023.
Usma, Fidel. El consentimiento en los contratos en línea B2C y su protección bajo la ley colombiana. Cuadernos de la Maestría en Derecho n.° 5. Bogotá: Universidad Sergio Arboleda.
Vincent, James. “The lawsuit that could rewrite the rules of AI copyright”. Artificial Intelligence, The Verge, 2022.
Walsh, Kat. “Understanding Cc Licenses And Generative Ai”, 2023.
Whittaker, Zack. “Web scraping is legal, US appeals court reaffirms”. TechCrunch 2022.
Zhao, Bo. “Web Scraping”. Encyclopedia of Big Data. DOI: 10.1007/978-3-319-32001-4_483-1
dc.rights.spa.fl_str_mv Juan Manuel Pacheco Chaparro , Laura Barrero Ramírez - 2024
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0
rights_invalid_str_mv Juan Manuel Pacheco Chaparro , Laura Barrero Ramírez - 2024
http://purl.org/coar/access_right/c_abf2
http://creativecommons.org/licenses/by-nc-sa/4.0
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
text/html
dc.publisher.spa.fl_str_mv Centro de Estudios de la Propiedad Intelectual
dc.source.spa.fl_str_mv https://revistas.uexternado.edu.co/index.php/propin/article/view/9706
institution Universidad Externado de Colombia
bitstream.url.fl_str_mv https://bdigital.uexternado.edu.co/bitstreams/880b336b-52b5-412f-b3fb-99d61aaf3be1/download
bitstream.checksum.fl_str_mv 8858834f65403db8684d8cf2a3cf26cd
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Universidad Externado de Colombia
repository.mail.fl_str_mv metabiblioteca@metabiblioteca.org
_version_ 1831928525696794624
spelling Pacheco Chaparro , Juan ManuelBarrero Ramírez, Laura2024-08-02T11:43:22Z2025-04-09T19:13:25Z2024-08-02T11:43:22Z2025-04-09T19:13:25Z2024-08-02El web scraping es una técnica que se usa para recopilar datos en Internet y almacenarlos en una base de datos. Ese proceso se usa, entre otras cosas, para entrenar modelos de inteligencia artificial generativa y ha generado controversia alrededor del mundo debido a sus riesgos legales. En este artículo se analizará la viabilidad legal del uso de técnicas de web scraping y se abordarán tensiones relacionadas con asuntos contractuales de los términos de servicio de las páginas web, los riesgos legales que se desprenden de estas técnicas y, en particular, del uso de obras protegidas en el entrenamiento de modelos de inteligencia artificial generativa, de protección de datos personales y de implicaciones penales; las licencias open source, open access y de Creative Commons, así como también los datos de dominio público y en cabeza del Estado colombiano. Este artículo pretende ser un marco teórico inicial para la discusión del web scraping en modelos de inteligencia artificial generativa, dado que, a la fecha de elaboración de este artículo, el desarrollo normativo y jurisprudencial sobre este tema es aún incipiente.Web scraping is a technique used to collect data on the Internet and record it in a database. This process is used, among other things, to train generative artificial intelligence models, and has generated worldwide controversy due to its legal risks. This article will analyze the legal viability of the use of web scraping techniques and will address tensions related to contractual issues in the terms of service of web pages; legal risks arising from web scraping, and in particular the use of protected works in the training of generative artificial intelligence models, personal data protection, and criminal implications; open source, open access, and Creative Commons licenses, as well as public domain data and data held by the Colombian State. This article aims to be an initial theoretical framework for the discussion of web scraping in generative artificial intelligence models, given that at the time of writing this article, the regulatory and jurisprudential development on this topic is still incipient.application/pdftext/html10.18601/16571959.n38.072346-21161657-1959https://bdigital.uexternado.edu.co/handle/001/26285https://doi.org/10.18601/16571959.n38.07spaCentro de Estudios de la Propiedad Intelectualhttps://revistas.uexternado.edu.co/index.php/propin/article/download/9706/16869https://revistas.uexternado.edu.co/index.php/propin/article/download/9706/16870Núm. 38 , Año 2024 : Julio-Diciembre18938167Revista La Propiedad InmaterialAndersen v. Stability AI Ltd, U.S. District Court for the Northern District of California, n.° 3:23-cv-00201.Associated Press. “AP, OpenAI agree to share select news content and technology in new collaboration”. Comunicado de prensa. 2023.Bale, Ajay, Naveen Ghorpade, S. S. Rohith Kamalesh, R. Rohith y S. Rohan. “Web Scraping Approaches and their Performance on Modern Websites”. Coimbatore, India: Proceedings of the Third International Conference on Electronics and Sustainable Communication Systems, 2022.Brittain, Blake. “Lawsuits accuse AI content creators of misusing copyrighted work”. Reuters, 2023.Brittain, Blake. “OpenAI hit with new lawsuits from news outlets over AI training”. 2024.Centro Nacional de Desarrollo Curricular en Sistemas no Propietarios. “Las licencias Creative Commons: qué son, por qué utilizarlas y cómo hacerlo”. 2021.Concord Music Group Inc v. Anthropic PBC, U.S. District Court for the Middle District of Tennessee, n.° 3:23-cv-01092.Corte Constitucional. Sentencia SU139 de 2021, 14 de mayo de 2021, M.P. Jorge Enrique Ibáñez Najar.Corte Constitucional. Sentencia T-020 de 2014, 27 de enero de 2014. M.P. Luis Guillermo Guerrero Pérez. Creative Commons. “CC0”.Creative Commons. “Who we are”.David, Emilia. “Microsoft invokes VCRs in motion to dismiss the New York Times’ AI lawsuit”. 2024.De Frutos, Rahn. “Excepciones y limitaciones al derecho de autor en Colombia: propuestas legislativas”. 2014.Dirección Nacional de Derechos de Autor. Resolución 11 de 2017.Doe et al v. GitHub, Inc. et al, U.S. District Court for the Northern District of California, n.° 4:22-cv-06823 (N.D. Cal. Nov 03, 2022).Hacker, Philipp. “A legal framework for AI training data—from firs tprinciples to the Artificial Intelligence Act”. 2020.hiQ Labs, Inc. v. LinkedIn Corporation, U.S. Court of Appeals for the Ninth Circuit.Kroto, Vlad, Leigh Redd y Leiser Silva. “Tutorial: Legality and Ethics of Web Scraping”. Communications of the Association for Information Systems, 2020.Lofti, Chaimaa, Swetha Srinivasan, Myriam Ertz y Imen Latrous. Web scraping techniques and applications: A literature review. SCRS Conference Proceedings on Intelligent Systems, pp. 381-394.Margini, Thomas y Diane Peters. “Creative Commons Licenses: Empowering Open Access”. 2016.Meta Platforms, Inc. v. Bright Data Ltd., U.S. District Court for the Northern District of California, n.° 3:23-cv-00077-EMC.Metke, Ricardo. Lecciones de propiedad industrial (III). Baker & McKenzie, 2006.Nazemian et al v Nvidia Corp, U.S. District Court, Northern District of California, n.° 24-01454.New York Times Co v Microsoft Corp et al, U.S. District Court for the Southern District of New York, n.° 23-11195.OpenAI. “GPT-4 Technical Report”. Computation and Language (cs.CL). Nueva York: Cornell University, 2023. DOI: arXiv:2303.08774 [cs.CL]. OpenAI. “GPTBot”. 2023.Opendatasoft. “Open Data”.Opendatasoft. “What is open data - Practical Guide”.Open Knowledge foundation. “What is Open Data?”.Originality.ai. “Websites that have blocked OpenAI’s GPTBot CCBot Anthropic Google Extended - 1000 Website Study”. 2024.Patern, Tatjana y Layna Deneen. “AI Threats Emerge in Music Publishers’ Battle with Big Tech”. 2024.Perez, Sarah. “Court rules in favor of a web scraper, Bright Data, which Meta had used and then sued”. TechCrunch. 2024.Perez, Sarah. “Meta drops lawsuit against web-scraping firm Bright Data that sold millions of Instagram records”. TechCrunch. 2024.Rajko M. Terzic´ y N. Majstorovic´ Milosav. “Open Data Concept, Its Application and Experiences” Belgrado, Serbia: Vojnotehnicˇki Glasnik / Military Technical Courier, 2019.Raw Story Media v. OpenAI Inc, U.S. District Court for the Southern District of New York, No. 1:24-cv-01514Ríos Ruiz, W. R. “Aspectos legales del software libre o de código abierto (open source)”. Revista la Propiedad Inmaterial, (2003), 41-60.Rubin, Aaron y Jackie Li. “Court discovers rare and elusive ‘enforceable browsewrap’”. JDSupra. 2020.Sala de Casación Penal. Corte Suprema de Justicia. Sentencia SP592-2022, 2 de marzo de 2022 M.P. Diego Eugenio Corredor Beltrán.Sala de Casación Penal. Corte Suprema de Justicia. Sentencia SP2699-2023, 3 de agosto de 2023 M.P. Fernando León Bolaños Palacios.Sanabria, Johan. Sector privado y libre competencia: implicaciones jurídicas del web. Bogotá: Universidad Externado de Colombia, 2021.Schmitz, Christian. “Propiedad intelectual, dominio público y equilibrio de intereses”. Revista Chilena de Derecho 36, n.° 2 (2009).Sellars, Andrew. Twenty Years of Web Scraping and the Computer Fraud and AbuseAct. Boston: Boston Univeristy School of Law, Scholarly Commons at Boston University School of Law.Shutterstock. “Shutterstock expands partnership with OpenAI, signis new six-year agreement to provide high-quality training data”. Comunicado de prensa. 2023.Shutterstock. “Shutterstock partners with OpenAI and leads the way to bring AIGenerated content to all”. Comunicado de prensa. 2022.St. Laurent, Andrew. “Understanding Open Source and Free Software Licensing”. Sebastopol, USA: O’Reilly Media, Inc. 2004.Stempel, Jonathan. “Nvidia is sued by authors over AI use of copyrighted works”. 2024.Suárez, Alberto. Delitos informáticos. “Lecciones de derecho penal: parte especial”. Bogotá: Universidad Externado de Colombia, 2014.Superintendencia de Industria y Comercio. “Protección de datos personales: aspectos prácticos sobre el derecho de hábeas data”. Superintendencia de Industria y Comercio. Resolución 58834 de 2023.Telus International. “The essential guide to AI training data”.The Intercept Media Inc v. OpenAI Inc, U.S. District Court for the Southern District of New York, n.° 1:24-cv-01515.Tong, Anna, Echo Wang y Martin Coulter. “Exclusive: Reddit in AI content licensing deal with Google”. Reuters. 2024.UNESCO. “Concepts of openness and open access”. 2015.US. Copyright Office. “U.S. Copyright Office Fair Use Index”. 2023.Usma, Fidel. El consentimiento en los contratos en línea B2C y su protección bajo la ley colombiana. Cuadernos de la Maestría en Derecho n.° 5. Bogotá: Universidad Sergio Arboleda.Vincent, James. “The lawsuit that could rewrite the rules of AI copyright”. Artificial Intelligence, The Verge, 2022.Walsh, Kat. “Understanding Cc Licenses And Generative Ai”, 2023.Whittaker, Zack. “Web scraping is legal, US appeals court reaffirms”. TechCrunch 2022.Zhao, Bo. “Web Scraping”. Encyclopedia of Big Data. DOI: 10.1007/978-3-319-32001-4_483-1Juan Manuel Pacheco Chaparro , Laura Barrero Ramírez - 2024info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.http://creativecommons.org/licenses/by-nc-sa/4.0https://revistas.uexternado.edu.co/index.php/propin/article/view/9706Data,Web Scraping,Artificial Intelligence,Terms of Service (ToS),Privacy,Intellectual Property,Public Domaindatos,web scraping,inteligencia artificial,términos de servicio (ToS),privacidad,propiedad intelectual,dominio públicoImplicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativaLegal implications of web scraping in the training of generative artificial intelligence modelsArtículo de revistahttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Textinfo:eu-repo/semantics/articleJournal articlehttp://purl.org/redcol/resource_type/ARTREFinfo:eu-repo/semantics/publishedVersionPublicationOREORE.xmltext/xml2668https://bdigital.uexternado.edu.co/bitstreams/880b336b-52b5-412f-b3fb-99d61aaf3be1/download8858834f65403db8684d8cf2a3cf26cdMD51001/26285oai:bdigital.uexternado.edu.co:001/262852025-04-09 14:13:25.794http://creativecommons.org/licenses/by-nc-sa/4.0Juan Manuel Pacheco Chaparro , Laura Barrero Ramírez - 2024https://bdigital.uexternado.edu.coUniversidad Externado de Colombiametabiblioteca@metabiblioteca.org