Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
Objetivo— Desarrollar un modelo de búsqueda de sentencias judiciales soportado en procesamiento del lenguaje natural que permita analizar el texto de las sentencias jurisprudenciales. Adicionalmente, se usa link-data con el propósito de aprovechar la interrelación del contenido en las sentencias jud...
- Autores:
-
Ordoñez, Hugo Armando
Ordoñez, Cristian Camilo
Ordoñez, Jose Armando
Arturo Urbano, Franco
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2020
- Institución:
- Corporación Universidad de la Costa
- Repositorio:
- REDICUC - Repositorio CUC
- Idioma:
- eng
- OAI Identifier:
- oai:repositorio.cuc.edu.co:11323/12312
- Palabra clave:
- jurisprudence
retrieval
natural language
processing
system evaluation
automated summary
procesamiento de lenguaje natural judicial
resumen automatizado
recuperación de documentos judiciales
evaluación del sistema
- Rights
- openAccess
- License
- INGE CUC - 2020
id |
RCUC2_902eb57e71ef2b7f030219e0633f8958 |
---|---|
oai_identifier_str |
oai:repositorio.cuc.edu.co:11323/12312 |
network_acronym_str |
RCUC2 |
network_name_str |
REDICUC - Repositorio CUC |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data |
dc.title.translated.eng.fl_str_mv |
Jurisprudence search in Colombia based on natural language processing (NLP) and Linked Data |
title |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data |
spellingShingle |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data jurisprudence retrieval natural language processing system evaluation automated summary procesamiento de lenguaje natural judicial resumen automatizado recuperación de documentos judiciales evaluación del sistema |
title_short |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data |
title_full |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data |
title_fullStr |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data |
title_full_unstemmed |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data |
title_sort |
Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data |
dc.creator.fl_str_mv |
Ordoñez, Hugo Armando Ordoñez, Cristian Camilo Ordoñez, Jose Armando Arturo Urbano, Franco |
dc.contributor.author.spa.fl_str_mv |
Ordoñez, Hugo Armando Ordoñez, Cristian Camilo Ordoñez, Jose Armando Arturo Urbano, Franco |
dc.subject.eng.fl_str_mv |
jurisprudence retrieval natural language processing system evaluation automated summary |
topic |
jurisprudence retrieval natural language processing system evaluation automated summary procesamiento de lenguaje natural judicial resumen automatizado recuperación de documentos judiciales evaluación del sistema |
dc.subject.spa.fl_str_mv |
procesamiento de lenguaje natural judicial resumen automatizado recuperación de documentos judiciales evaluación del sistema |
description |
Objetivo— Desarrollar un modelo de búsqueda de sentencias judiciales soportado en procesamiento del lenguaje natural que permita analizar el texto de las sentencias jurisprudenciales. Adicionalmente, se usa link-data con el propósito de aprovechar la interrelación del contenido en las sentencias judiciales relacionadas y mejorar los procesos de búsqueda. Metodología— El modelo de búsqueda se desarrolló en dos fases: la primera es la fase de entrenamiento para generar los modelos requeridos para crear un índice, y en segundo lugar, una fase de búsqueda donde el usuario ingresa una cadena de búsqueda y se utiliza el índice creado en la fase anterior para encontrar los documentos (sentencias judiciales) relacionados con de búsqueda. Se realizó una comparación con otros buscadores existentes de la Corte Suprema de Justicia de Colombia. La evaluación se dividió en 2 pasos. 1) Evaluación de los resultados obtenidos en cada búsqueda, 2) Satisfacción del usuario ante los resultados obtenidos en las búsquedas. Resultados— La plataforma desarrollada supera al sistema de búsqueda existente del tribunal en cuanto a satisfacción y precisión del usuario. Conclusiones— El diseño e implementación del modelo de búsqueda de sentencias judiciales basada en Procesamiento del Lenguaje Natural (PNL) y linked data contribuyó a mejorar la experiencia del usuario y la precisión de la búsqueda de sentencias judiciales. |
publishDate |
2020 |
dc.date.accessioned.none.fl_str_mv |
2020-04-30 00:00:00 2024-04-09T20:21:27Z |
dc.date.available.none.fl_str_mv |
2020-04-30 00:00:00 2024-04-09T20:21:27Z |
dc.date.issued.none.fl_str_mv |
2020-04-30 |
dc.type.spa.fl_str_mv |
Artículo de revista |
dc.type.coar.eng.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 http://purl.org/coar/resource_type/c_2df8fbb1 |
dc.type.content.eng.fl_str_mv |
Text |
dc.type.driver.eng.fl_str_mv |
info:eu-repo/semantics/article |
dc.type.local.eng.fl_str_mv |
Journal article |
dc.type.redcol.eng.fl_str_mv |
http://purl.org/redcol/resource_type/ART |
dc.type.version.eng.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.coarversion.eng.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
format |
http://purl.org/coar/resource_type/c_6501 |
status_str |
publishedVersion |
dc.identifier.issn.none.fl_str_mv |
0122-6517 |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/11323/12312 |
dc.identifier.url.none.fl_str_mv |
https://doi.org/10.17981/ingecuc.16.2.2020.22 |
dc.identifier.doi.none.fl_str_mv |
10.17981/ingecuc.16.2.2020.22 |
dc.identifier.eissn.none.fl_str_mv |
2382-4700 |
identifier_str_mv |
0122-6517 10.17981/ingecuc.16.2.2020.22 2382-4700 |
url |
https://hdl.handle.net/11323/12312 https://doi.org/10.17981/ingecuc.16.2.2020.22 |
dc.language.iso.eng.fl_str_mv |
eng |
language |
eng |
dc.relation.ispartofjournal.spa.fl_str_mv |
Inge Cuc |
dc.relation.references.eng.fl_str_mv |
M. V. Gaviria, “Aproximaciones a la historia del derecho en Colombia,” Hist Soc, no. 22, pp. 131–156, 2012. Disponible en https://revistas.unal.edu.co/index.php/hisysoc/article/view/32363 M. R. Segura, “Precedente jurisprudencial vs unificación jurisprudencial,” ensayo inédito, Bog, CO: UniLibre, 2011. República de Colombia. “Sistema de Consulta de Jurisprudencia.” Portal Rama Judicial del Poder Público. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/consulta/index.xhtml. (accedido en 2011) República de Colombia. “Sistema de Consulta de Jurisprudencia,” Portal Consejo de Estado. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/ce/index.html. (accedido en 2015) J. B. Vallet, “El razonamiento Judicial,” An Fund Fco Elías Tejada, no. 15, pp. 15–28, 2009. Recuperado de http://fundacioneliasdetejada.org/wp-content/uploads/2014/03/ANA15-015-028.pdf A. Wyner, R. Mochales-Palau, M.-F. Moens & D. Milward, “Approaches to Text Mining Arguments from Legal Cases,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 60–79. https://doi.org/10.1007/978-3-642-12837-0_4 G. Venturi, “Legal Language and Legal Knowledge Management Applications,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 3–26. https://doi.org/10.1007/978-3-642-12837-0_1 L. O. de Colla & V. L. S. de Lima, “Clustering and Categorization of Brazilian Portuguese Legal Documents,” presented Computational Processing of the Portuguese Language, PROPOR 2012, Coi, PT, Apr. 17-20, 2012, pp. 272–283. https://doi.org/10.1007/978-3-642-28885-2_31 N. Zong, S. Lee, J. Ahn & H. G. Kim, “Supporting inter-topic entity search for biomedical Linked Data based on heterogeneous relationships,” Comput Biol Med, vol. 87, no. 1, Dec. 2016, pp. 217–229, 2017. http://dx.doi.org/10.1016/j.compbiomed.2017.05.026 A. J. C. Trappey, C. V. Trappey, J.-L. Wu & J. W. C. Wang, “Intelligent compilation of patent summaries using machine learning and natural language processing techniques,” Adv Eng Informatics, vol. 43, no. 1, 101027, Jan. 2020. http://dx.doi.org/10.1016/j.aei.2019.101027 R. Kumar & K. Raghuveer, “Legal Documents Clustering using Latent Dirichlet Allocation,” IJAIS, vol. 2, no. 6, pp. 27–33, May. 2012. Available from https://research.ijais.org/volume2/number6/ijais12-450384.pdf G. Li, Z. Wang & Y. Ma, “Combining Domain Knowledge Extraction With Graph Long Short-Term Memory for Learning Classification of Chinese Legal Documents,” IEEE Access, vol. 7, pp. 139616–139627, Oct. 2019. http://dx.doi.org/10.1109/ACCESS.2019.2943668 C. C. Ordoñez, E. Anchico, A. Ordóñez, C. Méndez & H. A. Ordoñez, “Sistema de Indexación de documentos Jurisprudenciales soportado en Inteligencia Artificial,” Risti, vol. E22, no. E22, pp. 41–52, 2019. Available from http://www.risti.xyz/issues/ristie22.pdf K. Singh, I. Lytra, A. S. Radhakrishna, S. Shekarpour, M. E. Vidal & J. Lehmann, “No one is perfect: Analysing the performance of question answering components over the DBpedia knowledge graph,” JWS, vol. 65, pp. 1–12, 2020. http://dx.doi.org/10.1016/j.websem.2020.100594 V. N. Gudivada & K. Arbabifard, “Open-Source Libraries, Application Frameworks, and Workflow Systems for NLP,” in Handbook of Statistics. AMS, NL: Elsevier, 2018, pp. 31–50. https://doi.org/10.1016/bs.host.2018.07.007 P. N. Mendes, M. Jakob, A. García-Silva & C. Bizer, “DBpedia spotlight: shedding light on the web of documents,” presented 7th International Conference on Semantic Systems, I-SEMANTICS 2011, GRZ, AUT, 7-9 Sept. 2011, pp. 1–8. http://dx.doi.org/10.1145/2063518.2063519 C. Bizer, T. Heath & T. Berners-Lee, “Linked Data - The Story So Far,” IJSWIS, vol. 5, no. 3, pp. 1–22, 2009. http://dx.doi.org/10.4018/jswis.2009081901 O. Rodríguez, I. Vagliano, C. Figueroa, F. Cairo, G. Futia, C. A. Licciardi, M. Marengo & F. Morando, “Semantic Annotation and Classification in Practice,” IT Prof., vol. 17, no. 2, pp. 33–39, 2015. http://dx.doi.org/10.1109/MITP.2015.29 C. D. Manning, P. Raghavan & H. Schutze, Introduction to Information Retrieval. CBG, USA: Cambridge Univ Press, 2008. R. Baeza-Yates & B. Ribeiro-Neto, Modern information retrieval. NY, USA: Addison-Wesley Professional, 1999. |
dc.relation.citationendpage.none.fl_str_mv |
284 |
dc.relation.citationstartpage.none.fl_str_mv |
277 |
dc.relation.citationissue.spa.fl_str_mv |
2 |
dc.relation.citationvolume.spa.fl_str_mv |
16 |
dc.relation.bitstream.none.fl_str_mv |
https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3054 https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3547 https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3576 |
dc.relation.citationedition.spa.fl_str_mv |
Núm. 2 , Año 2020 : (Julio-Diciembre) |
dc.rights.eng.fl_str_mv |
INGE CUC - 2020 |
dc.rights.uri.eng.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0 |
dc.rights.accessrights.eng.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.coar.eng.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
INGE CUC - 2020 http://creativecommons.org/licenses/by-nc-nd/4.0 http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.eng.fl_str_mv |
application/pdf text/html application/xml |
dc.publisher.spa.fl_str_mv |
Universidad de la Costa |
dc.source.eng.fl_str_mv |
https://revistascientificas.cuc.edu.co/ingecuc/article/view/3317 |
institution |
Corporación Universidad de la Costa |
bitstream.url.fl_str_mv |
https://repositorio.cuc.edu.co/bitstreams/67d16816-75e7-4c80-a389-39adf31a2090/download |
bitstream.checksum.fl_str_mv |
82fd0311563393d35dee6d1b85fcaffb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositorio de la Universidad de la Costa CUC |
repository.mail.fl_str_mv |
repdigital@cuc.edu.co |
_version_ |
1811760684270092288 |
spelling |
Ordoñez, Hugo ArmandoOrdoñez, Cristian CamiloOrdoñez, Jose ArmandoArturo Urbano, Franco2020-04-30 00:00:002024-04-09T20:21:27Z2020-04-30 00:00:002024-04-09T20:21:27Z2020-04-300122-6517https://hdl.handle.net/11323/12312https://doi.org/10.17981/ingecuc.16.2.2020.2210.17981/ingecuc.16.2.2020.222382-4700Objetivo— Desarrollar un modelo de búsqueda de sentencias judiciales soportado en procesamiento del lenguaje natural que permita analizar el texto de las sentencias jurisprudenciales. Adicionalmente, se usa link-data con el propósito de aprovechar la interrelación del contenido en las sentencias judiciales relacionadas y mejorar los procesos de búsqueda. Metodología— El modelo de búsqueda se desarrolló en dos fases: la primera es la fase de entrenamiento para generar los modelos requeridos para crear un índice, y en segundo lugar, una fase de búsqueda donde el usuario ingresa una cadena de búsqueda y se utiliza el índice creado en la fase anterior para encontrar los documentos (sentencias judiciales) relacionados con de búsqueda. Se realizó una comparación con otros buscadores existentes de la Corte Suprema de Justicia de Colombia. La evaluación se dividió en 2 pasos. 1) Evaluación de los resultados obtenidos en cada búsqueda, 2) Satisfacción del usuario ante los resultados obtenidos en las búsquedas. Resultados— La plataforma desarrollada supera al sistema de búsqueda existente del tribunal en cuanto a satisfacción y precisión del usuario. Conclusiones— El diseño e implementación del modelo de búsqueda de sentencias judiciales basada en Procesamiento del Lenguaje Natural (PNL) y linked data contribuyó a mejorar la experiencia del usuario y la precisión de la búsqueda de sentencias judiciales.Objective— To develop a search model for judicial decisions supported by natural language processing that allows analyzing the text of jurisprudential sentences. Additionally, link-data is used to take advantage of the interrelation of content in related court decisions and improve search processes. Methodology— The search model was built in two phases: the first is the training phase to generate the models required to create an index, and second, a search phase where the user enters a search string that is used to find the documents (court decisions) more related to the search. The model was compared with other existing search engines of the Supreme Court of Justice of Colombia. The evaluation was divided into 2 steps. 1) Evaluation of the results obtained in each search, 2) User satisfaction with the results obtained in the searches solution. Results— The developed platform outperforms the existing search system of the court regarding user satisfaction and precision. Conclusions— The designed model for judicial sentences based on Natural Language Processing (NLP) and linked contributes to improving the user experience and the precision of the jurisprudence search.application/pdftext/htmlapplication/xmlengUniversidad de la CostaINGE CUC - 2020http://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessEsta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.http://purl.org/coar/access_right/c_abf2https://revistascientificas.cuc.edu.co/ingecuc/article/view/3317jurisprudenceretrievalnatural languageprocessingsystem evaluationautomated summaryprocesamiento de lenguaje natural judicialresumen automatizadorecuperación de documentos judicialesevaluación del sistemaBúsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked DataJurisprudence search in Colombia based on natural language processing (NLP) and Linked DataArtículo de revistahttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1Textinfo:eu-repo/semantics/articleJournal articlehttp://purl.org/redcol/resource_type/ARTinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/version/c_970fb48d4fbd8a85Inge Cuc M. V. Gaviria, “Aproximaciones a la historia del derecho en Colombia,” Hist Soc, no. 22, pp. 131–156, 2012. Disponible en https://revistas.unal.edu.co/index.php/hisysoc/article/view/32363 M. R. Segura, “Precedente jurisprudencial vs unificación jurisprudencial,” ensayo inédito, Bog, CO: UniLibre, 2011. República de Colombia. “Sistema de Consulta de Jurisprudencia.” Portal Rama Judicial del Poder Público. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/consulta/index.xhtml. (accedido en 2011) República de Colombia. “Sistema de Consulta de Jurisprudencia,” Portal Consejo de Estado. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/ce/index.html. (accedido en 2015) J. B. Vallet, “El razonamiento Judicial,” An Fund Fco Elías Tejada, no. 15, pp. 15–28, 2009. Recuperado de http://fundacioneliasdetejada.org/wp-content/uploads/2014/03/ANA15-015-028.pdf A. Wyner, R. Mochales-Palau, M.-F. Moens & D. Milward, “Approaches to Text Mining Arguments from Legal Cases,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 60–79. https://doi.org/10.1007/978-3-642-12837-0_4 G. Venturi, “Legal Language and Legal Knowledge Management Applications,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 3–26. https://doi.org/10.1007/978-3-642-12837-0_1 L. O. de Colla & V. L. S. de Lima, “Clustering and Categorization of Brazilian Portuguese Legal Documents,” presented Computational Processing of the Portuguese Language, PROPOR 2012, Coi, PT, Apr. 17-20, 2012, pp. 272–283. https://doi.org/10.1007/978-3-642-28885-2_31 N. Zong, S. Lee, J. Ahn & H. G. Kim, “Supporting inter-topic entity search for biomedical Linked Data based on heterogeneous relationships,” Comput Biol Med, vol. 87, no. 1, Dec. 2016, pp. 217–229, 2017. http://dx.doi.org/10.1016/j.compbiomed.2017.05.026 A. J. C. Trappey, C. V. Trappey, J.-L. Wu & J. W. C. Wang, “Intelligent compilation of patent summaries using machine learning and natural language processing techniques,” Adv Eng Informatics, vol. 43, no. 1, 101027, Jan. 2020. http://dx.doi.org/10.1016/j.aei.2019.101027 R. Kumar & K. Raghuveer, “Legal Documents Clustering using Latent Dirichlet Allocation,” IJAIS, vol. 2, no. 6, pp. 27–33, May. 2012. Available from https://research.ijais.org/volume2/number6/ijais12-450384.pdf G. Li, Z. Wang & Y. Ma, “Combining Domain Knowledge Extraction With Graph Long Short-Term Memory for Learning Classification of Chinese Legal Documents,” IEEE Access, vol. 7, pp. 139616–139627, Oct. 2019. http://dx.doi.org/10.1109/ACCESS.2019.2943668 C. C. Ordoñez, E. Anchico, A. Ordóñez, C. Méndez & H. A. Ordoñez, “Sistema de Indexación de documentos Jurisprudenciales soportado en Inteligencia Artificial,” Risti, vol. E22, no. E22, pp. 41–52, 2019. Available from http://www.risti.xyz/issues/ristie22.pdf K. Singh, I. Lytra, A. S. Radhakrishna, S. Shekarpour, M. E. Vidal & J. Lehmann, “No one is perfect: Analysing the performance of question answering components over the DBpedia knowledge graph,” JWS, vol. 65, pp. 1–12, 2020. http://dx.doi.org/10.1016/j.websem.2020.100594 V. N. Gudivada & K. Arbabifard, “Open-Source Libraries, Application Frameworks, and Workflow Systems for NLP,” in Handbook of Statistics. AMS, NL: Elsevier, 2018, pp. 31–50. https://doi.org/10.1016/bs.host.2018.07.007 P. N. Mendes, M. Jakob, A. García-Silva & C. Bizer, “DBpedia spotlight: shedding light on the web of documents,” presented 7th International Conference on Semantic Systems, I-SEMANTICS 2011, GRZ, AUT, 7-9 Sept. 2011, pp. 1–8. http://dx.doi.org/10.1145/2063518.2063519 C. Bizer, T. Heath & T. Berners-Lee, “Linked Data - The Story So Far,” IJSWIS, vol. 5, no. 3, pp. 1–22, 2009. http://dx.doi.org/10.4018/jswis.2009081901 O. Rodríguez, I. Vagliano, C. Figueroa, F. Cairo, G. Futia, C. A. Licciardi, M. Marengo & F. Morando, “Semantic Annotation and Classification in Practice,” IT Prof., vol. 17, no. 2, pp. 33–39, 2015. http://dx.doi.org/10.1109/MITP.2015.29 C. D. Manning, P. Raghavan & H. Schutze, Introduction to Information Retrieval. CBG, USA: Cambridge Univ Press, 2008.R. Baeza-Yates & B. Ribeiro-Neto, Modern information retrieval. NY, USA: Addison-Wesley Professional, 1999.284277216https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3054https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3547https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3576Núm. 2 , Año 2020 : (Julio-Diciembre)PublicationOREORE.xmltext/xml2740https://repositorio.cuc.edu.co/bitstreams/67d16816-75e7-4c80-a389-39adf31a2090/download82fd0311563393d35dee6d1b85fcaffbMD5111323/12312oai:repositorio.cuc.edu.co:11323/123122024-09-16 16:48:18.341http://creativecommons.org/licenses/by-nc-nd/4.0INGE CUC - 2020metadata.onlyhttps://repositorio.cuc.edu.coRepositorio de la Universidad de la Costa CUCrepdigital@cuc.edu.co |