Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data

Objetivo— Desarrollar un modelo de búsqueda de sentencias judiciales soportado en procesamiento del lenguaje natural que permita analizar el texto de las sentencias jurisprudenciales. Adicionalmente, se usa link-data con el propósito de aprovechar la interrelación del contenido en las sentencias jud...

Full description

Autores:
Ordoñez, Hugo Armando
Ordoñez, Cristian Camilo
Ordoñez, Jose Armando
Arturo Urbano, Franco
Tipo de recurso:
Article of journal
Fecha de publicación:
2020
Institución:
Corporación Universidad de la Costa
Repositorio:
REDICUC - Repositorio CUC
Idioma:
eng
OAI Identifier:
oai:repositorio.cuc.edu.co:11323/12312
Acceso en línea:
https://hdl.handle.net/11323/12312
https://doi.org/10.17981/ingecuc.16.2.2020.22
Palabra clave:
jurisprudence
retrieval
natural language
processing
system evaluation
automated summary
procesamiento de lenguaje natural judicial
resumen automatizado
recuperación de documentos judiciales
evaluación del sistema
Rights
openAccess
License
INGE CUC - 2020
id RCUC2_902eb57e71ef2b7f030219e0633f8958
oai_identifier_str oai:repositorio.cuc.edu.co:11323/12312
network_acronym_str RCUC2
network_name_str REDICUC - Repositorio CUC
repository_id_str
dc.title.spa.fl_str_mv Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
dc.title.translated.eng.fl_str_mv Jurisprudence search in Colombia based on natural language processing (NLP) and Linked Data
title Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
spellingShingle Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
jurisprudence
retrieval
natural language
processing
system evaluation
automated summary
procesamiento de lenguaje natural judicial
resumen automatizado
recuperación de documentos judiciales
evaluación del sistema
title_short Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
title_full Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
title_fullStr Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
title_full_unstemmed Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
title_sort Búsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked Data
dc.creator.fl_str_mv Ordoñez, Hugo Armando
Ordoñez, Cristian Camilo
Ordoñez, Jose Armando
Arturo Urbano, Franco
dc.contributor.author.spa.fl_str_mv Ordoñez, Hugo Armando
Ordoñez, Cristian Camilo
Ordoñez, Jose Armando
Arturo Urbano, Franco
dc.subject.eng.fl_str_mv jurisprudence
retrieval
natural language
processing
system evaluation
automated summary
topic jurisprudence
retrieval
natural language
processing
system evaluation
automated summary
procesamiento de lenguaje natural judicial
resumen automatizado
recuperación de documentos judiciales
evaluación del sistema
dc.subject.spa.fl_str_mv procesamiento de lenguaje natural judicial
resumen automatizado
recuperación de documentos judiciales
evaluación del sistema
description Objetivo— Desarrollar un modelo de búsqueda de sentencias judiciales soportado en procesamiento del lenguaje natural que permita analizar el texto de las sentencias jurisprudenciales. Adicionalmente, se usa link-data con el propósito de aprovechar la interrelación del contenido en las sentencias judiciales relacionadas y mejorar los procesos de búsqueda. Metodología— El modelo de búsqueda se desarrolló en dos fases: la primera es la fase de entrenamiento para generar los modelos requeridos para crear un índice, y en segundo lugar, una fase de búsqueda donde el usuario ingresa una cadena de búsqueda y se utiliza el índice creado en la fase anterior para encontrar los documentos (sentencias judiciales) relacionados con de búsqueda. Se realizó una comparación con otros buscadores existentes de la Corte Suprema de Justicia de Colombia. La evaluación se dividió en 2 pasos. 1) Evaluación de los resultados obtenidos en cada búsqueda, 2) Satisfacción del usuario ante los resultados obtenidos en las búsquedas. Resultados— La plataforma desarrollada supera al sistema de búsqueda existente del tribunal en cuanto a satisfacción y precisión del usuario. Conclusiones— El diseño e implementación del modelo de búsqueda de sentencias judiciales basada en Procesamiento del Lenguaje Natural (PNL) y linked data contribuyó a mejorar la experiencia del usuario y la precisión de la búsqueda de sentencias judiciales.
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-04-30 00:00:00
2024-04-09T20:21:27Z
dc.date.available.none.fl_str_mv 2020-04-30 00:00:00
2024-04-09T20:21:27Z
dc.date.issued.none.fl_str_mv 2020-04-30
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.eng.fl_str_mv http://purl.org/coar/resource_type/c_6501
http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.content.eng.fl_str_mv Text
dc.type.driver.eng.fl_str_mv info:eu-repo/semantics/article
dc.type.local.eng.fl_str_mv Journal article
dc.type.redcol.eng.fl_str_mv http://purl.org/redcol/resource_type/ART
dc.type.version.eng.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coarversion.eng.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.issn.none.fl_str_mv 0122-6517
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/11323/12312
dc.identifier.url.none.fl_str_mv https://doi.org/10.17981/ingecuc.16.2.2020.22
dc.identifier.doi.none.fl_str_mv 10.17981/ingecuc.16.2.2020.22
dc.identifier.eissn.none.fl_str_mv 2382-4700
identifier_str_mv 0122-6517
10.17981/ingecuc.16.2.2020.22
2382-4700
url https://hdl.handle.net/11323/12312
https://doi.org/10.17981/ingecuc.16.2.2020.22
dc.language.iso.eng.fl_str_mv eng
language eng
dc.relation.ispartofjournal.spa.fl_str_mv Inge Cuc
dc.relation.references.eng.fl_str_mv  M. V. Gaviria, “Aproximaciones a la historia del derecho en Colombia,” Hist Soc, no. 22, pp. 131–156, 2012. Disponible en https://revistas.unal.edu.co/index.php/hisysoc/article/view/32363
 M. R. Segura, “Precedente jurisprudencial vs unificación jurisprudencial,” ensayo inédito, Bog, CO: UniLibre, 2011.
 República de Colombia. “Sistema de Consulta de Jurisprudencia.” Portal Rama Judicial del Poder Público. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/consulta/index.xhtml. (accedido en 2011)
 República de Colombia. “Sistema de Consulta de Jurisprudencia,” Portal Consejo de Estado. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/ce/index.html. (accedido en 2015)
 J. B. Vallet, “El razonamiento Judicial,” An Fund Fco Elías Tejada, no. 15, pp. 15–28, 2009. Recuperado de http://fundacioneliasdetejada.org/wp-content/uploads/2014/03/ANA15-015-028.pdf
 A. Wyner, R. Mochales-Palau, M.-F. Moens & D. Milward, “Approaches to Text Mining Arguments from Legal Cases,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 60–79. https://doi.org/10.1007/978-3-642-12837-0_4
 G. Venturi, “Legal Language and Legal Knowledge Management Applications,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 3–26. https://doi.org/10.1007/978-3-642-12837-0_1
 L. O. de Colla & V. L. S. de Lima, “Clustering and Categorization of Brazilian Portuguese Legal Documents,” presented Computational Processing of the Portuguese Language, PROPOR 2012, Coi, PT, Apr. 17-20, 2012, pp. 272–283. https://doi.org/10.1007/978-3-642-28885-2_31
 N. Zong, S. Lee, J. Ahn & H. G. Kim, “Supporting inter-topic entity search for biomedical Linked Data based on heterogeneous relationships,” Comput Biol Med, vol. 87, no. 1, Dec. 2016, pp. 217–229, 2017. http://dx.doi.org/10.1016/j.compbiomed.2017.05.026
 A. J. C. Trappey, C. V. Trappey, J.-L. Wu & J. W. C. Wang, “Intelligent compilation of patent summaries using machine learning and natural language processing techniques,” Adv Eng Informatics, vol. 43, no. 1, 101027, Jan. 2020. http://dx.doi.org/10.1016/j.aei.2019.101027
 R. Kumar & K. Raghuveer, “Legal Documents Clustering using Latent Dirichlet Allocation,” IJAIS, vol. 2, no. 6, pp. 27–33, May. 2012. Available from https://research.ijais.org/volume2/number6/ijais12-450384.pdf
 G. Li, Z. Wang & Y. Ma, “Combining Domain Knowledge Extraction With Graph Long Short-Term Memory for Learning Classification of Chinese Legal Documents,” IEEE Access, vol. 7, pp. 139616–139627, Oct. 2019. http://dx.doi.org/10.1109/ACCESS.2019.2943668
 C. C. Ordoñez, E. Anchico, A. Ordóñez, C. Méndez & H. A. Ordoñez, “Sistema de Indexación de documentos Jurisprudenciales soportado en Inteligencia Artificial,” Risti, vol. E22, no. E22, pp. 41–52, 2019. Available from http://www.risti.xyz/issues/ristie22.pdf
 K. Singh, I. Lytra, A. S. Radhakrishna, S. Shekarpour, M. E. Vidal & J. Lehmann, “No one is perfect: Analysing the performance of question answering components over the DBpedia knowledge graph,” JWS, vol. 65, pp. 1–12, 2020. http://dx.doi.org/10.1016/j.websem.2020.100594
 V. N. Gudivada & K. Arbabifard, “Open-Source Libraries, Application Frameworks, and Workflow Systems for NLP,” in Handbook of Statistics. AMS, NL: Elsevier, 2018, pp. 31–50. https://doi.org/10.1016/bs.host.2018.07.007
 P. N. Mendes, M. Jakob, A. García-Silva & C. Bizer, “DBpedia spotlight: shedding light on the web of documents,” presented 7th International Conference on Semantic Systems, I-SEMANTICS 2011, GRZ, AUT, 7-9 Sept. 2011, pp. 1–8. http://dx.doi.org/10.1145/2063518.2063519
 C. Bizer, T. Heath & T. Berners-Lee, “Linked Data - The Story So Far,” IJSWIS, vol. 5, no. 3, pp. 1–22, 2009. http://dx.doi.org/10.4018/jswis.2009081901
 O. Rodríguez, I. Vagliano, C. Figueroa, F. Cairo, G. Futia, C. A. Licciardi, M. Marengo & F. Morando, “Semantic Annotation and Classification in Practice,” IT Prof., vol. 17, no. 2, pp. 33–39, 2015. http://dx.doi.org/10.1109/MITP.2015.29
 C. D. Manning, P. Raghavan & H. Schutze, Introduction to Information Retrieval. CBG, USA: Cambridge Univ Press, 2008.
R. Baeza-Yates & B. Ribeiro-Neto, Modern information retrieval. NY, USA: Addison-Wesley Professional, 1999.
dc.relation.citationendpage.none.fl_str_mv 284
dc.relation.citationstartpage.none.fl_str_mv 277
dc.relation.citationissue.spa.fl_str_mv 2
dc.relation.citationvolume.spa.fl_str_mv 16
dc.relation.bitstream.none.fl_str_mv https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3054
https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3547
https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3576
dc.relation.citationedition.spa.fl_str_mv Núm. 2 , Año 2020 : (Julio-Diciembre)
dc.rights.eng.fl_str_mv INGE CUC - 2020
dc.rights.uri.eng.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0
dc.rights.accessrights.eng.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.eng.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv INGE CUC - 2020
http://creativecommons.org/licenses/by-nc-nd/4.0
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.eng.fl_str_mv application/pdf
text/html
application/xml
dc.publisher.spa.fl_str_mv Universidad de la Costa
dc.source.eng.fl_str_mv https://revistascientificas.cuc.edu.co/ingecuc/article/view/3317
institution Corporación Universidad de la Costa
bitstream.url.fl_str_mv https://repositorio.cuc.edu.co/bitstream/11323/12312/1/ORE.xml
bitstream.checksum.fl_str_mv 82fd0311563393d35dee6d1b85fcaffb
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositorio Universidad de La Costa
repository.mail.fl_str_mv repdigital@cuc.edu.co
_version_ 1808400024579604480
spelling Ordoñez, Hugo Armando87eb36a3132544eed22e818d9e55cf3f300Ordoñez, Cristian Camilo4210022949600d5b80c26fc2367c7387300Ordoñez, Jose Armandoc99099c3b8e04563ad77637e8075328c500Arturo Urbano, Franco3fe5b5fe00f4bb37065c543a48c657573002020-04-30 00:00:002024-04-09T20:21:27Z2020-04-30 00:00:002024-04-09T20:21:27Z2020-04-300122-6517https://hdl.handle.net/11323/12312https://doi.org/10.17981/ingecuc.16.2.2020.2210.17981/ingecuc.16.2.2020.222382-4700Objetivo— Desarrollar un modelo de búsqueda de sentencias judiciales soportado en procesamiento del lenguaje natural que permita analizar el texto de las sentencias jurisprudenciales. Adicionalmente, se usa link-data con el propósito de aprovechar la interrelación del contenido en las sentencias judiciales relacionadas y mejorar los procesos de búsqueda. Metodología— El modelo de búsqueda se desarrolló en dos fases: la primera es la fase de entrenamiento para generar los modelos requeridos para crear un índice, y en segundo lugar, una fase de búsqueda donde el usuario ingresa una cadena de búsqueda y se utiliza el índice creado en la fase anterior para encontrar los documentos (sentencias judiciales) relacionados con de búsqueda. Se realizó una comparación con otros buscadores existentes de la Corte Suprema de Justicia de Colombia. La evaluación se dividió en 2 pasos. 1) Evaluación de los resultados obtenidos en cada búsqueda, 2) Satisfacción del usuario ante los resultados obtenidos en las búsquedas. Resultados— La plataforma desarrollada supera al sistema de búsqueda existente del tribunal en cuanto a satisfacción y precisión del usuario. Conclusiones— El diseño e implementación del modelo de búsqueda de sentencias judiciales basada en Procesamiento del Lenguaje Natural (PNL) y linked data contribuyó a mejorar la experiencia del usuario y la precisión de la búsqueda de sentencias judiciales.Objective— To develop a search model for judicial decisions supported by natural language processing that allows analyzing the text of jurisprudential sentences. Additionally, link-data is used to take advantage of the interrelation of content in related court decisions and improve search processes. Methodology— The search model was built in two phases: the first is the training phase to generate the models required to create an index, and second, a search phase where the user enters a search string that is used to find the documents (court decisions) more related to the search. The model was compared with other existing search engines of the Supreme Court of Justice of Colombia. The evaluation was divided into 2 steps. 1) Evaluation of the results obtained in each search, 2) User satisfaction with the results obtained in the searches solution. Results— The developed platform outperforms the existing search system of the court regarding user satisfaction and precision. Conclusions— The designed model for judicial sentences based on Natural Language Processing (NLP) and linked contributes to improving the user experience and the precision of the jurisprudence search.application/pdftext/htmlapplication/xmlengUniversidad de la CostaINGE CUC - 2020http://creativecommons.org/licenses/by-nc-nd/4.0info:eu-repo/semantics/openAccessEsta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.http://purl.org/coar/access_right/c_abf2https://revistascientificas.cuc.edu.co/ingecuc/article/view/3317jurisprudenceretrievalnatural languageprocessingsystem evaluationautomated summaryprocesamiento de lenguaje natural judicialresumen automatizadorecuperación de documentos judicialesevaluación del sistemaBúsqueda de jurisprudencia en Colombia basada en procesamiento de lenguaje natural (NLP) y Linked DataJurisprudence search in Colombia based on natural language processing (NLP) and Linked DataArtículo de revistahttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1Textinfo:eu-repo/semantics/articleJournal articlehttp://purl.org/redcol/resource_type/ARTinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/version/c_970fb48d4fbd8a85Inge Cuc M. V. Gaviria, “Aproximaciones a la historia del derecho en Colombia,” Hist Soc, no. 22, pp. 131–156, 2012. Disponible en https://revistas.unal.edu.co/index.php/hisysoc/article/view/32363 M. R. Segura, “Precedente jurisprudencial vs unificación jurisprudencial,” ensayo inédito, Bog, CO: UniLibre, 2011. República de Colombia. “Sistema de Consulta de Jurisprudencia.” Portal Rama Judicial del Poder Público. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/consulta/index.xhtml. (accedido en 2011) República de Colombia. “Sistema de Consulta de Jurisprudencia,” Portal Consejo de Estado. Disponible en https://jurisprudencia.ramajudicial.gov.co/WebRelatoria/ce/index.html. (accedido en 2015) J. B. Vallet, “El razonamiento Judicial,” An Fund Fco Elías Tejada, no. 15, pp. 15–28, 2009. Recuperado de http://fundacioneliasdetejada.org/wp-content/uploads/2014/03/ANA15-015-028.pdf A. Wyner, R. Mochales-Palau, M.-F. Moens & D. Milward, “Approaches to Text Mining Arguments from Legal Cases,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 60–79. https://doi.org/10.1007/978-3-642-12837-0_4 G. Venturi, “Legal Language and Legal Knowledge Management Applications,” in Semantic Processing of Legal Texts, E. Francesconi, S. Montemagni, W. Peters and D. Tiscornia, Eds, vol. 6036. SXF, DEU: Springer, 2010, pp. 3–26. https://doi.org/10.1007/978-3-642-12837-0_1 L. O. de Colla & V. L. S. de Lima, “Clustering and Categorization of Brazilian Portuguese Legal Documents,” presented Computational Processing of the Portuguese Language, PROPOR 2012, Coi, PT, Apr. 17-20, 2012, pp. 272–283. https://doi.org/10.1007/978-3-642-28885-2_31 N. Zong, S. Lee, J. Ahn & H. G. Kim, “Supporting inter-topic entity search for biomedical Linked Data based on heterogeneous relationships,” Comput Biol Med, vol. 87, no. 1, Dec. 2016, pp. 217–229, 2017. http://dx.doi.org/10.1016/j.compbiomed.2017.05.026 A. J. C. Trappey, C. V. Trappey, J.-L. Wu & J. W. C. Wang, “Intelligent compilation of patent summaries using machine learning and natural language processing techniques,” Adv Eng Informatics, vol. 43, no. 1, 101027, Jan. 2020. http://dx.doi.org/10.1016/j.aei.2019.101027 R. Kumar & K. Raghuveer, “Legal Documents Clustering using Latent Dirichlet Allocation,” IJAIS, vol. 2, no. 6, pp. 27–33, May. 2012. Available from https://research.ijais.org/volume2/number6/ijais12-450384.pdf G. Li, Z. Wang & Y. Ma, “Combining Domain Knowledge Extraction With Graph Long Short-Term Memory for Learning Classification of Chinese Legal Documents,” IEEE Access, vol. 7, pp. 139616–139627, Oct. 2019. http://dx.doi.org/10.1109/ACCESS.2019.2943668 C. C. Ordoñez, E. Anchico, A. Ordóñez, C. Méndez & H. A. Ordoñez, “Sistema de Indexación de documentos Jurisprudenciales soportado en Inteligencia Artificial,” Risti, vol. E22, no. E22, pp. 41–52, 2019. Available from http://www.risti.xyz/issues/ristie22.pdf K. Singh, I. Lytra, A. S. Radhakrishna, S. Shekarpour, M. E. Vidal & J. Lehmann, “No one is perfect: Analysing the performance of question answering components over the DBpedia knowledge graph,” JWS, vol. 65, pp. 1–12, 2020. http://dx.doi.org/10.1016/j.websem.2020.100594 V. N. Gudivada & K. Arbabifard, “Open-Source Libraries, Application Frameworks, and Workflow Systems for NLP,” in Handbook of Statistics. AMS, NL: Elsevier, 2018, pp. 31–50. https://doi.org/10.1016/bs.host.2018.07.007 P. N. Mendes, M. Jakob, A. García-Silva & C. Bizer, “DBpedia spotlight: shedding light on the web of documents,” presented 7th International Conference on Semantic Systems, I-SEMANTICS 2011, GRZ, AUT, 7-9 Sept. 2011, pp. 1–8. http://dx.doi.org/10.1145/2063518.2063519 C. Bizer, T. Heath & T. Berners-Lee, “Linked Data - The Story So Far,” IJSWIS, vol. 5, no. 3, pp. 1–22, 2009. http://dx.doi.org/10.4018/jswis.2009081901 O. Rodríguez, I. Vagliano, C. Figueroa, F. Cairo, G. Futia, C. A. Licciardi, M. Marengo & F. Morando, “Semantic Annotation and Classification in Practice,” IT Prof., vol. 17, no. 2, pp. 33–39, 2015. http://dx.doi.org/10.1109/MITP.2015.29 C. D. Manning, P. Raghavan & H. Schutze, Introduction to Information Retrieval. CBG, USA: Cambridge Univ Press, 2008.R. Baeza-Yates & B. Ribeiro-Neto, Modern information retrieval. NY, USA: Addison-Wesley Professional, 1999.284277216https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3054https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3547https://revistascientificas.cuc.edu.co/ingecuc/article/download/3317/3576Núm. 2 , Año 2020 : (Julio-Diciembre)OREORE.xmltext/xml2740https://repositorio.cuc.edu.co/bitstream/11323/12312/1/ORE.xml82fd0311563393d35dee6d1b85fcaffbMD51open access11323/12312oai:repositorio.cuc.edu.co:11323/123122024-04-09 15:21:28.019An error occurred on the license name.|||http://creativecommons.org/licenses/by-nc-nd/4.0metadata only accessRepositorio Universidad de La Costarepdigital@cuc.edu.co