Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano

Trabajo de investigación

Autores:
Espitia-Betancourt, César Augusto
Páramo-Lozada, Juan Pablo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2018
Institución:
Universidad Católica de Colombia
Repositorio:
RIUCaC - Repositorio U. Católica
Idioma:
spa
OAI Identifier:
oai:repository.ucatolica.edu.co:10983/22546
Acceso en línea:
https://hdl.handle.net/10983/22546
Palabra clave:
INTELIGENCIA ARTIFICIAL
CONFLICTO ARMADO
RED SOCIAL
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
ALGORITMOS
Rights
openAccess
License
Derechos Reservados - Universidad Católica de Colombia, 2018
id UCATOLICA2_f5561c85f1b52d40e7c6c97d851820a4
oai_identifier_str oai:repository.ucatolica.edu.co:10983/22546
network_acronym_str UCATOLICA2
network_name_str RIUCaC - Repositorio U. Católica
repository_id_str
dc.title.spa.fl_str_mv Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
title Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
spellingShingle Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
INTELIGENCIA ARTIFICIAL
CONFLICTO ARMADO
RED SOCIAL
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
ALGORITMOS
title_short Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
title_full Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
title_fullStr Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
title_full_unstemmed Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
title_sort Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano
dc.creator.fl_str_mv Espitia-Betancourt, César Augusto
Páramo-Lozada, Juan Pablo
dc.contributor.advisor.spa.fl_str_mv Holguín-Ontiveros, Erika Paola
Menéndez-Mora, Raúl Ernesto
dc.contributor.author.spa.fl_str_mv Espitia-Betancourt, César Augusto
Páramo-Lozada, Juan Pablo
dc.subject.lemb.spa.fl_str_mv INTELIGENCIA ARTIFICIAL
topic INTELIGENCIA ARTIFICIAL
CONFLICTO ARMADO
RED SOCIAL
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
ALGORITMOS
dc.subject.proposal.spa.fl_str_mv CONFLICTO ARMADO
RED SOCIAL
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
ALGORITMOS
description Trabajo de investigación
publishDate 2018
dc.date.issued.spa.fl_str_mv 2018
dc.date.accessioned.spa.fl_str_mv 2019-01-24T13:45:03Z
dc.date.available.spa.fl_str_mv 2019-01-24T13:45:03Z
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_71e4c1898caa6e32
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TP
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/submittedVersion
format http://purl.org/coar/resource_type/c_7a1f
status_str submittedVersion
dc.identifier.citation.spa.fl_str_mv Espitia-Betancourt, C. A. & Páramo-Lozada, J. P. (2018). Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombia
dc.identifier.uri.spa.fl_str_mv https://hdl.handle.net/10983/22546
identifier_str_mv Espitia-Betancourt, C. A. & Páramo-Lozada, J. P. (2018). Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombia
url https://hdl.handle.net/10983/22546
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Adam Marcus y Eugene Wu. (2012). Text Processing Overview
Arcila-Calderón, C., Barbosa-Caro, E., & Cabezuelo-Lorenzo, F. (2016). Técnicas big data: análisis de textos a gran escala para la investigación científica y periodística. El Profesional de La Información, 25(4), 623. https://doi.org/10.3145/epi.2016.jul.12
Bakeman, R., McArthur, D., Quera, V., & Robinson, B. F. (2014). Kappa. Psychological Methods, 2(4), 357–370. https://doi.org/10.1037/1082-989X.2.4.357
Barve, A., Rahate, M., Gaikwad, A., & Patil, P. (2018). Terror Attack Identifier: Classify using KNN, SVM, Random Forest algorithm and alert through messages. International Research Journal of Engineering and Technology, 4. Retrieved from www.irjet.net
Bifet, A., & Frank, E. (n.d.-a). Sentiment Knowledge Discovery in Twitter Streaming Data. Retrieved from https://www.cs.waikato.ac.nz/ml/publications/2010/Twitter-crc.pdf
Bifet, A., & Frank, E. (n.d.-b). Sentiment Knowledge Discovery in Twitter Streaming Data.
Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., & Scuse, D. (2016). WEKA Manual for Version 3-8-0.
Cambronero, C. G., & Moreno, I. G. (2010). ALGORITMOS DE APRENDIZAJE: KNN & KMEANS. Madrid. Retrieved from http://blogs.ujaen.es/barranco/wp-content/uploads/2012/02/Algoritmos-deaprendizaje-knn-y-kmeans.pdf
Centro Nacional de Información de Ciencias Médicas., E., & Cabrera-Gato, J. E. (2007). Minería de textos: Una herramienta útil para mejorar la gestión del bibliotecario en el entorno digital. ACIMED (Vol. 16). 2000, Editorial Ciencias Médicas. Retrieved from http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024- 94352007001000005
Corso, I., & Lorena, C. (2010). Aplicación de algoritmos de clasificación supervisada usando Weka.
De Mauro, A., Greco, M., & Grimaldi, M. (2015). What is big data ? A consensual definition and a review of key research topics. Big Data Comput. Sci. Eng, 1644, 9. https://doi.org/10.1063/1.4907823
Del Pilar, A., & Robles, A. (2017). ANÁLISIS DE EFECTIVIDAD AL IMPLEMENTAR LA TÉCNICA DE ÁRBOLES DE DECISIÓN DEL ENFOQUE DE APRENDIZAJE DE MÁQUINA PARA LA DETERMINACIÓN DE AVALÚOS MASIVOS PARA LAS UPZ 79 CALANDAIMA, 65 ARBORIZADORA Y 73 GARCÉS NAVAS. Retrieved from http://repository.udistrital.edu.co/bitstream/11349/5779/1/AlbancandoRoblesAdrianaDelPilar2017.pdf
Diccionario Cambridge. (2018). Tweet
Dong, L., Wei, F., Tan, C., Tang, D., Zhou, M., & Xu, K. (n.d.). Adaptive Recursive Neural Network for Target-dependent Twitter Sentiment Classification. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/P14-2009
Escortell Pérez, A., Giménez Fayos, M., & Rosso, P. (2017). The Impact of Emotions on Polarity Analysis using Figurative Language in Twitter, 8. Retrieved from http://alt.qcri.org/semeval2015/task11/
Figuerola, C. G., Alonso Berrocal, J. L., Zazo Rodríguez, Á. F., & Rodríguez, E. (2004). Algunas Técnicas de Clasificación Automática de Documentos. Página, 15, 10. Retrieved from https://core.ac.uk/download/pdf/153334293.pdf
Frank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016a). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques" Retrieved from https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
Frank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016b). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques"
Gálvez, C. (2008). MINERÍA DE TEXTOS: LA NUEVA GENERACIÓN DE ANÁLISIS DE LITERATURA CIENTÍFICA EN BIOLOGÍA MOLECULAR Y GENÓMICA, 14. Retrieved from https://doi.org/10.5007/1518-2924.2008v13n25p1
Hosmer, D. W., & Lemeshow Stanley. (1989). Applied logistic regression. Retrieved from http://resource.heartonline.cn/20150528/1_3kOQSTg.pdf
KDnuggets. (2017). A General Approach to Preprocessing Text Data. Retrieved September 19, 2018, from https://www.kdnuggets.com/2017/12/generalapproach-preprocessing-text-data.html
Kuhn, M. (2018). The caret Package. Retrieved September 3, 2018, from http://topepo.github.io/caret/index.html
Kusner, M. J., Sun, Y., Kolkin, N. I., & Weinberger, K. Q. (2015). From Word Embeddings To Document Distances. Retrieved fromhttp://proceedings.mlr.press/v37/kusnerb15.pdf
Le, Q., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Retrieved from https://cs.stanford.edu/~quocle/paragraph_vector.pdf
Letelier, P., & Penadés, M. C. (2006). Métodologías ágiles para el desarrollo de software: eXtreme Programming (XP). Retrieved from www.agileuniverse.com.
Levy, O., Goldberg, Y., & Dagan, I. (2015). Improving Distributional Similarity with Lessons Learned from Word Embeddings. Ramat Gan, Israel. Retrieved from https://www.transacl.org/ojs/index.php/tacl/article/view/570
Los Modelos Geométricos (Modelos parte I). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/09/los-modelosgeometricos-modelos-parte-i/
Miguel Ángel Vallejo Pareja. (2006). MINDFULNESS. Retrieved from http://www.redalyc.org/html/778/77827204/
Modelos Logicos (Modelos parte 3). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/23/modelos-logicos-modelosparte-3/
Modelos Probabilísticos (Modelos parte 2). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/12/modelosprobabilisticos-modelos-parte-2/
Pascual, D., Pla, F., & Sánchez, S. (n.d.). Algoritmos de agrupamiento. Retrieved from http://marmota.dlsi.uji.es/WebBIB/papers/2007/1_Pascual-MIA-2007.pdf
Patil, T. R., & Sherekar, M. S. S. (2013). Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification. International Journal Of Computer Science And Applications, 6(2), 256–261. Retrieved from http://www.cs.bme.hu/~kiskat/adatb/bank-data
Paute, D. J., Soroa, A., & López, O. (2016). ANÁLISIS Y CLASIFICACIÓN DE INFORMACIÓN MEDIÁTICA ELECTORAL UTILIZANDO MINERÍA DE TEXTO. Retrieved from https://addi.ehu.es/bitstream/handle/10810/19300/TesisFinal_26092016.pdf?sequence=1&isAllowed=y
Pérez Abelleira, A., & Cardoso, C. A. (2010). Minería de texto para la categorización automática de documentos (Vol. 5). Salta, Argentina. Retrieved from http://www.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p11-aliciaarticulo-cuadernos-formateado.pdf
Radio, C. (2017). De las balas a los votos. Retrieved from http://caracol.com.co/radio/2017/11/24/nacional/1511492119_078663.html
Rangra, K., & Bansal Research Scholar Professor, K. L. (2014). Comparative Study of Data Mining Tools. International Journal of Advanced Research in Computer Science and Software Engineering (Vol. 4). Retrieved from www.rproject.org
RapidMiner. (2014). RapidMiner Studio Manual. Retrieved from https://docs.rapidminer.com/downloads/RapidMiner-v6-user-manual.pdf
Ratinov, L., & Roth, D. (2009). Design Challenges and Misconceptions in Named Entity Recognition. Urbana, USA. Retrieved from http://l2r.cs.uiuc.edu/
Repaso didáctico sobre machine learning. (n.d.). Retrieved September 30, 2018, from https://lapastillaroja.net/2015/02/ml-algols/
Reyes-Ortiz, J. A., Paniagua-Reyes, F., & Sánchez, L. (2017). Mining of Opinions Centered on Topics Using Short Texts in Spanish. Research in Computing Science (Vol. 134). Ciudad de México, México. Retrieved from http://www.rcs.cic.ipn.mx/rcs/2017_134/Mineria de opiniones centrada en topicos usando textos cortos en espanol.pdf
Ritter, A., Clark, S., & Etzioni, O. (2011). Named Entity Recognition in Tweets: An Experimental Study. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/D11-1141
Rosenthal, S., Farra, N., & Nakov, P. (n.d.). SemEval-2017 Task 4: Sentiment Analysis in Twitter. Retrieved from https://trends24.in/
Santana Mansilla, P., Costaguta, R., & Missio, D. (2014). Aplicación de Algoritmos de Clasificación de Minería de Textos para el Reconocimiento de Habilidades de E-tutores Colaborativos. Inteligencia Artificial, 17(53), 57–67. Retrieved from http://journal.iberamia.org/
Sasaki, Y., & Fellow, R. (2007). The truth of the F-measure.
scikit-learn user guide. (2018). Retrieved from http://scikitlearn.org/stable/_downloads/scikit-learn-docs.pdf
scikit learn. (2017). Documentation scikit-learn: machine learning in Pythonscikit-learn 0.19.2 documentation. Retrieved September 3, 2018, from http://scikit-learn.org/stable/documentation.html
Shashanka, M. (2011). A FAST ALGORITHM FOR DISCRETE HMM TRAINING USING OBSERVED TRANSITIONS. East Hartford. Retrieved from http://cns.bu.edu/~mvss/stuff/ShashankaICASSP2011.pdf
Srividhya, V., & Anitha, R. (2010). Evaluating Preprocessing Techniques in Text Categorization. International Journal of Computer Science and Application Issue. Retrieved from http://sinhgad.edu/ijcsa-2012/pdfpapers/1_11.pdf
Sucar, L. E. (2011). Redes Bayesianas. Retrieved from https://ccc.inaoep.mx/~esucar/Clases-mgp/caprb.pdf
The MathWorks Inc. (2018). MATLAB - El lenguaje del cálculo técnico - MATLAB & Simulink. Retrieved September 3, 2018, from https://la.mathworks.com/products/matlab.html
Tornero Lucas, J. (2017). Machine Learning: Modelos Ocultos de Markov (HMM) y Redes Neuronales Artificiales (ANN). Barcelona, España. Retrieved from http://diposit.ub.edu/dspace/bitstream/2445/122446/2/memoria.pdf
Universidad Nacional Mayor de San Marcos. Facultad de Ingenieria Industrial. ́ Instituto de Investigación, Oscar; Rosales López, Pedro Pablo; Salas Bacalla, J. (2010). Criterios de selección de metodologías de desarrollo de software. Industrial Data (Vol. 13). Universidad Nacional Mayor de San Marcos. Retrieved from http://www.redalyc.org/html/816/81619984009/
Valdivia, Eugenio Martínez Cámara, M. Teresa Martín Valdivia, José M. Perea Ortega L, A. U. L. (2011). Técnicas de clasificación de opiniones aplicadas a un corpus en español. Retrieved from http://www.booking.com
Venables, W. N., & Smith, D. M. (1997). An Introduction to R Notes on R: A Programming Environment for Data Analysis and Graphics Version 3.5.1 (2018-07-02). R. Gentleman & R. Ihaka Copyright c. Retrieved from https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf
Venegas, R. (2007). Clasificación de textos académicos en función de su contenido léxico-semántico. Revista Signos, 40(63), 239–271. https://doi.org/10.4067/S0718-09342007000100012
Xiang, G., Fan, B., Wang, L., Hong, J. I., & Rose, C. P. (2012). Detecting Offensive Tweets via Topical Feature Discovery over a Large Scale Twitter Corpus. Retrieved from http://www.cs.cmu.edu/~binfan/papers/cikm12_twitter.pdf
Zontisa. (2018). El etiquetado gramatical o POS tagging - Zontisa Smart Technology. Retrieved September 2, 2018, from https://www.zontisa.com/eletiquetado-gramatical-o-pos-tagging/
dc.rights.spa.fl_str_mv Derechos Reservados - Universidad Católica de Colombia, 2018
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.creativecommons.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc/4.0/
rights_invalid_str_mv Derechos Reservados - Universidad Católica de Colombia, 2018
Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)
https://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería
dc.publisher.program.spa.fl_str_mv Ingeniería de Sistemas y Computación
institution Universidad Católica de Colombia
bitstream.url.fl_str_mv https://repository.ucatolica.edu.co/bitstreams/3bdfb760-c23a-41ef-84e5-dc3bc3694d89/download
https://repository.ucatolica.edu.co/bitstreams/ab418eb7-74ce-4c44-99a5-174d9b1624ea/download
https://repository.ucatolica.edu.co/bitstreams/ad98dc03-6edf-4cda-8578-bef7a933e973/download
https://repository.ucatolica.edu.co/bitstreams/74fcf3fe-7c9e-4a9a-b5e2-f7cb7b2e0d9f/download
https://repository.ucatolica.edu.co/bitstreams/c1f76ae2-e5cd-4230-8e42-29595f0ca0af/download
https://repository.ucatolica.edu.co/bitstreams/6cac31a8-2380-4bc0-a368-ba6aa57c23f1/download
bitstream.checksum.fl_str_mv 700754bc004f7ccb6fa64f832245d87e
8a9dca4a1b509bb1a1575741b3796c02
d694d34384e5145a4332336e19f1dd57
0aa8a5210ce60c6b131ec3b1a0a1f213
0ce7cc95844088b69f4ed922fa2cb45c
ea35604acb12d3ddcdd8fead4afe6168
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Católica de Colombia - RIUCaC
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1814256425196584960
spelling Holguín-Ontiveros, Erika Paolafeca735d-07b7-4183-b3d3-2d0f1cb9fb69-1Menéndez-Mora, Raúl Ernesto3b87a756-7f90-494a-ba35-5ce61503c304-1Espitia-Betancourt, César Augustof9f2f359-b225-4eb6-8502-0cd730fa46f3-1Páramo-Lozada, Juan Pablo08f284a1-4a61-4d9e-b465-f7692d19bc88-12019-01-24T13:45:03Z2019-01-24T13:45:03Z2018Trabajo de investigaciónColombia lleva alrededor de 50 años en guerra y aunque se realizo un proceso de paz, las disputas continúan entre los diferentes actores, un medio en donde se desarrollan las disputas son las redes sociales, los diferentes actores expresan sus opiniones, existen diferentes técnicas y algoritmos que permiten procesar estos textos con la finalidad de que el gobierno Colombiano tenga claridad de como se encuentra el conflicto en la actualidad y como debe proceder de una manera eficiente.PregradoIngeniero de SistemasRESUMEN INTRODUCCIÓN 1. GENERALIDADES 2. ANTECEDENTES 3. PLANTEAMIENTO DEL PROBLEMA 4. OBJETIVOS 5. JUSTIFICACIÓN 6. DELIMIETACIÓN 7. MARCO REFERENCIAL 8. ESTADO DEL ARTE 9. METODOLOGIA 10. PLATAFORMAS 11. ENTORNOS 12. ALGORITMOS 13. HISTORIAS DE USUARIO 14. DESARROLLO DEL COMPONENTE 15. RESULTADOS 16. CONCLUSIONES 17. TRABAJO FUTURO BIBLIOGRAFÍA ANEXOSapplication/pdfEspitia-Betancourt, C. A. & Páramo-Lozada, J. P. (2018). Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombiahttps://hdl.handle.net/10983/22546spaFacultad de IngenieríaIngeniería de Sistemas y ComputaciónAdam Marcus y Eugene Wu. (2012). Text Processing OverviewArcila-Calderón, C., Barbosa-Caro, E., & Cabezuelo-Lorenzo, F. (2016). Técnicas big data: análisis de textos a gran escala para la investigación científica y periodística. El Profesional de La Información, 25(4), 623. https://doi.org/10.3145/epi.2016.jul.12Bakeman, R., McArthur, D., Quera, V., & Robinson, B. F. (2014). Kappa. Psychological Methods, 2(4), 357–370. https://doi.org/10.1037/1082-989X.2.4.357Barve, A., Rahate, M., Gaikwad, A., & Patil, P. (2018). Terror Attack Identifier: Classify using KNN, SVM, Random Forest algorithm and alert through messages. International Research Journal of Engineering and Technology, 4. Retrieved from www.irjet.netBifet, A., & Frank, E. (n.d.-a). Sentiment Knowledge Discovery in Twitter Streaming Data. Retrieved from https://www.cs.waikato.ac.nz/ml/publications/2010/Twitter-crc.pdfBifet, A., & Frank, E. (n.d.-b). Sentiment Knowledge Discovery in Twitter Streaming Data.Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., & Scuse, D. (2016). WEKA Manual for Version 3-8-0.Cambronero, C. G., & Moreno, I. G. (2010). ALGORITMOS DE APRENDIZAJE: KNN & KMEANS. Madrid. Retrieved from http://blogs.ujaen.es/barranco/wp-content/uploads/2012/02/Algoritmos-deaprendizaje-knn-y-kmeans.pdfCentro Nacional de Información de Ciencias Médicas., E., & Cabrera-Gato, J. E. (2007). Minería de textos: Una herramienta útil para mejorar la gestión del bibliotecario en el entorno digital. ACIMED (Vol. 16). 2000, Editorial Ciencias Médicas. Retrieved from http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024- 94352007001000005Corso, I., & Lorena, C. (2010). Aplicación de algoritmos de clasificación supervisada usando Weka.De Mauro, A., Greco, M., & Grimaldi, M. (2015). What is big data ? A consensual definition and a review of key research topics. Big Data Comput. Sci. Eng, 1644, 9. https://doi.org/10.1063/1.4907823Del Pilar, A., & Robles, A. (2017). ANÁLISIS DE EFECTIVIDAD AL IMPLEMENTAR LA TÉCNICA DE ÁRBOLES DE DECISIÓN DEL ENFOQUE DE APRENDIZAJE DE MÁQUINA PARA LA DETERMINACIÓN DE AVALÚOS MASIVOS PARA LAS UPZ 79 CALANDAIMA, 65 ARBORIZADORA Y 73 GARCÉS NAVAS. Retrieved from http://repository.udistrital.edu.co/bitstream/11349/5779/1/AlbancandoRoblesAdrianaDelPilar2017.pdfDiccionario Cambridge. (2018). TweetDong, L., Wei, F., Tan, C., Tang, D., Zhou, M., & Xu, K. (n.d.). Adaptive Recursive Neural Network for Target-dependent Twitter Sentiment Classification. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/P14-2009Escortell Pérez, A., Giménez Fayos, M., & Rosso, P. (2017). The Impact of Emotions on Polarity Analysis using Figurative Language in Twitter, 8. Retrieved from http://alt.qcri.org/semeval2015/task11/Figuerola, C. G., Alonso Berrocal, J. L., Zazo Rodríguez, Á. F., & Rodríguez, E. (2004). Algunas Técnicas de Clasificación Automática de Documentos. Página, 15, 10. Retrieved from https://core.ac.uk/download/pdf/153334293.pdfFrank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016a). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques" Retrieved from https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdfFrank, E., Hall, M. A., Witten, I. H., & Kaufmann, M. (2016b). WEKA Workbench Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques"Gálvez, C. (2008). MINERÍA DE TEXTOS: LA NUEVA GENERACIÓN DE ANÁLISIS DE LITERATURA CIENTÍFICA EN BIOLOGÍA MOLECULAR Y GENÓMICA, 14. Retrieved from https://doi.org/10.5007/1518-2924.2008v13n25p1Hosmer, D. W., & Lemeshow Stanley. (1989). Applied logistic regression. Retrieved from http://resource.heartonline.cn/20150528/1_3kOQSTg.pdfKDnuggets. (2017). A General Approach to Preprocessing Text Data. Retrieved September 19, 2018, from https://www.kdnuggets.com/2017/12/generalapproach-preprocessing-text-data.htmlKuhn, M. (2018). The caret Package. Retrieved September 3, 2018, from http://topepo.github.io/caret/index.htmlKusner, M. J., Sun, Y., Kolkin, N. I., & Weinberger, K. Q. (2015). From Word Embeddings To Document Distances. Retrieved fromhttp://proceedings.mlr.press/v37/kusnerb15.pdfLe, Q., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Retrieved from https://cs.stanford.edu/~quocle/paragraph_vector.pdfLetelier, P., & Penadés, M. C. (2006). Métodologías ágiles para el desarrollo de software: eXtreme Programming (XP). Retrieved from www.agileuniverse.com.Levy, O., Goldberg, Y., & Dagan, I. (2015). Improving Distributional Similarity with Lessons Learned from Word Embeddings. Ramat Gan, Israel. Retrieved from https://www.transacl.org/ojs/index.php/tacl/article/view/570Los Modelos Geométricos (Modelos parte I). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/09/los-modelosgeometricos-modelos-parte-i/Miguel Ángel Vallejo Pareja. (2006). MINDFULNESS. Retrieved from http://www.redalyc.org/html/778/77827204/Modelos Logicos (Modelos parte 3). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/23/modelos-logicos-modelosparte-3/Modelos Probabilísticos (Modelos parte 2). (n.d.). Retrieved September 30, 2018, from https://mlmexicanguy.wordpress.com/2017/02/12/modelosprobabilisticos-modelos-parte-2/Pascual, D., Pla, F., & Sánchez, S. (n.d.). Algoritmos de agrupamiento. Retrieved from http://marmota.dlsi.uji.es/WebBIB/papers/2007/1_Pascual-MIA-2007.pdfPatil, T. R., & Sherekar, M. S. S. (2013). Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification. International Journal Of Computer Science And Applications, 6(2), 256–261. Retrieved from http://www.cs.bme.hu/~kiskat/adatb/bank-dataPaute, D. J., Soroa, A., & López, O. (2016). ANÁLISIS Y CLASIFICACIÓN DE INFORMACIÓN MEDIÁTICA ELECTORAL UTILIZANDO MINERÍA DE TEXTO. Retrieved from https://addi.ehu.es/bitstream/handle/10810/19300/TesisFinal_26092016.pdf?sequence=1&isAllowed=yPérez Abelleira, A., & Cardoso, C. A. (2010). Minería de texto para la categorización automática de documentos (Vol. 5). Salta, Argentina. Retrieved from http://www.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p11-aliciaarticulo-cuadernos-formateado.pdfRadio, C. (2017). De las balas a los votos. Retrieved from http://caracol.com.co/radio/2017/11/24/nacional/1511492119_078663.htmlRangra, K., & Bansal Research Scholar Professor, K. L. (2014). Comparative Study of Data Mining Tools. International Journal of Advanced Research in Computer Science and Software Engineering (Vol. 4). Retrieved from www.rproject.orgRapidMiner. (2014). RapidMiner Studio Manual. Retrieved from https://docs.rapidminer.com/downloads/RapidMiner-v6-user-manual.pdfRatinov, L., & Roth, D. (2009). Design Challenges and Misconceptions in Named Entity Recognition. Urbana, USA. Retrieved from http://l2r.cs.uiuc.edu/Repaso didáctico sobre machine learning. (n.d.). Retrieved September 30, 2018, from https://lapastillaroja.net/2015/02/ml-algols/Reyes-Ortiz, J. A., Paniagua-Reyes, F., & Sánchez, L. (2017). Mining of Opinions Centered on Topics Using Short Texts in Spanish. Research in Computing Science (Vol. 134). Ciudad de México, México. Retrieved from http://www.rcs.cic.ipn.mx/rcs/2017_134/Mineria de opiniones centrada en topicos usando textos cortos en espanol.pdfRitter, A., Clark, S., & Etzioni, O. (2011). Named Entity Recognition in Tweets: An Experimental Study. Association for Computational Linguistics. Retrieved from http://www.aclweb.org/anthology/D11-1141Rosenthal, S., Farra, N., & Nakov, P. (n.d.). SemEval-2017 Task 4: Sentiment Analysis in Twitter. Retrieved from https://trends24.in/Santana Mansilla, P., Costaguta, R., & Missio, D. (2014). Aplicación de Algoritmos de Clasificación de Minería de Textos para el Reconocimiento de Habilidades de E-tutores Colaborativos. Inteligencia Artificial, 17(53), 57–67. Retrieved from http://journal.iberamia.org/Sasaki, Y., & Fellow, R. (2007). The truth of the F-measure.scikit-learn user guide. (2018). Retrieved from http://scikitlearn.org/stable/_downloads/scikit-learn-docs.pdfscikit learn. (2017). Documentation scikit-learn: machine learning in Pythonscikit-learn 0.19.2 documentation. Retrieved September 3, 2018, from http://scikit-learn.org/stable/documentation.htmlShashanka, M. (2011). A FAST ALGORITHM FOR DISCRETE HMM TRAINING USING OBSERVED TRANSITIONS. East Hartford. Retrieved from http://cns.bu.edu/~mvss/stuff/ShashankaICASSP2011.pdfSrividhya, V., & Anitha, R. (2010). Evaluating Preprocessing Techniques in Text Categorization. International Journal of Computer Science and Application Issue. Retrieved from http://sinhgad.edu/ijcsa-2012/pdfpapers/1_11.pdfSucar, L. E. (2011). Redes Bayesianas. Retrieved from https://ccc.inaoep.mx/~esucar/Clases-mgp/caprb.pdfThe MathWorks Inc. (2018). MATLAB - El lenguaje del cálculo técnico - MATLAB & Simulink. Retrieved September 3, 2018, from https://la.mathworks.com/products/matlab.htmlTornero Lucas, J. (2017). Machine Learning: Modelos Ocultos de Markov (HMM) y Redes Neuronales Artificiales (ANN). Barcelona, España. Retrieved from http://diposit.ub.edu/dspace/bitstream/2445/122446/2/memoria.pdfUniversidad Nacional Mayor de San Marcos. Facultad de Ingenieria Industrial. ́ Instituto de Investigación, Oscar; Rosales López, Pedro Pablo; Salas Bacalla, J. (2010). Criterios de selección de metodologías de desarrollo de software. Industrial Data (Vol. 13). Universidad Nacional Mayor de San Marcos. Retrieved from http://www.redalyc.org/html/816/81619984009/Valdivia, Eugenio Martínez Cámara, M. Teresa Martín Valdivia, José M. Perea Ortega L, A. U. L. (2011). Técnicas de clasificación de opiniones aplicadas a un corpus en español. Retrieved from http://www.booking.comVenables, W. N., & Smith, D. M. (1997). An Introduction to R Notes on R: A Programming Environment for Data Analysis and Graphics Version 3.5.1 (2018-07-02). R. Gentleman & R. Ihaka Copyright c. Retrieved from https://cran.r-project.org/doc/manuals/r-release/R-intro.pdfVenegas, R. (2007). Clasificación de textos académicos en función de su contenido léxico-semántico. Revista Signos, 40(63), 239–271. https://doi.org/10.4067/S0718-09342007000100012Xiang, G., Fan, B., Wang, L., Hong, J. I., & Rose, C. P. (2012). Detecting Offensive Tweets via Topical Feature Discovery over a Large Scale Twitter Corpus. Retrieved from http://www.cs.cmu.edu/~binfan/papers/cikm12_twitter.pdfZontisa. (2018). El etiquetado gramatical o POS tagging - Zontisa Smart Technology. Retrieved September 2, 2018, from https://www.zontisa.com/eletiquetado-gramatical-o-pos-tagging/Derechos Reservados - Universidad Católica de Colombia, 2018info:eu-repo/semantics/openAccessAtribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)https://creativecommons.org/licenses/by-nc/4.0/http://purl.org/coar/access_right/c_abf2INTELIGENCIA ARTIFICIALCONFLICTO ARMADORED SOCIALAPRENDIZAJE AUTOMÁTICOINTELIGENCIA ARTIFICIALALGORITMOSAplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombianoTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1fTextinfo:eu-repo/semantics/bachelorThesishttps://purl.org/redcol/resource_type/TPinfo:eu-repo/semantics/submittedVersionhttp://purl.org/coar/version/c_71e4c1898caa6e32PublicationORIGINALAPLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdfAPLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdfapplication/pdf3020935https://repository.ucatolica.edu.co/bitstreams/3bdfb760-c23a-41ef-84e5-dc3bc3694d89/download700754bc004f7ccb6fa64f832245d87eMD51RAE.pdfRAE.pdfapplication/pdf212939https://repository.ucatolica.edu.co/bitstreams/ab418eb7-74ce-4c44-99a5-174d9b1624ea/download8a9dca4a1b509bb1a1575741b3796c02MD52TEXTAPLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdf.txtAPLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdf.txtExtracted texttext/plain180028https://repository.ucatolica.edu.co/bitstreams/ad98dc03-6edf-4cda-8578-bef7a933e973/downloadd694d34384e5145a4332336e19f1dd57MD53RAE.pdf.txtRAE.pdf.txtExtracted texttext/plain19727https://repository.ucatolica.edu.co/bitstreams/74fcf3fe-7c9e-4a9a-b5e2-f7cb7b2e0d9f/download0aa8a5210ce60c6b131ec3b1a0a1f213MD55THUMBNAILAPLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdf.jpgAPLICACION-DEL-APRENDIZAJE-AUTOMATICO-EN-LA-CLASIFICACION-DE-TEXTOS-CORTOS-UN-CASO-DE-ESTUDIO-EN-.pdf.jpgRIUCACimage/jpeg10579https://repository.ucatolica.edu.co/bitstreams/c1f76ae2-e5cd-4230-8e42-29595f0ca0af/download0ce7cc95844088b69f4ed922fa2cb45cMD54RAE.pdf.jpgRAE.pdf.jpgRIUCACimage/jpeg19823https://repository.ucatolica.edu.co/bitstreams/6cac31a8-2380-4bc0-a368-ba6aa57c23f1/downloadea35604acb12d3ddcdd8fead4afe6168MD5610983/22546oai:repository.ucatolica.edu.co:10983/225462023-03-24 18:12:05.648https://creativecommons.org/licenses/by-nc/4.0/Derechos Reservados - Universidad Católica de Colombia, 2018https://repository.ucatolica.edu.coRepositorio Institucional Universidad Católica de Colombia - RIUCaCbdigital@metabiblioteca.com