Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web

Auxiliar de Investigación

Autores:
Jiménez-Valero, Juan Sebastián
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2018
Institución:
Universidad Católica de Colombia
Repositorio:
RIUCaC - Repositorio U. Católica
Idioma:
spa
OAI Identifier:
oai:repository.ucatolica.edu.co:10983/16131
Acceso en línea:
http://hdl.handle.net/10983/16131
Palabra clave:
INTELIGENCIA ARTIFICIAL
ANÁLISIS AUTOMÁTICO DE TEXTOS
INTELIGENCIA ARTIFICIAL
RECONOCIMIENTO DE PATRONES
Rights
openAccess
License
Derechos Reservados - Universidad Católica de Colombia, 2018
id UCATOLICA2_f75bf34bacd0d8cd33492a747904fcbb
oai_identifier_str oai:repository.ucatolica.edu.co:10983/16131
network_acronym_str UCATOLICA2
network_name_str RIUCaC - Repositorio U. Católica
repository_id_str
dc.title.spa.fl_str_mv Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
title Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
spellingShingle Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
INTELIGENCIA ARTIFICIAL
ANÁLISIS AUTOMÁTICO DE TEXTOS
INTELIGENCIA ARTIFICIAL
RECONOCIMIENTO DE PATRONES
title_short Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
title_full Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
title_fullStr Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
title_full_unstemmed Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
title_sort Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web
dc.creator.fl_str_mv Jiménez-Valero, Juan Sebastián
dc.contributor.advisor.spa.fl_str_mv Menéndez-Mora, Raúl Ernesto
dc.contributor.author.spa.fl_str_mv Jiménez-Valero, Juan Sebastián
dc.subject.lemb.spa.fl_str_mv INTELIGENCIA ARTIFICIAL
topic INTELIGENCIA ARTIFICIAL
ANÁLISIS AUTOMÁTICO DE TEXTOS
INTELIGENCIA ARTIFICIAL
RECONOCIMIENTO DE PATRONES
dc.subject.proposal.spa.fl_str_mv ANÁLISIS AUTOMÁTICO DE TEXTOS
INTELIGENCIA ARTIFICIAL
RECONOCIMIENTO DE PATRONES
description Auxiliar de Investigación
publishDate 2018
dc.date.accessioned.spa.fl_str_mv 2018-07-17T20:30:32Z
dc.date.available.spa.fl_str_mv 2018-07-17T20:30:32Z
dc.date.issued.spa.fl_str_mv 2018
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TP
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_7a1f
status_str draft
dc.identifier.citation.spa.fl_str_mv Jiménez-Valero, J. S. (2018). Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombia
dc.identifier.uri.spa.fl_str_mv http://hdl.handle.net/10983/16131
identifier_str_mv Jiménez-Valero, J. S. (2018). Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombia
url http://hdl.handle.net/10983/16131
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.references.spa.fl_str_mv Charu C. Aggarwal y Chengxiang Zhai. Mining Text Data. Vol. 8. New York: Springer Science & Business Media, 2012, pág. 524. isbn: 978-1-4614-3222-7. doi: 10.1007/978- 1-4614-3223-4. arXiv: arXiv:1011.1669v3. url: http://link.springer.com/10. 1007/978-1-4614-3223-4.
Mubashir Ali y col. “A probabilistic framework for short text classification”. En: 2018 IEEE 8th Annual Computing and Communication Workshop and Conference (CCWC). Ene. de 2018, págs. 742-747. doi: 10.1109/CCWC.2018.8301712.
Armin Ronacher. Foreword — Flask Documentation (0.12). 2010. url: http://flask. pocoo.org/docs/0.12/foreword/ (visitado 15-04-2018).
Kent Beck y col. Manifiesto por el Desarrollo Ágil de Software. url: http://agilemanifesto.org/iso/es/manifesto.html (visitado 06-08-2017).
Steven Bird, Ewan Klein y Edward Loper. Natural Language Processing with Python. 1st. O’Reilly Media, Inc., 2009. isbn: 0596516495, 9780596516499.
Jason Brownlee. A Gentle Introduction to the Bag-of-Words Model. 2017. url: https: //machinelearningmastery.com/gentle-introduction-bag-words-model/ (visitado 21-04-2018).
Valentina Jaramillo Bustamante. “Conflicto armado en Colombia, el proceso de paz y la Corte Penal Internacional: Un estudio sobre la internacionalización del conflicto armado en Colombia y su búsqueda por encontrar la paz duradera”. En: Journal of International Law 6.6 (2015), págs. 6-34. issn: 2216-0965.
Cambridge University Press. Definition of framework. 2018. url: https://dictionary. cambridge.org/es/diccionario/ingles/framework (visitado 15-04-2018).
Centro Nacional de Memoria Histórica. Estadísticas - ¡Basta ya! Colombia: Memorias de guerra y dignidad. 2016. url: http://www.centrodememoriahistorica.gov.co/micrositios/informeGeneral/estadisticas.html (visitado 28-03-2017).
Xuetong Chen y col. “What About Mood Swings: Identifying Depression on Twitter with Temporal Measures of Emotions”. En: Companion of The Web Conference 2018 on The Web Conference 2018. WWW ’18. Lyon, France: International World Wide Web Conferences Steering Committee, 2018, págs. 1653-1660. isbn: 978-1-4503- 5640-4. doi: 10.1145/3184558.3191624. url: https://doi.org/10.1145/3184558. 3191624
“DECRETO 1377 DE 2013”. En: Diario Oficial 48834 del 27 de junio de 2013 (2013). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=53646% 7B%5C#%7D0.
Bart Desmet y Véronique Hoste. “Online suicide prevention through optimised text classification”. En: Information Sciences 439-440 (2018), págs. 61-78. issn: 0020-0255. doi: https://doi.org/10.1016/j.ins.2018.02.014. url: http://www.sciencedirect.com/science/article/pii/S002002551830094X.
Giorgio Maria Di Nunzio, Maria Maistro y Federica Vezzani. “A Gamified Approach to NaiVe Bayes Classification: A Case Study for Newswires and Systematic Medical Reviews”. En: Companion of the The Web Conference 2018 on The Web Conference 2018. WWW ’18. Lyon, France: International World Wide Web Conferences Steering Committee, 2018, págs. 1139-1146. isbn: 978-1-4503-5640-4. doi: 10.1145/3184558. 3191547. url: https://doi.org/10.1145/3184558.3191547.
Christiane Fellbaum. WordNet — A Lexical Database for English. 2005. url: https: //wordnet.princeton.edu/ (visitado 15-04-2018).
Alvaro Galván Lucas y Jose Manuel Torres Púa. Extreme programming. url: http://osl2.uca.es/wikiCE/index.php/Extreme%7B%5C_%7Dprogramming (visitado 09-08-2017).
Samujjwal Ghosh y Maunendra Sankar Desarkar. “Class Specific TF-IDF Boosting for Short-text Classification: Application to Short-texts Generated During Disasters”. En: Companion of the The Web Conference 2018 on The Web Conference 2018. WWW ’18. Lyon, France: International World Wide Web Conferences Steering Committee, 2018, págs. 1629-1637. isbn: 978-1-4503-5640-4. doi:10.1145/3184558.3191621 url: https://dl.acm.org/citation.cfm?id=3191621.
Fabio A. González. Introducción Aprendizaje de Máquina. 2007. url: http://dis. unal.edu.co/profesores/fgonza/courses/2007-I/ml/ml-01-introduction.pdf (visitado 11-06-2017).
William L. (Encyclopædia Britannica) Hosch. machine learning. 2009. url: https: //global.britannica.com/technology/machine-learning (visitado 26-03-2017).
Instituto Nacional de Tecnologías Educativas y de Formación del Profesorado (INTEF). ¿Qué es un blog? url: http://www.ite.educacion.es/formacion/materiales/ 155/cd/modulo%7B%5C_%7D1%7B%5C_%7DIniciacionblog/qu%7B%5C_%7Des%7B%5C_ %7Dun%7B%5C_%7Dblog.html (visitado 11-06-2017).
Jason Brownlee. Discover Feature Engineering, How to Engineer Features and How to Get Good at It. 2014. url: http://machinelearningmastery.com/discoverfeature-engineering-how-to-engineer-features-and-how-to-get-good-atit/ (visitado 03-06-2017).
Jason Brownlee. Supervised and Unsupervised Machine Learning Algorithms. 2016. url: http://machinelearningmastery.com/supervised-and-unsupervised-machine-learning-algorithms/ (visitado 06-06-2017).
José Joskowicz. “Reglas y Prácticas en eXtreme Programming”. En: (2008). url: https://iie.fing.edu.uy/%7B~%7Djosej/docs/XP%20- %20Jose%20Joskowicz. pdf.
Julián Pérez Porto y Ana Gardey. Definición de Twitter. 2014. url: http://definicion. de/twitter/ (visitado 11-06-2017).
Faris Kateb y Jugal Kalita. “Classifying Short Text in Social Media: Twitter as Case Study”. En: International Journal of Computer Applications 111.9 (2015), págs. 1-12. issn: 09758887. doi: 10.5120/19563- 1321. url: http://research.ijcaonline. org/volume111/number9/pxc3901321.pdf.
H M Keerthi Kumar y col. “Classification of Sentiments in Short-text: An Approach Using mSMTP Measure”. En: Proceedings of the 2Nd International Conference on Machine Learning and Soft Computing. ICMLSC ’18. Phu Quoc Island, Viet Nam: ACM, 2018, págs. 145-150. isbn: 978-1-4503-6336-5. doi: 10.1145/3184066.3184074. url: http://doi.acm.org/10.1145/3184066.3184074.
Patricio Letelier y Ma Carmen Penadés. “Metodologías ´agiles para el desarrollo de software: eXtreme Programming (XP)”. url: http://users.dsic.upv.es/ asignaturas/eui/lds/doc/masyxp.pdf.
“LEY 1273 DE 2009”. En: Diario Oficial 47.223 de enero 5 de 2009 (2009). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=34492.
“LEY 1712 DE 2014”. En: Diario Oficial 49084 de marzo 6 de 2014 (2014). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=56882.
“LEY ESTATUTARIA 1581 DE 2012”. En: Diario Oficial 48587 de octubre 18 de 2012. (2012). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1. jsp?i=49981.
Vishal Maini y Samir Sabri. Reinforcement Learning. 2017. url: https://medium.com/machine-learning-for-humans/reinforcement-learning-6eacf258b265 (visitado 14-04-2018).
Austin Mccartney. “How Short is a Piece of String?”: An Investigation into the Impact of Text Length on Short-Text Classification Accuracy. 2017.
Walaa Medhat, Ahmed Hassan y Hoda Korashy. “Sentiment analysis algorithms and applications: A survey”. En: Ain Shams Engineering Journal 5.4 (2014), págs. 1093-1113. issn: 2090-4479. doi: https://doi.org/10.1016/j.asej.2014.04.011. url: http: //www.sciencedirect.com/science/article/pii/S2090447914000550.
Tom M Mitchell. Machine Learning. Vol. 4. 1997, págs. 417-433. isbn: 9781577354260. doi: 10.1145/242224.242229. arXiv: 0-387-31073-8.
Tom M Mitchell. “The Discipline of Machine Learning”. En: Machine Learning 17. July (2006), págs. 1-7. issn: 0264-0414. doi: 10.1080/026404199365326. arXiv: 9605103 [cs]. url: http://www-cgi.cs.cmu.edu/%7B~%7Dtom/pubs/MachineLearningTR. pdf.
Tania Camila Niño y col. “Uso de redes neuronales artificiales en predicción de morfología mandibular a través de variables craneomaxilares en una vista posteroanterior”. En: (2016). doi: http://dx.doi.org/10.11144/Javeriana.uo35-74.urna.
Yuanxin Ouyang y col. “News Title Classification with Support from Auxiliary Long Texts”. En: Neural Information Processing. Ed. por Chu Kiong Loo y col. Cham: Springer International Publishing, 2014, págs. 581-588. isbn: 978-3-319-12640-1.
Oxford University Press. Definition of bigram. 2018. url: https://en.oxforddictionaries.com/definition/bigram (visitado 14-04-2018).
Oxford University Press. Definition of bigram. 2018. url: https://en.oxforddictionaries.com/definition/bigram (visitado 14-04-2018).
F. Pedregosa y col. “Scikit-learn: Machine Learning in Python”. En: Journal of Machine Learning Research 12 (2011), págs. 2825-2830.
Real Academia Española. DLE: lematizar. 2014. url: http://dle.rae.es/?id=N6LviQx (visitado 15-04-2018).
República de Colombia. Corte Constitucional. “Constitución Política de Colombia”. En: Normatividad 5 - 2015 (1991), pág. 125. url: http://www.corteconstitucional. gov.co/inicio/Constitucion%20politica%20de%20Colombia%20-%202015.pdf.
Irina Rish. “IBM Research Report An empirical study of the naive Bayes classifier”. En: (2001). url: http://domino.watson.ibm.com/library/CyberDig.nsf/home.
Tajinder Singh y Madhu Kumari. “Role of Text Pre-processing in Twitter Sentiment Analysis”. En: Procedia Computer Science 89 (2016). Twelfth International Conference on Communication Networks, ICCN 2016, August 19– 21, 2016, Bangalore, India Twelfth International Conference on Data Mining and Warehousing, ICDMW 2016, August 19-21, 2016, Bangalore, India Twelfth International Conference on Image and Signal Processing, ICISP 2016, August 19-21, 2016, Bangalore, India, págs. 549-554. issn: 1877-0509. doi: https://doi.org/10.1016/j.procs.2016.06.095 url: http://www.sciencedirect.com/science/article/pii/S1877050916311607.
Ge Song y col. “Short Text Classification: A Survey”. En: Journal of Multimedia 9.5 (2014), págs. 635-643. issn: 1796-2048. doi: 10 . 4304 / jmm . 9 . 5 . 635 - 643. url: http://ojs.academypublisher.com/index.php/jmm/article/view/12635.
Twitter International Company. Política de Privacidad de Twitter. 2017. url: https://twitter.com/privacy?lang=es%7B%5C#%7Dupdate (visitado 11-06-2017).
Twitter International Company. Términos del Servicio. 2016. url: https://twitter.com/tos?lang=es (visitado 11-06-2017).
Fang Wang y col. “Concept-based Short Text Classification and Ranking”. En: Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management - CIKM ’14 (2014), págs. 1069-1078. doi:10.1145/2661829.2662067. url: http://dl.acm.org/citation.cfm?doid=2661829.2662067.
Don Wells. Extreme Programming Rules. url: http://www.extremeprogramming. org/rules.html (visitado 09-08-2017).
Jian Xu y col. “Signature based trouble ticket classification”. En: Future Generation Computer Systems 78 (2018), págs. 41-58. issn: 0167-739X. doi: https://doi.org/ 10.1016/j.future.2017.07.054. url: http://www.sciencedirect.com/science/ article/pii/S0167739X16308056.
Rui Xu. “Survey of clustering algorithms for MANET”. En: IEEE Transactions on Neural Networks 16.3 (2005), págs. 645-678. issn: 1045-9227. doi: 10.1109/TNN.2005.845141. arXiv: 0912.2303. url: http://arxiv.org/abs/0912.2303.
dc.rights.spa.fl_str_mv Derechos Reservados - Universidad Católica de Colombia, 2018
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.creativecommons.spa.fl_str_mv Atribución 4.0 Internacional (CC BY 4.0)
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by/4.0/
rights_invalid_str_mv Derechos Reservados - Universidad Católica de Colombia, 2018
Atribución 4.0 Internacional (CC BY 4.0)
https://creativecommons.org/licenses/by/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería
dc.publisher.program.spa.fl_str_mv Ingeniería de Sistemas y Computación
institution Universidad Católica de Colombia
bitstream.url.fl_str_mv https://repository.ucatolica.edu.co/bitstreams/b4bcfdd5-9180-4365-a055-6db21d67121d/download
https://repository.ucatolica.edu.co/bitstreams/f2386f21-b9fa-444a-b033-a58e767912a9/download
https://repository.ucatolica.edu.co/bitstreams/c1cc3a94-6acb-4ce0-9364-6fc5ff76b803/download
https://repository.ucatolica.edu.co/bitstreams/d26f92c6-f65a-4c93-8e75-7a8057406d04/download
https://repository.ucatolica.edu.co/bitstreams/c935cf46-c631-4975-85de-a4ebc11a1ecf/download
https://repository.ucatolica.edu.co/bitstreams/10570396-620c-4d43-b2d7-7f8f8c26ba71/download
bitstream.checksum.fl_str_mv df8db7dc200db322ff5713c245712791
f2f03786eee2ba7f1811b6bca708d932
6c792667698701a836d23e7d595366aa
b4d3c50dc83f7c0db7b90615fe72b08d
b8a2a88fd822262fa68dbc1848844a60
77d1f61888243a63131b2d1c6ef8a042
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Católica de Colombia - RIUCaC
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1808402480969547776
spelling Menéndez-Mora, Raúl Ernesto3b87a756-7f90-494a-ba35-5ce61503c304-1Jiménez-Valero, Juan Sebastián8139c211-4d73-4b37-91b7-1c70c1bdc3e4-12018-07-17T20:30:32Z2018-07-17T20:30:32Z2018Auxiliar de InvestigaciónLa clasificación de texto es una de las áreas de estudio de la disciplina del aprendizaje de máquina (en inglés Machine Learning) en donde se busca, posterior a una etapa de entrenamiento, predecir una categoría para datos de entrada que no hayan sido clasificados previamente. La longitud de los textos cortos, puede conllevar a una pérdida en la precisión de los resultados entregados por el proceso de clasificación de texto, ya que la cantidad de características aprovechables disminuye. Por lo tanto, se busca explorar una solución que permita realizar tareas de clasificación de textos cortos, con un nivel de precisión cercano al 80 %. Se desarrolló un componente de clasificación de textos cortos en el lenguaje de programación Python, haciendo uso del framework Flask el cual permite peticiones a través de un API y realiza la clasificación datasets que cumplan con el formato de entrada. Se probaron los resultados de este trabajo mediante el uso de publicaciones extraídas desde cuentas de Twitter, debido a la restricción sobre la longitud de sus publicaciones. La clasificación se realizó mediante el uso de algoritmos de aprendizaje supervisado, y en el mejor de los casos, la precisión obtenida fue cercana al 85 %.PregradoIngeniero de Sistemas1. INTRODUCCIÓN 2. MARCO DE REFERENCIA 3. METODOLOGÍA 4. ESTADO DEL ARTE 5. DESARROLLO 6. RESULTADOS 7. CONCLUSIONES 8. TRABAJO FUTURO BIBLIOGRAFÍA ANEXOSapplication/pdfJiménez-Valero, J. S. (2018). Desarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma Web. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Bogotá, Colombiahttp://hdl.handle.net/10983/16131spaFacultad de IngenieríaIngeniería de Sistemas y ComputaciónCharu C. Aggarwal y Chengxiang Zhai. Mining Text Data. Vol. 8. New York: Springer Science & Business Media, 2012, pág. 524. isbn: 978-1-4614-3222-7. doi: 10.1007/978- 1-4614-3223-4. arXiv: arXiv:1011.1669v3. url: http://link.springer.com/10. 1007/978-1-4614-3223-4.Mubashir Ali y col. “A probabilistic framework for short text classification”. En: 2018 IEEE 8th Annual Computing and Communication Workshop and Conference (CCWC). Ene. de 2018, págs. 742-747. doi: 10.1109/CCWC.2018.8301712.Armin Ronacher. Foreword — Flask Documentation (0.12). 2010. url: http://flask. pocoo.org/docs/0.12/foreword/ (visitado 15-04-2018).Kent Beck y col. Manifiesto por el Desarrollo Ágil de Software. url: http://agilemanifesto.org/iso/es/manifesto.html (visitado 06-08-2017).Steven Bird, Ewan Klein y Edward Loper. Natural Language Processing with Python. 1st. O’Reilly Media, Inc., 2009. isbn: 0596516495, 9780596516499.Jason Brownlee. A Gentle Introduction to the Bag-of-Words Model. 2017. url: https: //machinelearningmastery.com/gentle-introduction-bag-words-model/ (visitado 21-04-2018).Valentina Jaramillo Bustamante. “Conflicto armado en Colombia, el proceso de paz y la Corte Penal Internacional: Un estudio sobre la internacionalización del conflicto armado en Colombia y su búsqueda por encontrar la paz duradera”. En: Journal of International Law 6.6 (2015), págs. 6-34. issn: 2216-0965.Cambridge University Press. Definition of framework. 2018. url: https://dictionary. cambridge.org/es/diccionario/ingles/framework (visitado 15-04-2018).Centro Nacional de Memoria Histórica. Estadísticas - ¡Basta ya! Colombia: Memorias de guerra y dignidad. 2016. url: http://www.centrodememoriahistorica.gov.co/micrositios/informeGeneral/estadisticas.html (visitado 28-03-2017).Xuetong Chen y col. “What About Mood Swings: Identifying Depression on Twitter with Temporal Measures of Emotions”. En: Companion of The Web Conference 2018 on The Web Conference 2018. WWW ’18. Lyon, France: International World Wide Web Conferences Steering Committee, 2018, págs. 1653-1660. isbn: 978-1-4503- 5640-4. doi: 10.1145/3184558.3191624. url: https://doi.org/10.1145/3184558. 3191624“DECRETO 1377 DE 2013”. En: Diario Oficial 48834 del 27 de junio de 2013 (2013). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=53646% 7B%5C#%7D0.Bart Desmet y Véronique Hoste. “Online suicide prevention through optimised text classification”. En: Information Sciences 439-440 (2018), págs. 61-78. issn: 0020-0255. doi: https://doi.org/10.1016/j.ins.2018.02.014. url: http://www.sciencedirect.com/science/article/pii/S002002551830094X.Giorgio Maria Di Nunzio, Maria Maistro y Federica Vezzani. “A Gamified Approach to NaiVe Bayes Classification: A Case Study for Newswires and Systematic Medical Reviews”. En: Companion of the The Web Conference 2018 on The Web Conference 2018. WWW ’18. Lyon, France: International World Wide Web Conferences Steering Committee, 2018, págs. 1139-1146. isbn: 978-1-4503-5640-4. doi: 10.1145/3184558. 3191547. url: https://doi.org/10.1145/3184558.3191547.Christiane Fellbaum. WordNet — A Lexical Database for English. 2005. url: https: //wordnet.princeton.edu/ (visitado 15-04-2018).Alvaro Galván Lucas y Jose Manuel Torres Púa. Extreme programming. url: http://osl2.uca.es/wikiCE/index.php/Extreme%7B%5C_%7Dprogramming (visitado 09-08-2017).Samujjwal Ghosh y Maunendra Sankar Desarkar. “Class Specific TF-IDF Boosting for Short-text Classification: Application to Short-texts Generated During Disasters”. En: Companion of the The Web Conference 2018 on The Web Conference 2018. WWW ’18. Lyon, France: International World Wide Web Conferences Steering Committee, 2018, págs. 1629-1637. isbn: 978-1-4503-5640-4. doi:10.1145/3184558.3191621 url: https://dl.acm.org/citation.cfm?id=3191621.Fabio A. González. Introducción Aprendizaje de Máquina. 2007. url: http://dis. unal.edu.co/profesores/fgonza/courses/2007-I/ml/ml-01-introduction.pdf (visitado 11-06-2017).William L. (Encyclopædia Britannica) Hosch. machine learning. 2009. url: https: //global.britannica.com/technology/machine-learning (visitado 26-03-2017).Instituto Nacional de Tecnologías Educativas y de Formación del Profesorado (INTEF). ¿Qué es un blog? url: http://www.ite.educacion.es/formacion/materiales/ 155/cd/modulo%7B%5C_%7D1%7B%5C_%7DIniciacionblog/qu%7B%5C_%7Des%7B%5C_ %7Dun%7B%5C_%7Dblog.html (visitado 11-06-2017).Jason Brownlee. Discover Feature Engineering, How to Engineer Features and How to Get Good at It. 2014. url: http://machinelearningmastery.com/discoverfeature-engineering-how-to-engineer-features-and-how-to-get-good-atit/ (visitado 03-06-2017).Jason Brownlee. Supervised and Unsupervised Machine Learning Algorithms. 2016. url: http://machinelearningmastery.com/supervised-and-unsupervised-machine-learning-algorithms/ (visitado 06-06-2017).José Joskowicz. “Reglas y Prácticas en eXtreme Programming”. En: (2008). url: https://iie.fing.edu.uy/%7B~%7Djosej/docs/XP%20- %20Jose%20Joskowicz. pdf.Julián Pérez Porto y Ana Gardey. Definición de Twitter. 2014. url: http://definicion. de/twitter/ (visitado 11-06-2017).Faris Kateb y Jugal Kalita. “Classifying Short Text in Social Media: Twitter as Case Study”. En: International Journal of Computer Applications 111.9 (2015), págs. 1-12. issn: 09758887. doi: 10.5120/19563- 1321. url: http://research.ijcaonline. org/volume111/number9/pxc3901321.pdf.H M Keerthi Kumar y col. “Classification of Sentiments in Short-text: An Approach Using mSMTP Measure”. En: Proceedings of the 2Nd International Conference on Machine Learning and Soft Computing. ICMLSC ’18. Phu Quoc Island, Viet Nam: ACM, 2018, págs. 145-150. isbn: 978-1-4503-6336-5. doi: 10.1145/3184066.3184074. url: http://doi.acm.org/10.1145/3184066.3184074.Patricio Letelier y Ma Carmen Penadés. “Metodologías ´agiles para el desarrollo de software: eXtreme Programming (XP)”. url: http://users.dsic.upv.es/ asignaturas/eui/lds/doc/masyxp.pdf.“LEY 1273 DE 2009”. En: Diario Oficial 47.223 de enero 5 de 2009 (2009). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=34492.“LEY 1712 DE 2014”. En: Diario Oficial 49084 de marzo 6 de 2014 (2014). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1.jsp?i=56882.“LEY ESTATUTARIA 1581 DE 2012”. En: Diario Oficial 48587 de octubre 18 de 2012. (2012). url: http://www.alcaldiabogota.gov.co/sisjur/normas/Norma1. jsp?i=49981.Vishal Maini y Samir Sabri. Reinforcement Learning. 2017. url: https://medium.com/machine-learning-for-humans/reinforcement-learning-6eacf258b265 (visitado 14-04-2018).Austin Mccartney. “How Short is a Piece of String?”: An Investigation into the Impact of Text Length on Short-Text Classification Accuracy. 2017.Walaa Medhat, Ahmed Hassan y Hoda Korashy. “Sentiment analysis algorithms and applications: A survey”. En: Ain Shams Engineering Journal 5.4 (2014), págs. 1093-1113. issn: 2090-4479. doi: https://doi.org/10.1016/j.asej.2014.04.011. url: http: //www.sciencedirect.com/science/article/pii/S2090447914000550.Tom M Mitchell. Machine Learning. Vol. 4. 1997, págs. 417-433. isbn: 9781577354260. doi: 10.1145/242224.242229. arXiv: 0-387-31073-8.Tom M Mitchell. “The Discipline of Machine Learning”. En: Machine Learning 17. July (2006), págs. 1-7. issn: 0264-0414. doi: 10.1080/026404199365326. arXiv: 9605103 [cs]. url: http://www-cgi.cs.cmu.edu/%7B~%7Dtom/pubs/MachineLearningTR. pdf.Tania Camila Niño y col. “Uso de redes neuronales artificiales en predicción de morfología mandibular a través de variables craneomaxilares en una vista posteroanterior”. En: (2016). doi: http://dx.doi.org/10.11144/Javeriana.uo35-74.urna.Yuanxin Ouyang y col. “News Title Classification with Support from Auxiliary Long Texts”. En: Neural Information Processing. Ed. por Chu Kiong Loo y col. Cham: Springer International Publishing, 2014, págs. 581-588. isbn: 978-3-319-12640-1.Oxford University Press. Definition of bigram. 2018. url: https://en.oxforddictionaries.com/definition/bigram (visitado 14-04-2018).Oxford University Press. Definition of bigram. 2018. url: https://en.oxforddictionaries.com/definition/bigram (visitado 14-04-2018).F. Pedregosa y col. “Scikit-learn: Machine Learning in Python”. En: Journal of Machine Learning Research 12 (2011), págs. 2825-2830.Real Academia Española. DLE: lematizar. 2014. url: http://dle.rae.es/?id=N6LviQx (visitado 15-04-2018).República de Colombia. Corte Constitucional. “Constitución Política de Colombia”. En: Normatividad 5 - 2015 (1991), pág. 125. url: http://www.corteconstitucional. gov.co/inicio/Constitucion%20politica%20de%20Colombia%20-%202015.pdf.Irina Rish. “IBM Research Report An empirical study of the naive Bayes classifier”. En: (2001). url: http://domino.watson.ibm.com/library/CyberDig.nsf/home.Tajinder Singh y Madhu Kumari. “Role of Text Pre-processing in Twitter Sentiment Analysis”. En: Procedia Computer Science 89 (2016). Twelfth International Conference on Communication Networks, ICCN 2016, August 19– 21, 2016, Bangalore, India Twelfth International Conference on Data Mining and Warehousing, ICDMW 2016, August 19-21, 2016, Bangalore, India Twelfth International Conference on Image and Signal Processing, ICISP 2016, August 19-21, 2016, Bangalore, India, págs. 549-554. issn: 1877-0509. doi: https://doi.org/10.1016/j.procs.2016.06.095 url: http://www.sciencedirect.com/science/article/pii/S1877050916311607.Ge Song y col. “Short Text Classification: A Survey”. En: Journal of Multimedia 9.5 (2014), págs. 635-643. issn: 1796-2048. doi: 10 . 4304 / jmm . 9 . 5 . 635 - 643. url: http://ojs.academypublisher.com/index.php/jmm/article/view/12635.Twitter International Company. Política de Privacidad de Twitter. 2017. url: https://twitter.com/privacy?lang=es%7B%5C#%7Dupdate (visitado 11-06-2017).Twitter International Company. Términos del Servicio. 2016. url: https://twitter.com/tos?lang=es (visitado 11-06-2017).Fang Wang y col. “Concept-based Short Text Classification and Ranking”. En: Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management - CIKM ’14 (2014), págs. 1069-1078. doi:10.1145/2661829.2662067. url: http://dl.acm.org/citation.cfm?doid=2661829.2662067.Don Wells. Extreme Programming Rules. url: http://www.extremeprogramming. org/rules.html (visitado 09-08-2017).Jian Xu y col. “Signature based trouble ticket classification”. En: Future Generation Computer Systems 78 (2018), págs. 41-58. issn: 0167-739X. doi: https://doi.org/ 10.1016/j.future.2017.07.054. url: http://www.sciencedirect.com/science/ article/pii/S0167739X16308056.Rui Xu. “Survey of clustering algorithms for MANET”. En: IEEE Transactions on Neural Networks 16.3 (2005), págs. 645-678. issn: 1045-9227. doi: 10.1109/TNN.2005.845141. arXiv: 0912.2303. url: http://arxiv.org/abs/0912.2303.Derechos Reservados - Universidad Católica de Colombia, 2018info:eu-repo/semantics/openAccessAtribución 4.0 Internacional (CC BY 4.0)https://creativecommons.org/licenses/by/4.0/http://purl.org/coar/access_right/c_abf2INTELIGENCIA ARTIFICIALANÁLISIS AUTOMÁTICO DE TEXTOSINTELIGENCIA ARTIFICIALRECONOCIMIENTO DE PATRONESDesarrollo de un componente de analítica para la clasificación de textos cortos dirigido a un proyecto institucional e integrable en una plataforma WebTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1fTextinfo:eu-repo/semantics/bachelorThesishttps://purl.org/redcol/resource_type/TPinfo:eu-repo/semantics/drafthttp://purl.org/coar/version/c_b1a7d7d4d402bccePublicationORIGINALDocumento de trabajo de grado.pdfDocumento de trabajo de grado.pdfapplication/pdf6064890https://repository.ucatolica.edu.co/bitstreams/b4bcfdd5-9180-4365-a055-6db21d67121d/downloaddf8db7dc200db322ff5713c245712791MD51resumen analitico en educacion.pdfresumen analitico en educacion.pdfapplication/pdf187391https://repository.ucatolica.edu.co/bitstreams/f2386f21-b9fa-444a-b033-a58e767912a9/downloadf2f03786eee2ba7f1811b6bca708d932MD52TEXTDocumento de trabajo de grado.pdf.txtDocumento de trabajo de grado.pdf.txtExtracted texttext/plain205062https://repository.ucatolica.edu.co/bitstreams/c1cc3a94-6acb-4ce0-9364-6fc5ff76b803/download6c792667698701a836d23e7d595366aaMD53resumen analitico en educacion.pdf.txtresumen analitico en educacion.pdf.txtExtracted texttext/plain16644https://repository.ucatolica.edu.co/bitstreams/d26f92c6-f65a-4c93-8e75-7a8057406d04/downloadb4d3c50dc83f7c0db7b90615fe72b08dMD55THUMBNAILDocumento de trabajo de grado.pdf.jpgDocumento de trabajo de grado.pdf.jpgRIUCACimage/jpeg11488https://repository.ucatolica.edu.co/bitstreams/c935cf46-c631-4975-85de-a4ebc11a1ecf/downloadb8a2a88fd822262fa68dbc1848844a60MD54resumen analitico en educacion.pdf.jpgresumen analitico en educacion.pdf.jpgRIUCACimage/jpeg19901https://repository.ucatolica.edu.co/bitstreams/10570396-620c-4d43-b2d7-7f8f8c26ba71/download77d1f61888243a63131b2d1c6ef8a042MD5610983/16131oai:repository.ucatolica.edu.co:10983/161312023-03-24 14:50:48.999https://creativecommons.org/licenses/by/4.0/Derechos Reservados - Universidad Católica de Colombia, 2018https://repository.ucatolica.edu.coRepositorio Institucional Universidad Católica de Colombia - RIUCaCbdigital@metabiblioteca.com