Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático

El mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables...

Full description

Autores:
Londoño Cárdenas, Jhon Sebastián
Ortiz Morales, Luis Alberto
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Pontificia Universidad Javeriana Cali
Repositorio:
Vitela
Idioma:
spa
OAI Identifier:
oai:vitela.javerianacali.edu.co:11522/2856
Acceso en línea:
https://vitela.javerianacali.edu.co/handle/11522/2856
Palabra clave:
Stock market
Machine learning
Sentiment analysis
Natural language processing
Semi-supervised learning
Rights
License
https://creativecommons.org/licenses/by-nc-nd/4.0/
id Vitela2_9c60cf3ce52d07c5d2f05c0c20ef0351
oai_identifier_str oai:vitela.javerianacali.edu.co:11522/2856
network_acronym_str Vitela2
network_name_str Vitela
repository_id_str
dc.title.spa.fl_str_mv Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
title Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
spellingShingle Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
Stock market
Machine learning
Sentiment analysis
Natural language processing
Semi-supervised learning
title_short Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
title_full Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
title_fullStr Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
title_full_unstemmed Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
title_sort Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
dc.creator.fl_str_mv Londoño Cárdenas, Jhon Sebastián
Ortiz Morales, Luis Alberto
dc.contributor.advisor.none.fl_str_mv Linares Ospina, Diego Luis
Álvarez Vargas, Gloria Inés
dc.contributor.author.none.fl_str_mv Londoño Cárdenas, Jhon Sebastián
Ortiz Morales, Luis Alberto
dc.subject.none.fl_str_mv Stock market
Machine learning
Sentiment analysis
Natural language processing
Semi-supervised learning
topic Stock market
Machine learning
Sentiment analysis
Natural language processing
Semi-supervised learning
description El mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real.
publishDate 2023
dc.date.issued.none.fl_str_mv 2023
dc.date.accessioned.none.fl_str_mv 2024-06-18T01:02:12Z
dc.date.available.none.fl_str_mv 2024-06-18T01:02:12Z
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.local.none.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcol.none.fl_str_mv https://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
dc.identifier.uri.none.fl_str_mv https://vitela.javerianacali.edu.co/handle/11522/2856
url https://vitela.javerianacali.edu.co/handle/11522/2856
dc.language.iso.none.fl_str_mv spa
language spa
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.creativecommons.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.none.fl_str_mv http://purl.org/coar/access_right/c_14cb
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
http://purl.org/coar/access_right/c_14cb
dc.format.extent.none.fl_str_mv 75 p.
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontificia Univerisdad Javeriana Cali
publisher.none.fl_str_mv Pontificia Univerisdad Javeriana Cali
institution Pontificia Universidad Javeriana Cali
bitstream.url.fl_str_mv https://vitela.javerianacali.edu.co/bitstreams/2df54dbb-498a-497f-a94f-718686aceedd/download
https://vitela.javerianacali.edu.co/bitstreams/fe15455f-914f-4bad-8e14-c510f4d1fa87/download
https://vitela.javerianacali.edu.co/bitstreams/9d3ccc27-1526-412e-985f-4cdf3a040f47/download
https://vitela.javerianacali.edu.co/bitstreams/af3dc4dc-2f8b-4df7-a6c1-4910e884601e/download
https://vitela.javerianacali.edu.co/bitstreams/64f8088f-c907-4399-808e-f1969b148cdf/download
https://vitela.javerianacali.edu.co/bitstreams/33ea64c8-2281-4071-9b48-79f9fa501247/download
https://vitela.javerianacali.edu.co/bitstreams/5ecce179-c9f5-4697-8fe1-8335af8bb385/download
https://vitela.javerianacali.edu.co/bitstreams/d09e48ac-f154-4c0c-812b-b2ba8f63f525/download
https://vitela.javerianacali.edu.co/bitstreams/5ccc1cb2-9a86-41b2-8d2e-63cb5cbc09b0/download
https://vitela.javerianacali.edu.co/bitstreams/4419df09-910d-4553-bea8-d85c7ff61b55/download
bitstream.checksum.fl_str_mv 1053364f92107eb1b0d2a53a04d2b8c9
75dbd9eab80d629fedaf841f55f059f2
90fb6da69c22d0e89c988809177c859c
8a4605be74aa9ea9d79846c1fba20a33
9218895ae32089eab3c5e0e7ceca48c4
6beda011b81f6b8f56721b3694913a7b
a3fae535b692dda5fcf5ef7d8a05c4cc
de62981f3cbcc4f2d28f046608216945
b86de14219b42d2a98e5e91f9ad39998
25d2bb9bbc8efcda074e5848ba7269ef
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Vitela
repository.mail.fl_str_mv vitela.mail@javerianacali.edu.co
_version_ 1812095063028662272
spelling Linares Ospina, Diego LuisÁlvarez Vargas, Gloria InésLondoño Cárdenas, Jhon SebastiánOrtiz Morales, Luis Alberto2024-06-18T01:02:12Z2024-06-18T01:02:12Z2023https://vitela.javerianacali.edu.co/handle/11522/2856El mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real.The stock market is one that has a certain antiquity, for this reason, over the years techniques have been tested and designed to predict the behavior of the value of stocks. Some of these use only the historical price as a basis, while others include indices associated with the companies of the stock. All of the above is done to obtain a trend with which to decide whether it is a good time to buy or sell shares in the market. In the literature, the application of machine learning in the field of the stock market has been explored to a greater extent using price history. However, there are other methods that have been less employed, being sentiment analysis an example of these. For this reason, in this project we sought to integrate two techniques with different degrees of exploration such as price history and sentiment analysis. In order to develop the sentiment analysis section, Natural Language Processing techniques we re used for data processing. In addition to the above, semi-supervised learning algorithms such as Label Propagation and Label Spreading were explored in order to label all records in the dataset based on only a few known sentiment data. In addition, three machine learning models were trained and evaluated with the aim of finding the best one to subsequently use for sentiment classification of current tweets, finding that the one with the best results was the Support Vector Machine model. To test the performance of the models used in this project, the R2-score, Mean Square Error, F1-score and Accuracy metrics were used. In addition, tests were performed with the help of a broker platform to interact with a simulated market using a buy/sell strategy. Prior to integration with sentiment analysis, the best model was found to be the LSTM and once sentiment analysis was integrated, the best model was found to be the Random Forest. From the tests with the broker platform, it could be observed how one of the models with sen timent analysis had acceptable results. However, the weaknesses of the selected buy/sell strategy were also evidenced, so that even having a model with good results, a further review of buy and sell strategies is needed, to give a practical use in real life to the models.75 p.application/pdfspaPontificia Univerisdad Javeriana Calihttps://creativecommons.org/licenses/by-nc-nd/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_14cbStock marketMachine learningSentiment analysisNatural language processingSemi-supervised learningAnálisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automáticohttp://purl.org/coar/resource_type/c_7a1fTesis/Trabajo de grado - Monografía - Pregradohttps://purl.org/redcol/resource_type/TPFacultad de Ingeniería y Ciencias. Ingeniería de Sistemas y ComputaciónPregradoIngeniero(a)de Sistemas y ComputaciónORIGINALAnálisis_sentimientos_modelo_prediccion.pdf.pdfAnálisis_sentimientos_modelo_prediccion.pdf.pdfapplication/pdf2015046https://vitela.javerianacali.edu.co/bitstreams/2df54dbb-498a-497f-a94f-718686aceedd/download1053364f92107eb1b0d2a53a04d2b8c9MD53Artículo_científico.pdfArtículo_científico.pdfapplication/pdf51858https://vitela.javerianacali.edu.co/bitstreams/fe15455f-914f-4bad-8e14-c510f4d1fa87/download75dbd9eab80d629fedaf841f55f059f2MD52Licencia_autorización.pdfLicencia_autorización.pdfapplication/pdf467747https://vitela.javerianacali.edu.co/bitstreams/9d3ccc27-1526-412e-985f-4cdf3a040f47/download90fb6da69c22d0e89c988809177c859cMD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/af3dc4dc-2f8b-4df7-a6c1-4910e884601e/download8a4605be74aa9ea9d79846c1fba20a33MD51TEXTAnálisis_sentimientos_modelo_prediccion.pdf.pdf.txtAnálisis_sentimientos_modelo_prediccion.pdf.pdf.txtExtracted texttext/plain102417https://vitela.javerianacali.edu.co/bitstreams/64f8088f-c907-4399-808e-f1969b148cdf/download9218895ae32089eab3c5e0e7ceca48c4MD55Artículo_científico.pdf.txtArtículo_científico.pdf.txtExtracted texttext/plain16262https://vitela.javerianacali.edu.co/bitstreams/33ea64c8-2281-4071-9b48-79f9fa501247/download6beda011b81f6b8f56721b3694913a7bMD57Licencia_autorización.pdf.txtLicencia_autorización.pdf.txtExtracted texttext/plain5072https://vitela.javerianacali.edu.co/bitstreams/5ecce179-c9f5-4697-8fe1-8335af8bb385/downloada3fae535b692dda5fcf5ef7d8a05c4ccMD510THUMBNAILAnálisis_sentimientos_modelo_prediccion.pdf.pdf.jpgAnálisis_sentimientos_modelo_prediccion.pdf.pdf.jpgGenerated Thumbnailimage/jpeg3908https://vitela.javerianacali.edu.co/bitstreams/d09e48ac-f154-4c0c-812b-b2ba8f63f525/downloadde62981f3cbcc4f2d28f046608216945MD56Artículo_científico.pdf.jpgArtículo_científico.pdf.jpgGenerated Thumbnailimage/jpeg4421https://vitela.javerianacali.edu.co/bitstreams/5ccc1cb2-9a86-41b2-8d2e-63cb5cbc09b0/downloadb86de14219b42d2a98e5e91f9ad39998MD58Licencia_autorización.pdf.jpgLicencia_autorización.pdf.jpgGenerated Thumbnailimage/jpeg5335https://vitela.javerianacali.edu.co/bitstreams/4419df09-910d-4553-bea8-d85c7ff61b55/download25d2bb9bbc8efcda074e5848ba7269efMD5911522/2856oai:vitela.javerianacali.edu.co:11522/28562024-06-25 05:15:39.889https://creativecommons.org/licenses/by-nc-nd/4.0/restrictedhttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=